convert_hf_to_gguf: rwkv tokenizer: Don't escape sequences manually

MollySophia · MollySophia · commit 9ba8fb6c7854 · 2024-08-12T09:08:30.000+08:00
Signed-off-by: Molly Sophia &lt;mollysophia379@gmail.com&gt;
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -2723,9 +2723,7 @@ def set_vocab(self):
                 token = token.encode("utf-8") if isinstance(token, str) else token
                 assert isinstance(token, bytes)
                 assert len(token) == token_len
-                token_text: str = ""
-                for b in token:
-                    token_text += f"\\x{b:02x}"
+                token_text: str = str(token)[2:-1]
                 tokens.append(token_text.encode("utf-8"))
                 toktypes.append(gguf.TokenType.NORMAL)
         remainder = vocab_size - len(tokens)