mlc-ai · BBuf · Oct 27, 2023 · Oct 27, 2023 · Oct 29, 2023 · Nov 1, 2023
diff --git a/3rdparty/tokenizers-cpp b/3rdparty/tokenizers-cpp
diff --git a/cpp/conv_templates.cc b/cpp/conv_templates.cc
@@ -635,6 +635,7 @@ Conversation Conversation::FromTemplate(const std::string& name) {
       {"redpajama_chat", RedPajamaChat},
       {"rwkv_world", RWKVWorld},
       {"rwkv", RWKV},
+      {"rwkv5", RWKVWorld},
       {"gorilla", Gorilla},
       {"guanaco", Guanaco},
       {"dolly", Dolly},

diff --git a/cpp/llm_chat.cc b/cpp/llm_chat.cc
@@ -615,7 +615,7 @@ class LLMChat {
     std::vector<int32_t> encoded = this->tokenizer_->Encode(all_prompt);
     tokens.insert(tokens.end(), encoded.begin(), encoded.end());
     if (this->sliding_window_ != -1 ||  // There is no max window size if we use sliding window
-        this->total_seq_len_ + tokens.size() + gen_mean_gen_len < this->max_window_size_) {
+        this->total_seq_len_ + (int)tokens.size() + gen_mean_gen_len < this->max_window_size_) {
       return tokens;
     }
     // need shift window and re-encode

diff --git a/mlc_llm/core.py b/mlc_llm/core.py
@@ -22,6 +22,7 @@
     mistral,
     param_manager,
     rwkv,
+    rwkv5,
     stablelm_3b,
 )
 from mlc_llm.relax_model.commons import (
@@ -805,6 +806,7 @@ def build_model_from_args(args: argparse.Namespace):
             "gptj": gptj,
             "rwkv": rwkv,
             "rwkv_world": rwkv,
+            "rwkv5": rwkv5,
             "chatglm": chatglm,
         }
 
@@ -870,16 +872,16 @@ def build_model_from_args(args: argparse.Namespace):
 
             if args.model_category != "minigpt":
                 utils.copy_tokenizer(args)
-            if args.model_category == "rwkv" or args.model_category == "rwkv_world":
+            if args.model_category == "rwkv" or args.model_category == "rwkv_world" or args.model_category == "rwkv5":
                 # TODO: refactor config into model definition
                 dump_mlc_chat_config(
                     args,
                     vocab_size=config["vocab_size"],
                     max_window_size=model_config.max_sequence_length,
                     max_gen_len=model_config.max_sequence_length,
-                    top_p=0.6,
-                    temperature=1.2,
-                    repetition_penalty=0.996,
+                    top_p=0.3,
+                    temperature=1.0,
+                    repetition_penalty=1.0,
                     rwkv_world=True,
                 )
             elif args.model_category == "chatglm":

diff --git a/mlc_llm/dispatch/dispatch_tir_operator.py b/mlc_llm/dispatch/dispatch_tir_operator.py
@@ -21,6 +21,9 @@ def __init__(self, model: str):
 
         elif model == "rwkv":
             lookup = None
+
+        elif model == "rwkv5":
+            lookup = None
 
         elif model == "rwkv_world":
             lookup = None
+28 −2		include/rwkv_world_tokenizer.h
+3 −6		rust/src/lib.rs
+57 −17		src/rwkv_world_tokenizer.cc