volcengine · wuxibin89 · Jul 30, 2025 · Jul 24, 2025 · Jul 24, 2025 · Jul 25, 2025
diff --git a/verl/utils/dataset/rl_dataset.py b/verl/utils/dataset/rl_dataset.py
@@ -60,7 +60,8 @@ def collate_fn(data_list: list[dict]) -> dict:
         tensors[key] = torch.stack(val, dim=0)
 
     for key, val in non_tensors.items():
-        non_tensors[key] = np.array(val, dtype=object)
+        non_tensors[key] = np.empty(len(val), dtype=object)
+        non_tensors[key][:] = val
 
     return {**tensors, **non_tensors}