sgl-project · zhyncs · Jul 29, 2025 · Jul 27, 2025 · Jul 27, 2025 · Jul 27, 2025
@@ -885,6 +885,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.w13_blockscale_swizzled = Parameter(
             w13_blockscale_swizzled, requires_grad=False
         )
+        del layer.w13_weight_scale
 
         # This is for quantization, so we need to invert it.
         layer.w13_input_scale_quant = Parameter(
@@ -920,6 +921,7 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         layer.w2_blockscale_swizzled = Parameter(
             w2_blockscale_swizzled, requires_grad=False
         )
+        del layer.w2_weight_scale
         layer.w2_weight = Parameter(layer.w2_weight.data, requires_grad=False)
 
         device = layer.w13_weight.device