pytorch · janeyx99 · Sep 16, 2024 · Sep 12, 2024 · Sep 16, 2024 · Sep 16, 2024
diff --git a/test/dtypes/test_nf4.py b/test/dtypes/test_nf4.py
@@ -20,6 +20,7 @@
     run_tests,
 )
 from torchao.dtypes.nf4tensor import (
+    NF4Tensor,
     linear_nf4,
     to_nf4,
     _INNER_TENSOR_NAMES_FOR_SHARDING,
@@ -270,6 +271,14 @@ def test_chunk_size_equivalence(self, dtype: torch.dtype, shape, chunk_size):
 
         torch.testing.assert_close(nf4_patched.quantized_data, nf4_base.quantized_data)
 
+    @parametrize("input_size", [(512 * 512,), (512, 512)])
+    def test_empty_like(self, input_size: Union[Tuple[int], int]):
+        nf4_tensor = to_nf4(torch.rand(input_size))
+        new_tensor = torch.empty_like(nf4_tensor, device=torch.device("cpu"))
+        self.assertTrue(isinstance(new_tensor, NF4Tensor))
+        self.assertEqual(new_tensor.get_device(), -1)  # that it's on CPU
+        self.assertEqual(new_tensor.size(), nf4_tensor.size())
+
 
 class TestFSDPOps(TestCase):
     @parametrize("input_size", [512 * 512, (512 * 512,), (512, 512)])

diff --git a/torchao/dtypes/nf4tensor.py b/torchao/dtypes/nf4tensor.py
@@ -156,6 +156,7 @@ def clone(func, *args, **kwargs):
 @implements(
     [
         aten.detach.default,
+        aten.empty_like.default,
     ]
 )
 def nf4_detach(aten_op, args, kwargs=None):