pytorch · vfdev-5 · Mar 29, 2022 · Mar 29, 2022 · zou3519 · Mar 31, 2022
diff --git a/functorch/_src/monkey_patching.py b/functorch/_src/monkey_patching.py
@@ -98,3 +98,34 @@ def _backward(*args, **kwargs):
 
 
 setattr(torch.Tensor, 'backward', _backward)
+
+
+# Monkeypatch .numpy() to fetch underlying tensor and call .numpy()
+_old_numpy = torch.Tensor.numpy
+
+
+@functools.wraps(_old_numpy)
+def _numpy(tensor):
+    level = _C.maybe_get_level(tensor)
+    if level == -1:
+        return _old_numpy(tensor)
+
+    if _C.is_functionaltensor(tensor):
+        # Since we're unwrapping the FunctionalTensorWrapper, we need to make sure
+        # that it's up to date first
+        torch._sync(tensor)
+
+    value = _C.get_unwrapped(tensor)
+    dl_enabled = _C.tls_set_is_included()
+    try:
+        # Disable temporarily kDynamicLayerFrontModeKey/kDynamicLayerBackModeKey as included dispatch keys
+        if (dl_enabled):
+            _C._set_dynamic_layer_keys_included(False)
+        return value.numpy()
+    finally:
+        # Reenable kDynamicLayerFrontModeKey/kDynamicLayerBackModeKey as included dispatch keys
+        if (dl_enabled):
+            _C._set_dynamic_layer_keys_included(True)
+
+
+setattr(torch.Tensor, 'numpy', _numpy)
diff --git a/test/test_eager_transforms.py b/test/test_eager_transforms.py
@@ -863,6 +863,38 @@ def foo(t):
                 expected = expected.replace("\n", "").replace("  ", "")
                 self.assertEqual(expected, buf)
 
+    @parametrize("op_list_data", [
+        subtest(([vmap, ], [(4, 2), (64, 3, 32, 32)]), name='vmap'),
+        subtest(([vmap, vmap], [(4, 3, 2), (64, 3, 32, 32)]), name='vmap_vmap'),
+        subtest(([grad, ], [(0, ), [], (4, 2), (64, 3, 32, 32)]), name='grad'),
+        subtest(([grad, grad], [[], ]), name='grad_grad'),
+        subtest(([vmap, grad], [(4, 2)]), name='vmap_grad'),
+    ])
+    def test_tensor_numpy(self, device, op_list_data):
+
+        op_list, shapes = op_list_data
+
+        for dt in [torch.float32, torch.float64]:
+            data = [torch.randn(s, dtype=dt, device=device) for s in shapes]
+
+            for x in data:
+
+                def foo(t):
+                    n = t.detach().cpu().numpy()
+                    assert n.shape == x.shape
+                    return t.mean()
+
+                fn = foo
+                bdim = 0
+                for op in reversed(op_list):
+                    if op == vmap:
+                        fn = op(fn, in_dims=bdim)
+                        bdim += 1
+                    else:
+                        fn = op(fn)
+
+                fn(x)
+
     def test_no_grad_outside(self, device):
         x = torch.randn([], device=device, requires_grad=True)
         with torch.no_grad():