Use world group to broadcast metadata on ROCm

Partially reverts [Core][Distributed] use cpu group to broadcast metadata in cpu (vllm-project/vllm#4444)
shaojiewang · Jun 4, 2024 · 4ec4c7c · 4ec4c7c
1 parent ba6b2d3
commit 4ec4c7c
Showing 1 changed file with 5 additions and 1 deletion.
diff --git a/vllm/distributed/communication_op.py b/vllm/distributed/communication_op.py
@@ -12,6 +12,7 @@
                              get_tensor_model_parallel_world_size,
                              get_tp_ca_communicator,
                              get_tp_pynccl_communicator)
+from vllm.utils import is_hip
 
 
 @dataclass
@@ -251,7 +252,10 @@ def broadcast_tensor_dict(
         return tensor_dict
 
     group = group or torch.distributed.group.WORLD
-    metadata_group = metadata_group or get_cpu_world_group()
+    if is_hip():
+        metadata_group = metadata_group or torch.distributed.group.WORLD
+    else:
+        metadata_group = metadata_group or get_cpu_world_group()
     ranks = torch.distributed.get_process_group_ranks(group)
     assert src in ranks, f"Invalid src rank ({src})"