7 months ago · fd1ce09581
--- a/aphrodite/distributed/device_communicators/pynccl.py
+++ b/aphrodite/distributed/device_communicators/pynccl.py
@@ -226,6 +226,7 @@ class NCCLCommunicator:
 
				         assert dist.get_backend(group) != dist.Backend.NCCL, (
			
 
				             "NCCLCommunicator should be attached to a non-NCCL group.")
			
 
				         self.group = group
			
 
				+        # NOTE: this rank is the rank in the group
			
 
				         self.rank = dist.get_rank(group)
			
 
				         self.world_size = dist.get_world_size(group)
			
 
				         if self.rank == 0:
			
@@ -233,7 +234,9 @@ class NCCLCommunicator:
 
				         else:
			
 
				             self.unique_id = NcclUniqueId()
			
 
				         tensor = torch.ByteTensor(list(self.unique_id.internal))
			
 
				-        dist.broadcast(tensor, src=0, group=group)
			
 
				+        ranks = dist.get_process_group_ranks(group)
			
 
				+        # arg `src` in `broadcast` is the global rank
			
 
				+        dist.broadcast(tensor, src=ranks[0], group=group)
			
 
				         byte_list = tensor.tolist()
			
 
				         for i, byte in enumerate(byte_list):
			
 
				             self.unique_id.internal[i] = byte
			
--- a/aphrodite/executor/distributed_gpu_executor.py
+++ b/aphrodite/executor/distributed_gpu_executor.py
@@ -39,8 +39,8 @@ class DistributedGPUExecutor(GPUExecutor):
 
				         # NOTE: We log here to avoid multiple logs when number of workers is
			
 
				         # greater than one. We could log in the engine, but not all executors
			
 
				         # have GPUs.
			
 
				-        logger.info("# GPU blocks: %d, # CPU blocks: %d", num_gpu_blocks,
			
 
				-                    num_cpu_blocks)
			
 
				+        logger.info(f"# GPU blocks: {num_gpu_blocks}, "
			
 
				+                    f"# CPU blocks: {num_cpu_blocks}")
			
 
				         logger.info(
			
 
				             f"Minimum concurrency: {num_gpu_blocks * self.cache_config.block_size / self.scheduler_config.max_model_len:.2f}x"  # noqa: E501
			
 
				         )