[jax-inference-offloading] consolidate definitions for default tensor dtype #1816

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open

yhtang wants to merge 6 commits into main from yhtang/jio-default-dtype

jax-inference-offloading/jax_inference_offloading/api/param_mapping.proto

-Original file line number
+Diff line change
@@ Expand Up / @@ -82,4 +82,4 @@ message ParamMapping { @@
     message TpModelMappingSpecs {
       repeated ParamMapping mappings = 1;
-    }
+    }

jax-inference-offloading/jax_inference_offloading/models/__init__.py

-Original file line number
+Diff line change
@@ Expand Up @@
     def make_mapping(
-      jax_name, vllm_name, vllm_shape, *, transform=None, jax_prefix="model", vllm_prefix="model"
+      jax_name, vllm_name, vllm_shape, *, transform=None, jax_prefix="model", vllm_prefix="model", dtype="bfloat16"
     ):
       result = mapping.ParamMapping()
       result.vllm_param.name = f"{vllm_prefix}.{vllm_name}".lstrip(".")
       result.vllm_param.shape.extend(vllm_shape)
+      result.vllm_param.dtype = dtype
       result.jax_param.name = f"{jax_prefix}.{jax_name}".lstrip(".")
       if transform is not None:
         result.jax_param.transform.CopyFrom(transform)
@@ Expand All @@
       nnx_state = nnx.state(nnx_model, *filters)
       return flatten_state(nnx_state, prefix=prefix)

jax-inference-offloading/jax_inference_offloading/vllm/extension.py

            
                      Original file line number
                      Diff line number
                      Diff line change
                  
    @@ -187,7 +187,7 @@ def update_weights(self, mapping_specs: TpModelMappingSpecs):
  
            logger.debug(f'vLLM TP rank {tp_rank} receiving {param.vllm_param.name} ...')

            weight = self.transport.gather(

              shape, param.vllm_param.dtype or 'bfloat16',

              shape, param.vllm_param.dtype,

              sharding_specs.aux_dim, sharding_specs.aux_parallelism

            )

            logger.debug(f'vLLM TP rank {tp_rank} received {param.vllm_param.name} shape {weight.shape}')

    @@ -206,7 +206,7 @@ def update_weights(self, mapping_specs: TpModelMappingSpecs):
  
            logger.debug(f"vLLM expecting: {param.vllm_param.name} shape {shape.tolist()} raw specs {param}")

            weight = self.transport.recv(shape, param.vllm_param.dtype or 'bfloat16')

            weight = self.transport.recv(shape, param.vllm_param.dtype)

            self._staged_weights.append((param.vllm_param.name, weight))

            # TODO: make it optional

    @@ -235,7 +235,7 @@ def update_weights_grouped(self, mapping_specs: TpModelMappingSpecs):
  
            param_specs.append((

              shape,

              param.vllm_param.dtype or 'bfloat16',

              param.vllm_param.dtype,

              sharding_specs.aux_dim,

              sharding_specs.aux_parallelism

            ))

    @@ -264,7 +264,7 @@ def update_weights_grouped(self, mapping_specs: TpModelMappingSpecs):
  
            if sharding_specs.parallelism > 0:

              shape[sharding_specs.dim] //= sharding_specs.parallelism

            param_specs.append((shape, param.vllm_param.dtype or 'bfloat16'))

            param_specs.append((shape, param.vllm_param.dtype))

            param_names.append(param.vllm_param.name)

          # Receive all weights in one grouped operation

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[jax-inference-offloading] consolidate definitions for default tensor dtype #1816

Uh oh!

Diff view

Diff view

There are no files selected for viewing

jreiffers Dec 11, 2025

Uh oh!

yhtang Dec 11, 2025 •

edited

Loading

Uh oh!

Uh oh!

[jax-inference-offloading] consolidate definitions for default tensor dtype #1816

Are you sure you want to change the base?

Uh oh!

[jax-inference-offloading] consolidate definitions for default tensor dtype #1816

Uh oh!

Uh oh!

Diff view

Diff view

There are no files selected for viewing

jreiffers Dec 11, 2025

Choose a reason for hiding this comment

Uh oh!

yhtang Dec 11, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

yhtang Dec 11, 2025 •

edited

Loading