My MySQL Async - Search News

optimizer_step_offload.py

This saves ~32-64 GB during forward/backward at the cost of ~1-2s per step for CPU↔GPU transfers (negligible vs 30s+ training time). Activate by setting policy.offload_optimizer_for_logprob: true in ...

GitHub

vllm_dp_rank_prefix_fix.py

rank_prefix_list = list(range(0, total_workers, workers_per_group)) With multi-node TP=8 DP=2: - total_workers = 2 Ray actors (1 per DP group, each managing 8 TP ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

optimizer_step_offload.py

vllm_dp_rank_prefix_fix.py

Trending now