张辉
开通时间:..
最后更新时间:..
异构分布式系统下 AI 大模型训练与推理优化研究,面向多芯片、多节点、多架构算力集群,针对大模型参数量大、计算密集、通信瓶颈等问题,重点开展分布式并行策略、异构资源调度、内存高效利用、通信计算重叠及推理时延优化等工作。通过算法与系统协同设计,实现模型在 GPU、NPU、CPU 等异构硬件上的高效部署,提升训练吞吐与推理性能,为大规模大模型在分布式异构环境下的实用化落地提供关键技术支撑。