康奇宇
开通时间:..
最后更新时间:..
康奇宇,中科大信息学院6系特任教授,博士生导师,国家青年人才。
研究方向:多模态大模型、智能体、物理信息神经网络、大模型轻量化
具体包括:
一、物理信息驱动的世界模型:
由第一性原理推导而来的常/偏微分方程,凝练了人类对物理世界的深刻认知;而当前以数据驱动为主的大模型,对物理机理的整合能力仍较为薄弱。如何将物理先验作为硬约束深度融入世界模型,是该领域亟待突破的核心问题。本方向重点研究:
物理先验与大模型深度融合:探索将守恒律、对称性等物理约束嵌入大模型训练与推理流程的有效机制,构建物理一致性更强、外推能力更优的世界模型。
微分方程启发的网络架构设计:状态空间模型已取得初步进展,进一步利用微分方程精确刻画神经网络的动力学行为,有望显著提升模型结构的合理性与泛化性能。
机器学习增强科学计算:发展求解高维偏微分方程的神经网络方法,加速流体力学等复杂场景的数值模拟;结合动力系统稳定性理论,提升气候预测、材料微结构逆向设计等应用中的长期预测能力与可靠性。
二、大模型高效计算:
随着万亿参数大模型日趋普及,其计算挑战也愈加严峻:千卡级GPU集群的训练能耗已堪比数百户家庭的年用电量,经济与环境成本逐步逼近不可持续的边界;实时应用对低延迟的需求与庞大参数量之间存在根本性矛盾;模型难以部署于移动终端与边缘设备,制约了AI技术的普惠化进程。针对上述瓶颈,本方向重点探索:
大模型量化与知识蒸馏:在保持模型性能的前提下,显著压缩参数规模与计算开销。
高效CUDA算子及国产化算子设计:从底层算子层面挖掘硬件计算潜力,支撑国产芯片软硬件生态。
高效二值化脉冲神经网络:借鉴神经科学机制,发展超低能耗的新型计算范式。
三、医疗与类脑基础大模型:
面向生命健康与脑启发认知计算,构建融合多模态数据的垂直领域基础大模型:
类脑机制与数字脑演化:探索自组织数字脑的演化机制,借鉴生物神经元的动力学特性,构建具备强泛化与低能耗特征的类脑大模型。
医疗影像与计算医学:融合医学影像与血管血流动力学建模,研发面向辅助诊断与物理参数反演的医疗基础大模型,提升临床诊疗的精度与效率。
[1]
2015.8 -- 2020.3
南洋理工大学
 博士研究生毕业
[2]
2011.9 -- 2015.7
中国科学技术大学
 本科
[1]
2024.12 -- 至今
中国科学技术大学
信息科学技术学院
博导
[2]
2020.3 -- 2024.11
南洋理工大学
博士后研究员