Login 中文
  • 康奇宇
  • Dr
 

Educational Experience

  • 2015.82020.3

     南洋理工大学   With Certificate of Graduation for Doctorate Study 

  • 2011.92015.7

     中国科学技术大学   本科 

Work Experience

  • 2024.12Now

    中国科学技术大学      信息科学技术学院    博导

  • 2020.32024.11

    南洋理工大学      博士后研究员

 

Profile

康奇宇,中科大信息学院6系特任教授,博士生导师,国家青年人才。

研究方向:多模态大模型、智能体、物理信息神经网络、大模型轻量化

具体包括:



一、物理信息驱动的世界模型:

由第一性原理推导而来的常/偏微分方程,凝练了人类对物理世界的深刻认知;而当前以数据驱动为主的大模型,对物理机理的整合能力仍较为薄弱。如何将物理先验作为硬约束深度融入世界模型,是该领域亟待突破的核心问题。本方向重点研究:

  1. 物理先验与大模型深度融合:探索将守恒律、对称性等物理约束嵌入大模型训练与推理流程的有效机制,构建物理一致性更强、外推能力更优的世界模型。

  2. 微分方程启发的网络架构设计:状态空间模型已取得初步进展,进一步利用微分方程精确刻画神经网络的动力学行为,有望显著提升模型结构的合理性与泛化性能。

  3. 机器学习增强科学计算:发展求解高维偏微分方程的神经网络方法,加速流体力学等复杂场景的数值模拟;结合动力系统稳定性理论,提升气候预测、材料微结构逆向设计等应用中的长期预测能力与可靠性。



二、大模型高效计算:

随着万亿参数大模型日趋普及,其计算挑战也愈加严峻:千卡级GPU集群的训练能耗已堪比数百户家庭的年用电量,经济与环境成本逐步逼近不可持续的边界;实时应用对低延迟的需求与庞大参数量之间存在根本性矛盾;模型难以部署于移动终端与边缘设备,制约了AI技术的普惠化进程。针对上述瓶颈,本方向重点探索:

  1. 大模型量化与知识蒸馏:在保持模型性能的前提下,显著压缩参数规模与计算开销。

  2. 高效CUDA算子及国产化算子设计:从底层算子层面挖掘硬件计算潜力,支撑国产芯片软硬件生态。

  3. 高效二值化脉冲神经网络:借鉴神经科学机制,发展超低能耗的新型计算范式。



三、医疗与类脑基础大模型

面向生命健康与脑启发认知计算,构建融合多模态数据的垂直领域基础大模型:

  1. 类脑机制与数字脑演化:探索自组织数字脑的演化机制,借鉴生物神经元的动力学特性,构建具备强泛化与低能耗特征的类脑大模型。

  2. 医疗影像与计算医学:融合医学影像与血管血流动力学建模,研发面向辅助诊断与物理参数反演的医疗基础大模型,提升临床诊疗的精度与效率。


Personal Information

  • Special Professor

  • E-Mail:
  • Education Level:Postgraduate (Doctoral)
  • Business Address:A508
Copyright © 2013 University of Science and Technology of China. Click:
  MOBILE Version

The Last Update Time:..