• 其他栏目

    康奇宇

    • 特任教授
    • 电子邮箱:
    • 学历:研究生(博士)毕业
    • 办公地点:A508
    • 学位:博士

    访问量:

    开通时间:..

    最后更新时间:..

    个人简介

    康奇宇,中科大信息学院6系特任教授,博士生导师,国家青年人才。

    研究方向:多模态大模型、智能体、物理信息神经网络、大模型轻量化

    具体包括:



    一、物理信息驱动的世界模型:

    由第一性原理推导而来的常/偏微分方程,凝练了人类对物理世界的深刻认知;而当前以数据驱动为主的大模型,对物理机理的整合能力仍较为薄弱。如何将物理先验作为硬约束深度融入世界模型,是该领域亟待突破的核心问题。本方向重点研究:

    1. 物理先验与大模型深度融合:探索将守恒律、对称性等物理约束嵌入大模型训练与推理流程的有效机制,构建物理一致性更强、外推能力更优的世界模型。

    2. 微分方程启发的网络架构设计:状态空间模型已取得初步进展,进一步利用微分方程精确刻画神经网络的动力学行为,有望显著提升模型结构的合理性与泛化性能。

    3. 机器学习增强科学计算:发展求解高维偏微分方程的神经网络方法,加速流体力学等复杂场景的数值模拟;结合动力系统稳定性理论,提升气候预测、材料微结构逆向设计等应用中的长期预测能力与可靠性。



    二、大模型高效计算:

    随着万亿参数大模型日趋普及,其计算挑战也愈加严峻:千卡级GPU集群的训练能耗已堪比数百户家庭的年用电量,经济与环境成本逐步逼近不可持续的边界;实时应用对低延迟的需求与庞大参数量之间存在根本性矛盾;模型难以部署于移动终端与边缘设备,制约了AI技术的普惠化进程。针对上述瓶颈,本方向重点探索:

    1. 大模型量化与知识蒸馏:在保持模型性能的前提下,显著压缩参数规模与计算开销。

    2. 高效CUDA算子及国产化算子设计:从底层算子层面挖掘硬件计算潜力,支撑国产芯片软硬件生态。

    3. 高效二值化脉冲神经网络:借鉴神经科学机制,发展超低能耗的新型计算范式。



    三、医疗与类脑基础大模型

    面向生命健康与脑启发认知计算,构建融合多模态数据的垂直领域基础大模型:

    1. 类脑机制与数字脑演化:探索自组织数字脑的演化机制,借鉴生物神经元的动力学特性,构建具备强泛化与低能耗特征的类脑大模型。

    2. 医疗影像与计算医学:融合医学影像与血管血流动力学建模,研发面向辅助诊断与物理参数反演的医疗基础大模型,提升临床诊疗的精度与效率。


    教育经历

    [1] 2015.8 -- 2020.3
    南洋理工大学       博士研究生毕业

    [2] 2011.9 -- 2015.7
    中国科学技术大学       本科

    工作经历

    [1] 2024.12 -- 至今
    中国科学技术大学      信息科学技术学院      博导

    [2] 2020.3 -- 2024.11
    南洋理工大学      博士后研究员