• 其他栏目

    康奇宇

    • 特任教授
    • 电子邮箱:
    • 学历:研究生(博士)毕业
    • 办公地点:A508
    • 学位:博士

    访问量:

    开通时间:..

    最后更新时间:..

    个人简介

    康奇宇,中科大信息学院6系特任教授,博士生导师,国家青年人才。

    研究方向:多模态大模型、智能体、物理信息神经网络、大模型轻量化

    具体包括:


    一、物理信息驱动的世界模型:

    微分方程是刻画物理世界基本规律的重要数学语言,凝聚了人类对自然规律的系统理解。当前以数据驱动为主的大模型对物理机理、因果结构和长期动力学规律的整合能力仍较为薄弱。如何将物理先验作为硬约束深度融入世界模型,是该领域亟待突破的核心问题。本方向重点研究:

    • 物理先验与大模型深度融合:探索将守恒律、对称性等物理约束嵌入大模型训练与推理流程的有效机制,构建物理一致性更强、外推能力更优的世界模型。

    • 微分方程启发的网络架构设计:状态空间模型已取得初步进展,进一步利用微分方程精确刻画神经网络的动力学行为,有望显著提升模型结构的合理性与泛化性能。

    • 机器学习增强科学计算:发展求解高维偏微分方程的神经网络方法,加速流体力学等复杂场景的数值模拟;结合动力系统稳定性理论,提升气候预测、材料微结构逆向设计等应用中的长期预测能力与可靠性。


    二、大模型高效计算:

    随着大模型参数规模不断增长,其训练与推理成本迅速攀升。万亿参数模型通常依赖大规模 GPU 集群,带来高昂的经济成本和能源消耗;同时,实时交互、边缘部署和移动端应用又对低延迟、低功耗和高吞吐提出了更高要求。如何在保持模型能力的同时显著降低计算和存储开销,是推动大模型走向普惠化应用的关键问题。本方向重点研究:

    • 大模型量化与知识蒸馏:研究低比特量化、结构压缩、知识蒸馏和高效微调方法,在尽量保持模型性能的前提下,显著降低参数规模、显存占用和推理成本。

    • 数值解算大模型加速方法:借鉴数值分析、微分方程求解和动力系统离散化方法,探索大模型训练与推理过程中的加速机制,提升模型计算效率与稳定性。

    • 高效CUDA算子及国产化算子设计:从底层算子和硬件执行机制出发,设计高性能 CUDA 算子与国产芯片适配算子,挖掘硬件计算潜力,支撑高效大模型训练、推理和部署。

    • 高效二值化脉冲神经网络:借鉴神经科学中的脉冲编码与事件驱动计算机制,发展低功耗、稀疏激活和二值化表示的新型神经网络架构,为超低能耗智能计算提供新的技术路径。


    三、医疗与类脑基础大模型

    面向生命健康、脑科学与类脑智能,本方向研究融合多模态数据、物理机制和神经动力学约束的垂直领域基础大模型,推动人工智能在医学诊疗、脑功能解析和类脑计算中的应用。本方向重点研究:

    • 数字孪生脑与类脑计算:以真实神经元连接组为结构约束,以神经活动数据为基础,研究具有长程耦合和长时记忆依赖的时空神经动力学建模方法。进一步发展可微分仿真、参数辨识和神经动力系统分析技术,探索大脑智能产生机制,并由此启发新型类脑计算网络架构及训练方法。

    • 医疗影像与计算医学:融合医学影像、多模态临床数据与血管血流动力学建模,研发面向辅助诊断、疾病评估和物理参数反演的医疗基础大模型,提升临床诊疗的智能化、精准化和可解释性。





    教育经历

    [1] 2015.8 -- 2020.3
    南洋理工大学       博士研究生毕业

    [2] 2011.9 -- 2015.7
    中国科学技术大学       本科

    工作经历

    [1] 2024.12 -- 至今
    中国科学技术大学      信息科学技术学院      博导

    [2] 2020.3 -- 2024.11
    南洋理工大学      博士后研究员