中国科学技术大学康奇宇--中文主页--首页

康奇宇

特任教授
电子邮箱：
学历：研究生(博士)毕业
办公地点：A508
学位：博士

访问量：

开通时间：..

最后更新时间：..

个人简介

康奇宇，中科大信息学院6系特任教授，博士生导师，国家青年人才。

研究方向：多模态大模型、智能体、物理信息神经网络、大模型轻量化

具体包括：

一、物理信息驱动的世界模型：

微分方程是刻画物理世界基本规律的重要数学语言，凝聚了人类对自然规律的系统理解。当前以数据驱动为主的大模型对物理机理、因果结构和长期动力学规律的整合能力仍较为薄弱。如何将物理先验作为硬约束深度融入世界模型，是该领域亟待突破的核心问题。本方向重点研究:

物理先验与大模型深度融合：探索将守恒律、对称性等物理约束嵌入大模型训练与推理流程的有效机制，构建物理一致性更强、外推能力更优的世界模型。
微分方程启发的网络架构设计：状态空间模型已取得初步进展，进一步利用微分方程精确刻画神经网络的动力学行为，有望显著提升模型结构的合理性与泛化性能。
机器学习增强科学计算：发展求解高维偏微分方程的神经网络方法，加速流体力学等复杂场景的数值模拟；结合动力系统稳定性理论，提升气候预测、材料微结构逆向设计等应用中的长期预测能力与可靠性。

二、大模型高效计算:

随着大模型参数规模不断增长，其训练与推理成本迅速攀升。万亿参数模型通常依赖大规模 GPU 集群，带来高昂的经济成本和能源消耗；同时，实时交互、边缘部署和移动端应用又对低延迟、低功耗和高吞吐提出了更高要求。如何在保持模型能力的同时显著降低计算和存储开销，是推动大模型走向普惠化应用的关键问题。本方向重点研究:

大模型量化与知识蒸馏：研究低比特量化、结构压缩、知识蒸馏和高效微调方法，在尽量保持模型性能的前提下，显著降低参数规模、显存占用和推理成本。
数值解算大模型加速方法：借鉴数值分析、微分方程求解和动力系统离散化方法，探索大模型训练与推理过程中的加速机制，提升模型计算效率与稳定性。
高效CUDA算子及国产化算子设计：从底层算子和硬件执行机制出发，设计高性能 CUDA 算子与国产芯片适配算子，挖掘硬件计算潜力，支撑高效大模型训练、推理和部署。
高效二值化脉冲神经网络：借鉴神经科学中的脉冲编码与事件驱动计算机制，发展低功耗、稀疏激活和二值化表示的新型神经网络架构，为超低能耗智能计算提供新的技术路径。

三、医疗与类脑基础大模型：

面向生命健康、脑科学与类脑智能，本方向研究融合多模态数据、物理机制和神经动力学约束的垂直领域基础大模型，推动人工智能在医学诊疗、脑功能解析和类脑计算中的应用。本方向重点研究:

数字孪生脑与类脑计算：以真实神经元连接组为结构约束，以神经活动数据为基础，研究具有长程耦合和长时记忆依赖的时空神经动力学建模方法。进一步发展可微分仿真、参数辨识和神经动力系统分析技术，探索大脑智能产生机制，并由此启发新型类脑计算网络架构及训练方法。
医疗影像与计算医学：融合医学影像、多模态临床数据与血管血流动力学建模，研发面向辅助诊断、疾病评估和物理参数反演的医疗基础大模型，提升临床诊疗的智能化、精准化和可解释性。

教育经历

[1] 2015.8 -- 2020.3
南洋理工大学博士研究生毕业

[2] 2011.9 -- 2015.7
中国科学技术大学本科

工作经历

[1] 2024.12 -- 至今
中国科学技术大学信息科学技术学院博导

[2] 2020.3 -- 2024.11
南洋理工大学博士后研究员