最后更新时间:.. 访问量:
工程技术
当前位置: 中文主页 >> 工程技术

- 多层并行程序的作业运行参数优化方法,及其在作业调度系统中的应用 ( 2016 - 今 )
因高性能计算程序的并行开发愈发成熟,很多软件具有多层的并行任务分发逻辑,对应多个并行参数设置。通过调节决定任务分发的应用内部并行参数, 可以显著提高应用(如VASP、WRF)的计算速度。特别的,本工作方向中,考虑平衡计算速度与计算成本,新提出一种约化并行效率指标, 且通过提交可被抢断的试运行测试作业来充分利用集群中的临时空闲节点,以此得到目标作业的最佳运行参数。经部署该自动化运行优化工具, 并统计数千个真实的用户VASP作业,该工具可以为VASP作业提供约1.6-3.2倍加速,同时节省15%-35%计算机时。该工作于2021年申报一项专利, 并已收到多方合作与成果转化。

- 面向E级计算的第一性原理计算软件 ABACUS ( 2015.11 - 今 )
a) 为ABACUS软件(目前主要由中科大、北大、物理所合作开发)添加高精度新型赝势支持,优化并生成数千个原子基组文件,通过数万次DFT计算, 验证其计算精度达到国际先进水平。该领域的龙头软件VASP因在赝势与PAW基组两方面具有业内公认的领先地位,因而保持持续领先地位, 本工作使ABACUS在这方面具备了与VASP同台竞争的基础(精度与稳定性)。
b) 为ABACUS内置的FFT3D模块实施CUDA移植加速等开发,使计算与数据传输得到完全的掩藏,且数据传输速度达到接口速度极限。

- 正电子第一性原理计算软件的开发与应用( 2012 - 今 )
2012-2021年期间,基于QE软件(VASP的最常用开源替代软件)进行二次开发,用于模拟正电子在材料中的量子态,基于该软件获得如下成果:
a) 直接支持他人发表15篇SCI论文,其中五篇JACS文章将本软件计算结果图用做摘要亮点图片;
b) 以第一作者发表3篇SCI文章,澄清正电子计算中的若干关键问题,其中一篇CMS文章在2021年被MIT为第一单位的SCI文章进行重点介绍, 其Introduction部分第二段的全部论述均基于本文章的工作,单段落提及5次;
c) 2013年-2014年,作为唯一实施负责人完成中国工程物理研究院横向项目“氚化钛中氦泡参数的正电子湮没寿命谱计算”;
d) 2021年依托本工作与ABACUS软件,申报并获批一项青年科学基金项目“大体系原子结构中正电子湮没寿命的数值计算方法”。

- 正电子寿命谱大规模并行解谱程序PLTMCMC( 2015 - 2021 )
开发并优化面向正电子谱仪数据分析的大规模并行解谱算法程序PLTMCMC,该软件在国际上首次通过优化的马尔可夫链蒙特卡罗算法, 实现了谱空间的全局优化,解决了国际同类软件局域优化结果 不稳定、可靠性低的难题,该软件在1008核下的并行效率达90%, 基于相关算法工作,2019年与课题组合作发表一篇SCI论文。

- 宇宙演化程序HSPM在国产DCU平台上的移植开发 ( 2021.07 - 今 )
申请并获得首期光合基金A类项目支持,为校内宇宙学模拟HSPM软件针对国产DCU加速卡进行移植开发。通过OpenMP Offload技术与最新的数据操作API,为HSPM设计了针对国产异构加速平台的数据并行逻辑,发现并消除了原OpenMP版本中的计算负载不均的问题, 已完成计算占比60%的代码的移植工作。已优化的核心代码模块可以在仅使用1个加速卡的情况下相比同平台32核CPU下的运行速度具有5.4倍加速, 顺利通过中期评审答辩,继续得到光合基金的后续经费支持,预期计算占比90%的代码可以全部移植至加速卡中计算。


- 高性能区块链系统( 2020 - 今 )
为解决高校联盟链中的运行问题,基于高性能计算开发实践经验,设计了大规模可并行验证的智能区块链系统,合作申报一项专利技术,获得两次技术许可转化。该技术对区块链交易内部数据做裁剪与复用,使得子孙交易能够方便的引用当前上下文中的局部数据而不引起持续的数据膨胀, 进一步使得原本无法做循环迭代的区块链脚本通过可持续的子孙交易链具备循环迭代的能力,同时避免停机问题, 使UTXO区块链系统具备图灵完备的计算能力,同时不牺牲可大规模并行的无状态特性。

- 容器技术测试与验证 ( 2016 - 今 )
测试验证系统级容器(OpenVZ)应用在超算中心调度环境下的热迁移方法,探索对容器作业进行Checkpoint/Restore的完整流程, 总结其在超算调度中的应用可行性与前景;指导一名学生验证在超算集群环境下对Docker容器进行热迁移操作的可行性,帮助其完成硕士论文; 为Singularity容器测试可持久化的Overlay二层镜像构建方法并编写使用说明。

- 中科院先导A 地球大数据项目子课题:大数据云服务平台 ( 2019 - 2022
承担19-21年度每年的子课题任务申报与年度总结报告的书写,负责其中超算平台部分的运维开发工作, 并帮助学生针对大数据云平台部分进行优化与集成,与学生一起申报两项软件著作权。

- PWDFT软件测试与优化补丁( 2020.11 - 2021.03 )
帮助杨金龙-胡伟课题组的PWDFT软件测试其在A100-NVLink平台下并行效率、分析热点瓶颈,并为其CUDA代码提供显存优化补丁,使关键模块在同样的硬件下加速8-23倍,使程序整体加速1.4-2.2倍 。

- expM C/C++并行加速函数库( 2017 - 2018 )
开发基于MPI+OpenMP/CUDA的矩阵指数计算函数库expM,GPU版比OPENMP版加速5倍 。


附科学研究历史工作

- 暗能量宇宙学研究 ( 2010 - 2012 )
2010-2012期间,完成3篇宇宙学暗能量方向的SCI论文的数值计算工作。其中作为第一作者的一篇文章中,通过数值模拟, 研究了多个主流修改引力模型下的宇宙膨胀历史,并结合当前观测结果,进行模型验证与参数置信空间统计分析。