个人信息Personal Information
特任研究员
博士生导师
教师拼音名称:Hu Wei
电子邮箱:
学历:研究生(博士后)
办公地点:中国科学技术大学东区物质科研楼B1405室
学位:博士
学科:化学
物理学
数学
计算机科学与技术
研究方向
第一性原理高性能计算软件开发
课题组发展了多款针对凝聚相复杂大体系的密度泛函理论高性能计算软件,其中包括:自主研发的线性标度计算软件HONPAS,在国产天河超级计算机上,实现了大规模杂化泛函低标度高性能并行计算;针对复杂超大体系的高性能并行计算软件DGDFT,在美国Edison和Cori超级计算机,以及国产神威•太湖之光和海洋之光超级计算机上,实现了针对超百万原子体系的(2,508,800原子)、平面波精度的、超大规模(614,400进程/39,936,000核心)高性能并行计算;针对平面波基组的基态杂化泛函计算和激发态低标度电子结构计算软件PWDFT(4,096原子/24,576 CPU核)以及教学科研科普软件KSSOLV(支持四种解释性语言:MATLAB、Octave、Python和国产北太天元)。
开发低标度高性能并行计算软件DGDFT:开发了基于自适应局域基组的超大规模并行计算软件DGDFT[J. Chem. Phys. 143, 124110 (2015); Phys. Chem. Chem. Phys. 17, 31397 (2015); J. Chem. Phys. 145, 154101 (2016); Sci. Bull. 66, 111(2021); International Conference for High Performance Computing, Networking, Storage and Analysis (SC22), ACM Gordon Bell finalist (2022)]。DGDFT利用全新的自适应局域基组(ALB)的正交局域完备性质,形成三对角块状稀疏哈密顿量矩阵,可以系统性地提高计算精度(媲美平面波)。而且,DGDFT基于多级MPI并行计算策略,具有高度可扩展性。在常规X86类型的超级计算机(美国Edison和Cori超级计算机)上使用128,000个CPU核时(磷烯14,000原子)依然保持高达80%的并行效率。在中国神威•太湖之光超级计算机上,DGDFT结合SW26010处理器的主从核多线程异构并行特性,扩展性高达8,519,680个从核(131,072核组,金属石墨烯11,520原子),依然保持32%的并行效率。尤其是在新一代神威•海洋之光超级计算机上使用39,936,000从核(614,400核组,并行效率59%),实现了250万原子复杂金属异质结(锂钠金属合金)的超大规模材料电子结构模拟,突破了微观尺度进而达到了介观尺度(>100纳米)范围,可用于设计新一代电子晶体管。
开发平面波基态杂化泛函和激发态电子结构计算软件PWDFT:在自主开发的平面波密度泛函理论PWDFT软件中实现了ISDF、ACE和PCDIIS等高精度低秩分解算法,通过多层次CPU-MPI/OpenMP和GPU-CUDA高性能异构并行计算,可以准确地计算数千原子凝聚相复杂体系的电子结构性质,并大大降低基态杂化泛函和激发态电子结构的计算时间。这些算法都是适用于金属和半导体的普适性算法,且具有较高精度。设计了针对这些算法的多级MPI并行化计算框架,具有高度可扩展性,在超级计算机上使用8,000个CPU核运行时,依然保持非常高的并行效率(图5)。同时,PWDFT还可以快速和准确地计算数千原子周期性固体材料的激发态电子结构性质[Electron. Struct. 3, 024004 (2021); IEEE International Conference HPCC 20653960 (2021); International Conference on Parallel Processing (ICPP 2022)]。设计了针对高计算复杂度的激发态电子结构计算的多级MPI和OpenMP异构并行计算框架,具有高度可扩展性,在超级计算机上使用24,576个CPU核运行时,模拟4,096原子周期性硅纳米体系的平面波基组激发态LR-TDDFT电子结构性质(包含16,384个激发态),仅需要3分钟(由于体系太大,其它平面波软件由于内存不足模拟失败)。
开发第一性原理线性标度计算软件包HONPAS:HONPAS是杨金龙院士课题组自主开发的线性标度计算软件。课题组主要发展数值原子轨道基组下的低标度杂化泛函计算方法和高性能计算方法,提出了基于数值原子轨道基组的ISDF + Kmeans算法,实现了分子体系和凝聚相体系的低标度杂化泛函电子结构计算[J. Phys. Chem. A 124, 5664 (2020); J. Phys. Chem. A 124, 10066 (2020)],同时在国产天河超级计算机上实现了大规模杂化泛函电子结构线性标度计算[Int. J. High Perform. Comput. Appl. 34,159 (2019); Front. Chem. 8 (2020)],解决了稀疏矩阵计算在国产超级计算机上异构并行计算的难题。