我國(guó)科研團(tuán)隊(duì)實(shí)現(xiàn)億原子級(jí)拉曼光譜量子力學(xué)模擬中國(guó)科學(xué)技術(shù)大學(xué)精準(zhǔn)智能化學(xué)重點(diǎn)實(shí)驗(yàn)室商紅慧教授、楊金龍教授團(tuán)隊(duì)與中國(guó)科學(xué)院計(jì)算技術(shù)研究所劉穎高級(jí)工程師,華東師范大學(xué)何曉教授等團(tuán)隊(duì)合作完成的研究成果“Pushing the Limit of Quantum Mechanical Simulation to the Raman Spectra of a Biological System with 100 Million Atoms”成功入圍2024年戈登·貝爾獎(jiǎng),這是2024年入圍該獎(jiǎng)的唯一中國(guó)團(tuán)隊(duì)成果,也是該團(tuán)隊(duì)繼2021年后再次入圍該獎(jiǎng)項(xiàng)。戈登·貝爾獎(jiǎng)是國(guó)際高性能計(jì)算應(yīng)用領(lǐng)域最高獎(jiǎng),由美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)頒發(fā),用于表彰世界范圍內(nèi)高性能計(jì)算的杰出成就,尤其是高性能計(jì)算應(yīng)用于科學(xué)、工程和大規(guī)模數(shù)據(jù)分析領(lǐng)域的創(chuàng)新工作,被稱為“超算領(lǐng)域的諾貝爾獎(jiǎng)”。此前,該成果也獲得了2024年中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)“中國(guó)超算年度最佳應(yīng)用獎(jiǎng)”。 拉曼光譜是研究生物分子結(jié)構(gòu)的重要工具,被廣泛應(yīng)用于藥物開發(fā)、疾病診斷等領(lǐng)域,然而,拉曼光譜量子模擬計(jì)算量巨大。此前的拉曼光譜量子模擬僅能處理數(shù)千原子的小體系,研究團(tuán)隊(duì)開發(fā)的QF-RAMAN程序突破了這一限制,首次實(shí)現(xiàn)了包含1億多原子的新冠病毒刺突蛋白在水溶液中的拉曼光譜量子模擬,與以往工作相比取得了4~5個(gè)數(shù)量級(jí)的提升。這一突破的實(shí)現(xiàn)得益于團(tuán)隊(duì)在算法設(shè)計(jì)和工程技術(shù)方面的多項(xiàng)創(chuàng)新。在傳統(tǒng)密度泛函理論(DFT)和密度泛函微擾理論(DFPT)計(jì)算中,計(jì)算量隨體系規(guī)模的增大呈現(xiàn)三次方增長(zhǎng),這使得計(jì)算通常只能局限于小型體系。針對(duì)以上問題,團(tuán)隊(duì)開發(fā)了將全電子全勢(shì)密度泛函微擾理論與量子分塊算法深度融合的新方法,將復(fù)雜生物分子分解為多個(gè)子系統(tǒng),顯著降低了計(jì)算復(fù)雜度。同時(shí)團(tuán)隊(duì)針對(duì)海量分塊計(jì)算的負(fù)載均衡難題,開發(fā)了分塊體量敏感的多級(jí)調(diào)度技術(shù),提高了海量分塊計(jì)算的并行可擴(kuò)展性;針對(duì)小規(guī)模運(yùn)算的異構(gòu)加速難題,設(shè)計(jì)了彈性任務(wù)卸載技術(shù),通過小規(guī)模運(yùn)算的靈活聚合,大幅提高異構(gòu)加速器的硬件利用率。此外,QF-RAMAN程序采用OpenCL通用異構(gòu)并行計(jì)算框架,能在不同硬件架構(gòu)(CPU、GPU、SW等)的超級(jí)計(jì)算機(jī)上,借助OpenCL編譯工具鏈(oneAPI、rocm、swcl等)實(shí)現(xiàn)跨平臺(tái)運(yùn)行。在最新一代神威超級(jí)計(jì)算機(jī)上,該程序利用96,000個(gè)計(jì)算節(jié)點(diǎn)(超過3,700萬個(gè)計(jì)算核心)實(shí)現(xiàn)了399.9 PFLOP/s的雙精度峰值性能;在東方超級(jí)計(jì)算機(jī)上,使用6,000個(gè)節(jié)點(diǎn)(24,000個(gè)GPU),程序也展現(xiàn)了85 PFLOP/s的優(yōu)異性能。在新一代神威超級(jí)計(jì)算機(jī)上取得了99%的弱可擴(kuò)展性測(cè)試結(jié)果,充分展示了該方法的高效性和可擴(kuò)展性。在此基礎(chǔ)上,團(tuán)隊(duì)提出了適用于億級(jí)原子體系的矩陣方程求解拉曼光譜的新算法,避免了直接對(duì)角化求解,為高精度拉曼光譜計(jì)算提供了全新方案,有效解決了大規(guī)模量子力學(xué)拉曼模擬中的關(guān)鍵技術(shù)難題。 這項(xiàng)研究表明,量子力學(xué)模擬可以擴(kuò)展到前所未有的規(guī)模,這也為理解復(fù)雜生物系統(tǒng)開辟了新途徑。以新冠病毒研究為例,該方法可以精確模擬刺突蛋白的結(jié)構(gòu)特征,為深入理解病毒感染機(jī)制提供了科學(xué)支撐,為藥物研發(fā)和疫苗設(shè)計(jì)貢獻(xiàn)了重要參考。這一方法還可推廣到其他重要生物分子的研究中,成為生物醫(yī)學(xué)研究領(lǐng)域強(qiáng)大的研究工具。此次技術(shù)突破不僅展示了中國(guó)在高性能計(jì)算和計(jì)算化學(xué)領(lǐng)域的領(lǐng)先地位,也為量子力學(xué)模擬的應(yīng)用場(chǎng)景探索了全新的可能。這一成果為高性能計(jì)算與科學(xué)研究的深度融合奠定了堅(jiān)實(shí)的技術(shù)基礎(chǔ),將推動(dòng)生物分子模擬研究進(jìn)入新階段。 相關(guān)鏈接: [1] Honghui Shang*, Ying Liu*, Zhikun Wu, Zhenchuan Chen, Jinfeng Liu, Meiyue Shao, Yingzhou Li, Bowen Kan, Huimin Cui, Xiaobing Feng, Yunquan Zhang, Donald G. Truhlar, Hong An, Xiao He*, and Jinlong Yang*. Pushing the limit of quantum mechanical simulation to the raman spectra of a biological system with 100 million atoms. InProceedings of the International Conference for High Performance Computing, Networking, Storage, and Analysis,SC '24(GB finalist).https://dl.acm.org/doi/10.1109/SC41406.2024.00011 [2]https://sc24.supercomputing.org/2024/10/presenting-the-finalists-for-the-2024-gordon-bell-prize/ [3] https://pichem.ustc.edu.cn/2024/1225/c34505a669757/page.htm |