
深圳商报·读创客户端首席记者吴吉买球下单平台
跟着国产AI DeepSeek崛起,“玄妙的东方力量”激勉了科技圈的升沉。而近日,一篇在《野心力学学报》上发表的最新探讨效果,将东说念主们的眼神再次引向了中国。科研团队开发的一种基于图形处理器(GPU)并行的快速近场能源学算法,只需使用开阔的家用GPU,即可收场性能的大幅升迁,为贬责传统野心力学算法的效率问题找到了新的标的。
该著述的第一完成单元是深圳北理莫斯科大学,作家为深圳北理莫斯科大学杨杨副西席、南边科技大学硕士探讨生苏梓鑫。1月31日,在继承深圳商报采访时,杨杨副西席深刻,这项效果的最大立异在于毋庸更换GPU,即可将野心遵守“最大化”,从而为工业软件的中枢时刻国产化保驾护航。
跨学科调解催生新灵感
近场能源学是一种灵验贬责断裂问题的措施。然则,其非局部表面使得野心进程较为耗时。并行野心是加快数值野心的灵验路线,主要分为基于中央处理器(CPU)的并行野心和GPU的并行野心。其中,GPU并行野心更妥当处理逻辑粗浅但野心量大的场景。
当今,基于GPU的近场能源学并行探讨,大多聚首在将串行措施改造为并行措施。许多优化计谋带来的加快效果主要依赖于GPU自身性能的升迁,而针对GPU硬件结构的优化相对较少。此外,GPU并行野心仍存在一些问题,举例在处理大范畴问题时“心过剩力不及”、内存带宽浪费、一些算法仅能处理均匀散播且未受损的遏止结构……
针对这种情况,科研团队探讨遐想了一个资本效益高且性能优异的近场能源学模拟框架。该分析框架能够以高效的野心速度准确模拟键基和态基近场能源常识题。该算法弃取了粒子并行现象,开发了一个通用的邻域生成模块用以优化存储,并建议了一种通用寄存器时刻,用于高速拜谒寄存器内存,减少全局内存拜谒。该时刻不仅摒除了对邻域点数目的欺压,还适用于材料点的非均匀散播,不错大大升迁野心的效率。
“这项探讨咱们花了轻率两年的时间,之是以能取得冲破,是因为咱们是一个交叉学科的团队”,杨杨说,她本人是探讨力学算法的,但团队里招收的硕士探讨生是探讨野神思领域的,“他关于野神思的架构很明晰。跨学科的调解与碰撞,使得咱们建议了一个全新的想路,也走出了不相通的路。”

通用寄存器优化算法暗示图
无需升级硬件,即可“榨干”算力
“野心效率升迁800倍”,这么的刻画出奇“握眼球”,有东说念主致使说AI与之比拟齐小巫见大巫。但杨杨严谨地强调:“不要将它与AI比拟,两者不在一个架构下,不具备可比性。”
杨杨深刻,经过科学测试,与现存基于串行措施和OpenMP并行的近场能源学算法措施比拟,该算法分手可收场高达800倍和100倍的加快。在典型的百万级粒子模拟中,奉行4000次迭代在单精度下可在5分钟内完成,在双精度下可在20分钟内完成,这在低端GPU PC上即可收场。这意味着,在处理复杂的材料遐想和毁伤模拟时,探讨东说念主员能够更快地赢得闭幕,从而加快科学探讨和工程应用的发展。
“咱们的上风是能够把英伟达显卡里的一些里面结构充分行使起来,通过对GPU里面寄存器显卡的读取,不需要更换更高等的显卡,即可收场效率的升级,”杨杨说,该效果不错减少对更高水平野神思硬件的硬性需求,只需使用开阔的家用GPU,就能够将本来需要数天能力完成的野心任务裁减至几个小时,致使几分钟,但是“它跟AI贬指责题的标的是不相通的”。
杨杨深刻,在现存开发单卡的英伟达显卡下,“算力升迁800倍”已是现存算法的上限,不外这不料味着该项探讨不错画下句号。“咱们的探讨还有需要完善和迭代的方位,后续咱们也会连续将探讨深入下去,力求让它就业于更多履行场景。”
为中枢时刻国产化装上“加快器”
在科技界,有“得算力者得世界”的说法,这亦然深北莫该项探讨效果如斯令东说念主“心潮倾盆”的原因。
杨杨深刻,这项时刻的平庸应用将有助于鼓舞多个领域的立异,出奇是在需要高性能野心补助的行业中。通过行使浪掷级GPU的强大野心智商,探讨东说念主员能够更高效地贬责复杂的物理问题,从而鼓舞科技卓越和产业升级。
“当今,大部分企业应用的软件齐是外洋的商用软件。更长久的曩昔,咱们但愿新算法不错匡助更多中国的企业研发我方的工业软件,从而相沿更多的开发场景。”杨杨深刻,据她所知,好多科研东说念主员和企业正在为工业软件的时刻自主而致力于买球下单平台,该算法有望助他们祖宗后己,为工业软件的中枢时刻国产化孝顺力量。