第三章 成功运行
李御昭往余光所及之处看去,会场的西北角已经坐满了参会的人群。他来回扫了扫感觉并没有什么人盯着自己看,以为是自己的错觉,便收回了目光。
在胡雪走之后,典礼很快就开始了。期间李御昭还和当年的导师聊了聊天,谈了谈近状。导师姓张,也算是李御昭的伯乐了。不像其他“散养”和“压榨”学生的教授,张教授在李御昭读博期间,给了他许多建议和支持,也很少让他做无关科研的工作。李御昭打心底尊重这个老师,也正是如此,他才不想拒绝校庆发言的邀请。
……
典礼结束后,李御昭拖着略显疲惫的身子回到了工作的研究所。今天因为特殊原因同事们已经提前下班了。他刷着门禁卡推开了实验室的房门,空无一人的房间内只有大型散热器的轰鸣声。李御昭慢悠悠地走到工位旁边,一屁股坐在了皮质的靠椅上,脑袋耷拉在椅背上,闭幕冥神,放空着思绪。
“叮咚~”一声清脆的手机通知声将李御昭从冥想中拉回。
他打开手机一看,又是早上的警告通知。他没有管,将手机装回了兜中。然后猛地站起来伸了个懒腰。
然后,他来到呼啸的散热器后,在一列列机器之间穿梭,不断地开启着一个个电源。各种指示灯也不断亮起,机器运作的轰轰声此起彼伏,声音渐渐越来越大。当“滴——”的一声警告声响起后,这座巨大的计算机器像被赋予生命一样唤醒了意识。
每次开启这座“神威”超算机,李御昭总喜欢将实验室所有的照明灯都关上。一是他不想让自己的实验太惹人注目,二是当实验室关灯之后,他坐在自己的工位上,看着下面在漆黑中运转的一台台机器,那红红绿绿闪烁的指示灯,就像点缀在夜幕中的星光一样。时而闪烁,时而常亮,在这孤寂的夜晚,仿佛描绘了一个别样的星空……
工作总是枯燥的,今天的“生命方舟”实验也不例外。李御昭坐在工位前,在控制终端上开始了模型代码的调试。他先是调整一下模型的关键参数,想要解决上次“生命方舟”因为计算机算力不足而崩溃的问题。程序从上个存档点运行后之后,李御昭带上vr眼镜观察着这次“生命方舟”的运行。几分钟后,李御昭摘下眼镜,无奈地叹了口气。
接着,他又改变了模型架构,打算试试最近大火的transformer架构,结果“生命方舟”反而比上次更快地崩溃了。随后,他又试了改变模型的正则化方式、采用不同的收敛函数、使用ema更新模型参数……
几个小时后,李御昭再一次扯下了带在头上的vr眼镜。在这闷热的机房中,几个小时的不断尝试已经让他的脸庞布满了汗水。内心烦躁至极,无力地瘫坐在靠椅上,尝试放松自己紧绷的肌肉神经,让过载的大脑放松下来。
不知怎地,李御昭头脑中突然浮现了老同学胡雪地身影,也许是意外的见面让他印象深刻,又或是突然的离开让他难以忘怀,胡雪就这样不折不扣地出现了。李御昭慢慢回想着今天和胡雪的相遇、闲聊……
突然,他像是意识到了什么一样,做起身,打开了电脑的浏览器。
“元学习么……”李御昭嘴里碎碎念着。
他登录了ieee期刊数据库,输入了“sce”来搜索。ieee是国际上最大的工程类期刊数据库,而《sce》正是他看到“元学习”文章的期刊杂志。简单地翻找之后,他在最新一期的《sce》中找到了一篇名为《基于自调参的自动演进算法——元学习》的论文。
第一次看到这个题目时,李御昭觉得和自己研究交集不多便跳过了,更何况这篇文章的机构他听都没听过,内容也不多,不像什么“重大突破”。
他开始随性地看起论文来。花了几分钟概读全文后,渐渐地,李御昭的精神集中了。他发现这篇论文的内容不像纸面一样单薄。论文非常简要,直接是问题定义、算法、实验结果三部分构成。文章提出了一个可以自我调参进化的模型结构,这使得模型运行可以省去大量算力。同时,调参进化可以使模型运行的越久便越稳定。
通俗地说,可以将模型理解为一辆组装的汽车,普通算法组成的“汽车”不仅庞大而且跑一段时间就会散架;而这篇论文提出的“元学习”,可以在“汽车”跑的时候,根据路况优化“汽车”的结构,自动更换汽车的某些部件,使“汽车”越跑越稳定。
李御昭看完论文的实验结果,内心的激动已经难以言表。他深刻地明白,如果这篇论文研究属实,将对他的“生命方舟”计划提供多大的帮助。他压抑住微微颤抖的手,耐心地又读了一遍论文,通篇上下不愿遗漏任何一个字。
看完,他挺直了腰板,盯着电脑屏幕,正襟危坐。按照论文中演示的算法一步步地调试着自己的“生命方舟”模型程序。一行两行……直到最后一行的代码修改完后,他又用编译器检查了一遍代码的语法,确保无误后,长吁了一口气,然后点下了开始运行的按钮。
李御昭再一次带上了vr眼镜,一道刺眼的白光之后,还是那个熟悉的星球,一群“骆驼”一样的生物栖息在这里。但不一样的是,这一次没有bug,天空没有呈现怪异的颜色,骆驼们的肢体也没有四散分离,大地上的一切都按照合理的方式来运行着,一副生机盎然的景象……
李御昭就这么静静地看着这一切,就这样静静地看着。他突然有点想哭,等这一刻太久了,自从四年前神威超级计算机落地起,他就幻想着这么一天,幻想着看到自己的“生命方舟”承载着一个个生命的运行……