虽然是机器产生的声音,但林浩感到亲切和温暖。他脱掉外套后,径直坐到了工作桌旁。

运行优雅的电脑,并不起眼,配置也有点过时。双三十二核 CPU,256G的内存,以及一块消费级的 RTX 10060显卡。

林浩创造优雅的契机,是在斯坦福时读到的一篇论文——“Enlightened Neural Iion & prehension Architecture(ENICA)”。

这是一种在深度学习架构基础上的一种新的人工智能技术,它在许多方面都优于传统的 GPT模型。其中最重要的,ENICA能极大地降低模型的训练和运行的硬件要求,它采用一种新的神经网络结构优化策略,理论上可以在相比 GPT少得多的计算资源下实现对大型数据集的训练。同时,这种策略对模型压缩和优化,可以使得训练好的模型在消费级的硬件上流畅运行,从而大大降低了部署的门槛。

尽管这个理论非常吸引人,但原始的论文作者只是提出了一个理论框架,却没有详细地阐述如何将这个框架转化为现实工程化的方法。毕竟,从理论到实践的过程中有许多难以预见的问题需要解决。

当林浩第一次读到那篇关于 ENICA原理的论文时,他被这个全新的视角所吸引,这个新思想的灵感使他深感震撼。之后,林浩义无反顾地将研究 ENICA工程化作为自己的课题。他的硕士毕业论文就是关于 ENICA工程化的一个阶段性成果——也就是优雅的第一版。硕士毕业后,林浩回到上海加入永恒智能,但业余时间仍然将全部精力投入在继续改进工程化 ENICA的方法,他希望早日能将 ENICA变成一种具有实际应用价值的技术。

今天早上的那次运行启动的优雅,就是完成了的优雅 2.0。

本章已完 m.3qdu.com