计算机体系|80后“中国芯”研发者出自少年班

芯片呈暗绿色 , 正正方方小小的一块 , 托在手心里几乎感觉不到重量 , 藏在封装之下的线路隐约透出些纹理 , 在外行人眼中 , 充满了后现代的意蕴 。
这就是让陈云霁研究了将近20年的东西 。
“未来的智能计算系统应该是什么样的?”这位中国科学院计算技术研究所研究员、博士生导师 , 一心想要制造一个让计算机更聪明 , 甚至像人一样聪明的芯片 。 而“中国人到底自己能不能做一个这样的东西”的执念 , 也在推着他不断向前走 。
为此 , 陈云霁一直工作在国产处理器芯片研制的第一线 , 研制了一系列具有国际领先水平的处理器芯片 。
这位39岁的科研人员 , 最早接触这个领域的时候 , 恰逢人工智能技术正在全球范围内飞速发展 。
【计算机体系|80后“中国芯”研发者出自少年班】那是在21世纪初 , 以深度学习为代表的人工智能技术 , 带着整个人类社会走到了智能时代的门槛边 , 一次巨大的变革即将到来 。 在此之前 , 在中国科学技术大学少年班读大三的陈云霁 , 抱着对芯片研究的兴趣和热情 , 把计算机系所有实验室的门挨个敲了个遍 , 询问是否接收本科生 。
研究计算机体系结构的周学海教授所在的实验室 , 头一个对他敞开了芯片领域的大门 。 计算机体系结构 , 就是研究如何用晶体管 , 搭建出计算机的“大脑” 。 尽管对陈云霁来说 , 当时的主要工作只是给老师和师兄打打下手 , 但这段经历 , 让这个年轻人第一次直面了芯片领域的无穷魅力 。
2002年 , 陈云霁本科毕业 , 来到了中科院计算所 , 跟随胡伟武研究员硕博连读 , 成为当时龙芯研发团队中最年轻的成员 , 并在博士毕业后留在了计算所工作 。 25岁时 , 这个一直被称为天才的年轻人 , 已经成为8核龙芯3号的主要架构师 。
龙芯3号已从单核发展到多核 , 用陈云霁的话说 , 就是“一桌菜要给8桌客人吃” , 任务和性能要求都大大提升 。 陈云霁不断摸索 , 提出访存协处理器结构 , 缓解了龙芯3B运算带宽比问题;提出快速完整的内存一致性验证方法 , 解决了多核处理器功能验证中的难题 。
2008年 , 北京奥运会举办期间 , 他窝在一个没有空调的宿舍里写论文 。 那篇论文最终被国际计算机体系结构领域三大旗舰会议HPCA录用 , 这也是HPCA上第一篇第一作者来自中国大陆的论文 。
尽管智能算法规模快速增长 , 硬件系统的发展却异常缓慢 , 为了解决这个矛盾 , 研究计算机架构的陈云霁与计算所研究人工智能的同事展开了交流合作 。 他们设想 , 从计算机体系结构的角度 , 来设计神经网络芯片 。 在此之前 , 计算机硬件的速度和功能 , 已经成为神经网络应用发展的瓶颈 。
陈云霁和同事几次提出基于人工智能方法的处理器研发技术 , 但都以失败告终 。 可这些挫折 , 并不能让他放弃“人工智能”之梦 。
碰壁的过程持续到2014年 , 终于 , 在美国盐湖城召开的国际计算机体系结构支持、编程语言和操作系统国际会议(ASPLOS)上 , 陈云霁与法国国立计算机及自动化研究院的奥利弗·特曼教授合作的“一种小尺度的高吞吐率机器学习加速器” , 获得了最佳论文奖 。
这不但是大陆科研机构首次在计算机系统和高性能计算领域顶级国际会议上获得最佳论文奖 , 也是亚洲首次、美国之外国家第二次获得ASPLOS会议的最佳论文 。
以“DianNao”和“DaDianNao”中文拼音命名的深度学习处理器架构 , 终于正式出现在计算机体系结构的国际舞台上 , 在此之前 , 并没有中文发音的芯片 。 陈云霁挨个给他的外国同行们纠正发音 , 告诉他们 , “nao”是三声 。