集成电路学院孙广宇课题组在领域定制体系架构研究领域取得重要进展

领域定制体系架构(Domain-specific Computer Architecture)是为特定重要领域专门设计优化的计算、存储、通信等架构,通常需要结合上层软件和底层硬件进行软硬协同设计,其重要意义体现在如下三个方面:1)随着深度学习、大数据分析、物联网等应用的兴起,传统通用处理器已经无法满足这类应用对于性能、功耗、可靠性等方面不断增长的需求;2)摩尔定律放缓、“存储墙、功耗墙”“光罩限制”等问题进一步加剧了处理器性能增长速度与需求之间的鸿沟;3)后摩尔时代各种新型器件(如忆阻器等)的不断涌现,为打破传统处理器架构提供了新的机遇。因此,正如两位图灵奖得主John L. Hennessy和David A. Patterson在他们的获奖报告中强调:“体系架构新的黄金时代到来,领域定制软硬件协同设计已经成为解决上述问题的重要途径之一。”

近日,北京大学集成电路学院长聘副教授孙广宇课题组在面向数据密集型应用(如深度学习、图计算等)领域的定制DRAM近存计算架构方向取得重要进展。众所周知,近年来火热的近存/存内计算架构是突破传统架构“存储墙”和“功耗墙”瓶颈的重要技术路线之一。然而,孙广宇课题组发现,虽然基于双列直插内存模块(DIMM)的DRAM近存架构可以提供较大的容量和内部带宽来加速访存密集型应用,但是DIMM 间较低的通信带宽往往成为很多应用的性能瓶颈。为了缓解这个问题,他们针对性地设计了一种新型的互联架构DIMM-Link。DIMM-Link 采用高速的外部互联来直接连接DIMM模块,从而支持更高的通信灵活性和通信带宽。其设计充分考虑了DIMM-Link真实系统中进行部署会面临的各种物理限制,相应定制了硬件架构、互联协议以及系统组织和路由策略等,并且提出了两个配套软件优化策略,来进一步提升性能。相对于基线近存架构设计,采用DIMM-Link可以获得1.77到2.42倍的性能提升。该工作以“DIMM-Link: Enabling Efficient Inter-DIMM Communication for Near-Memory Processing”为题,发表在第29届国际高性能体系结构大会(HPCA),并获得本届HPCA最佳论文奖。HPCA与ISCA、MICRO和ASPLOS并称“体系结构四大会”,DIMM-Link是国内学术机构首次在HPCA会议获得最佳论文奖的工作。

获奖证书

孙广宇课题组长期从事“领域定制体系架构”方向的研究,已经在“定制计算架构”“定制存储架构”和“存算融合架构”三个方向取得一系列创新性成果,并且在国际上获得一定的影响力。孙广宇在相关领域累计发表论文100余篇,其中包括体系结构四大会论文17篇,并于2022年作为首位来自国内大学的学者入选四大会之一HPCA的Hall of Fame (名人堂)。他共获得四次最佳论文奖,除本次HPCA最佳论文奖之外,其关于领域定制加速器和基于新型存储器的定制存储架构等成果,分别获得IEEE TCAD期刊最佳论文奖和ASP-DAC会议最佳论文奖。值得一提的是,这两次都是国内机构首次在IEEE TCAD和ASP-DAC获奖。这一系列工作获得谷歌学术引用8800余次、SCI他引2000余次,引用源有多名来自著名科研机构和公司的顶尖学者,包括图灵奖得主、谷歌/英伟达/三星等顶尖公司技术负责人等。孙广宇课题组提出的面向深度学习领域定制计算架构的“天花板模型”,单篇工作引用超过2100次,是FPGA会议28年以来官方统计引用量和下载阅读量最高的论文。

孙广宇课题组的系列研究成果已经应用到多款实际芯片的架构设计,并且在国内知名企业(如百度、阿里巴巴等)进行应用和验证。未来,该团队将进一步面向国家新一代人工智能等领域的重大战略,继续专注领域定制体系架构的研究,聚焦突破相关领域的“卡脖子”问题。

转载本网文章请注明出处