首页 > 教学科研
信息学院崔林教授课题组论文被网络领域国际顶级会议INFOCOM录用
供稿单位:信息科学技术学院 发布日期:2025-01-24 阅读量:

      暨南大学融媒体中心讯   近日,暨南大学信息科学技术学院AntLab实验室崔林教授课题组的论文被IEEE计算机通信国际会议INFOCOM收录。INFOCOM全称为IEEE International Conference on Computer Communications,是IEEE组织在通信网络领域的旗舰性会议,也是国际通信网络领域的一大标志性会议(CCF推荐A类会议),具有极高的影响力,是全球网络通信领域学者每年一度的盛会。INFOCOM 2025年的论文接受率仅为272/1458 = 18.65%。

      该论文由AntLab实验室的学生张迈(第一作者)和张效铨博士等合作完成,崔林教授为通讯作者,并与英国拉夫堡大学(LoughboroughUniversity)研究团队开展合作。张迈同学是暨南大学信息科学技术学院硕士二年级学生,其研究方向聚焦于可编程数据平面与机器学习的深度融合。张效铨博士主要从事P4与可编程网络、机器学习与智能网络等领域的研究,发表论文8篇,其中CCF推荐A类论文4篇。

      人工智能技术的快速发展对网络基础设施带来了新的需求。以可编程数据平面(ProgrammableDataPlane,PDP)为核心的可编程网络技术,通过开放可编程交换ASIC芯片的计算资源,利用其灵活可编程能力和高速数据转发能力(Tbps级别的带宽、纳秒级的延迟),实现了对网络流量的线速处理。智能数据平面(IntelligentDataPlane,IDP)则通过在PDP上部署机器学习模型,将PDP的高速数据包处理能力与机器学习的智能分析能力相结合,从而实现了更高效、更智能的网络管理与优化。

      但是,在可编程交换ASIC芯片上实现复杂机器学习模型,如卷积神经网络(CNN)等,还面临诸多挑战。这主要是由于ASIC芯片的硬件Pipeline架构(如PISA)缺乏对浮点运算、乘法和除法的支持,以及Pipeline资源受限且不支持循环操作等。现有工作主要研究决策树等简单的机器学习模型,或者需要依赖额外设备(如FPGA)。本文克服了上述挑战,提出的Quark是首个完全在可编程交换ASIC芯片上实现CNN的工作。

       论文针对可编程交换ASIC芯片硬件资源受限问题,提出了一种结合模型压缩技术的优化框架Quark实现了CNN模型在可编程交换ASIC芯片上的部署,并保证了CNN模型的高精度和低延迟推理。针对硬件Pipeline架构管道(如PISA)不支持浮点运算的问题,Quark提出了量化模块,将CNN的卷积层和全连接层的参数从高精度浮点数(如Float32)转换为低精度的定点整数(如INT8)。量化模块通过统计比例因子和零点,将浮点数映射到定点整数范围内,确保量化前后数值关系的一致性。量化后的模型能够显著降低硬件推理的计算复杂度,同时保持较低的精度损失。

      在神经网络推理工作流中,Quark设计了一个由解析器、反解析器、MATs和ALUs等多个基本操作组成的CNN推理模型。由于CNN的部分推理流程具有共性,可被抽象为多个基本单元组成的模块化模型。针对PDP平台支持的计算依赖链长度有限的问题,Quark提出了基于单元的模块化CNN部署架构。通过在数据平面中部署CNN单元,并利用数据包克隆和循环操作在流水线内逻辑重组多个单元,Quark能够完成复杂计算(如卷积操作)。解析器和反解析器负责数据包头的解析和循环操作的执行。推理完成后,流水线会更新流索引中的预测结果。

      特别地,本论文在基于Tofino ASIC芯片(3.2Tbps、12 stage pipeline),实现了Quark的原型系统的部署。实验结果表明Quark在卷积层和全连接层矩阵运算量化中的有效性,以及模块化CNN部署的灵活性,为资源受限场景下的CNN推理优化提供了全新的解决方案。

责编:常凯丽

未经允许,不得转载,侵权必究!

分享到微信朋友圈

打开微信,点击 “ 发现 ” ,使用 “ 扫一扫 ” 即可将网页分享至朋友圈。
关闭