被業界譽為(wèi)芯片設計界的國(guó)際奧林匹克盛會的國(guó)際固态電(diàn)路大會(ISSCC 2023)近日在美國(guó)舊金山(shān)舉行。今年恰逢ISSCC 70周年大慶,也是自2020年疫情以來首次全線(xiàn)下模式召開的芯片設計領域的國(guó)際盛會,來自全球工(gōng)業界與學(xué)術界的數千名(míng)領域專家齊聚舊金山(shān)。本次大會,清華大學(xué)電(diàn)子工(gōng)程系教授、長(cháng)江學(xué)者、湃方科(kē)技(jì )首席科(kē)學(xué)家劉勇攀團隊的兩項高能(néng)效端側AI加速芯片技(jì )術成功入圍。 邊緣計算技(jì )術是新(xīn)一代智能(néng)物(wù)聯網技(jì )術驅動引擎。高效的邊緣計算技(jì )術有(yǒu)利于算力的去中(zhōng)心化,從而有(yǒu)效地增加物(wù)聯網端側的功能(néng)範圍,實現更高效、更及時、更可(kě)靠的端側計算。湃方科(kē)技(jì )團隊長(cháng)期緻力于硬件與算法聯合優化的技(jì )術路線(xiàn),研發了Sticker系列、tritium 103等多(duō)種端側AI加速芯片,覆蓋稀疏量化、變換域加速、差分(fēn)加速、近似計算、存内計算等多(duō)項技(jì )術維度,7次入選ISSCC大會。本次團隊再次入選,标志(zhì)着相關技(jì )術的新(xīn)突破。 論文(wén)介紹:
劉勇攀、賈弘洋、楊華中(zhōng)教授等發表題為(wèi)“A 28-nm 38-to-102-TOPS/W 8-b Multiply-less Approximate Digital SRAM Compute-In-Memory Macro for Neural-Network Inference”的論文(wén)。數字存内計算技(jì )術相比于模拟存内計算具(jù)有(yǒu)高精(jīng)度、易集成的特點,但其能(néng)量效率和面積效率受數字乘累加電(diàn)路限制難以進一步提升。針對該關鍵問題,研究團隊設計并流片驗證了一款基于SRAM的高能(néng)效近似數字存内計算芯片。該芯片采用(yòng)加法網絡近似傳統卷積網絡,通過L1距離代替乘法運算,大幅削減了數字電(diàn)路開銷。同時采用(yòng)預計算重塑數據流,将絕對值計算進一步簡化為(wèi)比較操作(zuò)。此外,設計的高密度動态邏輯比較器通過電(diàn)路級的可(kě)約束近似計算進一步提升能(néng)效和面積效率。基于以上創新(xīn)點設計的存内計算芯片采用(yòng)28nm工(gōng)藝制造,峰值8比特計算能(néng)量效率達到102TOPS/W,相比于相同工(gōng)藝下數字存内計算工(gōng)作(zuò)能(néng)效提升3倍以上,展示了近似數字存内計算電(diàn)路的性能(néng)優勢。
存内計算核心芯片及硬件指标
劉勇攀、楊華中(zhōng)教授等發表題為(wèi)“A 28nm 2D/3D Unified Sparse Convolution Accelerator with Block-Wise Neighbor Searcher for Large-Scaled Voxel-Based Point Cloud Network”的論文(wén)。相比2D視覺信息,3D點雲數據可(kě)以提供豐富的幾何、形狀和深度信息,使得深度3D點雲模型在自動駕駛、智能(néng)機器人等領域得到廣泛應用(yòng)。然而3D點雲數據具(jù)備稀疏、非規則的分(fēn)布特性,帶來随機數據存取訪問、2D/3D多(duō)樣稀疏卷積計算、非均衡計算核心調度等硬件難題,限制其面向實際應用(yòng)落地。為(wèi)提升點雲模型的硬件運行效率,研究團隊設計并發布了2D/3D融合的稀疏點雲加速器芯片。團隊基于分(fēn)塊存儲管理(lǐ)機制實現無序稀疏數據的連續、高效傳輸,設計2D/3D多(duō)稀疏度可(kě)重構卷積計算電(diàn)路實現4類稀疏卷積的高效支持,提出多(duō)核心混合調度優化策略解決稀疏計算存在的負載不均衡、數據複用(yòng)效率低的問題。該芯片是首款支持大規模化點雲模型端到端運行的智能(néng)芯片,在TSMC 28nm工(gōng)藝下成功流片,峰值處理(lǐ)能(néng)效達到4.68TOPS/W,相比2022年文(wén)獻中(zhōng)的相關工(gōng)作(zuò)能(néng)效提升2倍以上。同時團隊将該芯片與激光雷達集成實現了可(kě)演示實時系統,并在ISSCC Demo環節中(zhōng)進行展出,顯示出其對點雲模型強大的實時推理(lǐ)能(néng)力。
點雲加速器芯片及硬件指标