3月26日下午,上海交通大學鯤鵬昇騰科教創新卓越中心特訓營-DeepSeek專場在上海交通大學閔行校區圖書信息樓成功舉辦。活動旨在基于昇騰技術的DeepSeek本地化部署實踐分享,培養學員自主創新開發能力。華為技術專家與學校老師現場授課,干貨滿滿,吸引了來自計算機、電子信息、人工智能等專業的60余名學生參加。
技術筑基:解析DeepSeek大模型核心架構
活動伊始,昇騰生態技術專家 ZOMI醬,分享了基于昇騰Atlas 800 A2部署滿血DeepSeek-R1-671B的經驗,重點分享了如何通過剪枝和量化,讓DeepSeek-R1/V3大模型特性實現加速。他指出,昇騰Atlas 800 A2的硬件特性與DeepSeek模型高度適配。通過結構化剪枝技術,基于昇騰芯片的稀疏計算單元(如CANN的aclSparse接口),對模型中冗余的注意力頭與FFN層通道進行動態裁剪,在保證任務精度損失小于1%的前提下,將參數量壓縮40%,推理時延大幅降低。同時,采用混合量化策略——對計算密集的矩陣乘操作(如Q/K/V投影)啟用INT8動態量化,結合昇騰3D Cube架構的整數計算加速,實現算力利用率提升200%;而對精度敏感的LayerNorm等操作保留FP16精度,避免量化誤差擴散。同時,他還介紹了昇騰Attention計算優化方法Laser Attention,該技術通過動態稀疏計算、低精度無損加速與硬件級算子融合三重創新,為大模型訓練與推理提供顯著效能提升。
(昇騰生態技術專家 ZOMI醬)
實踐落地:揭秘DeepSeek高校部署創新方案
大模型憑借出色的文本處理能力,已經深入工作生活的方方面面,被廣泛應用于文案寫作、文本處理、數據分析等。如何在本地部署一個專屬于自己的大模型?究竟如何跟大模型對話才能發揮其出色的功能?這些都是初窺門徑的AI開發者關心的問題。上海交大網絡信息中心“交我算”團隊工程師王星澤圍繞在交大本地的昇騰服務器上部署DeepSeekV3/R1大模型的經驗介紹部署方法,包括硬件設備條件、網絡拓撲、API封裝、前端集成等。同時,還結合大模型在高校科研、教學和管理中的實際應用場景,介紹提示詞技巧和使用案例。
(上海交通大學網絡信息中心計算專員 王星澤)
開發實戰:體驗原生開發全流程
培訓中,昇思布道師非常work老師的基于香橙派AI pro(20T)開發板的開發實戰吸引了現場每一位交大學子,對MindSpore在香橙派開發板上的能力支持做了詳細的說明,大家迫不及待動手體驗。目前昇思MindSpore AI框架已實現在香橙派AIpro開發板預置,并在官方網站上線開發指導教程,通過軟硬結合,使能開箱即用模型,并提供模型全流程使能套件,支持積木式搭建,覆蓋CV、NLP小模型及1B級大模型(如DeepSeek-R1-Distill-Qwen-1.5B)。學生們可通過動態圖+類HuggingFace接口靈活調試,結合三行代碼調用JIT即時編譯,兼顧開發效率與執行性能,為邊緣端AI部署提供輕量化解決方案。
(昇思布道師非常work)
本次特訓營是基于上海交通大學鯤鵬昇騰科教創新卓越中心開展的2025年第一場DeepSeek主題特訓營。該中心自2024年6月揭牌成立以來,始終致力于構建基于鯤鵬昇騰技術路線的校級生態合作平臺,圍繞大學計算產業前沿課題研究、課程體系建設、研究人才培養等方面展開合作,為產業輸出高質量鯤鵬昇騰原生人才,孵化和培育根植中國的世界級原生科研創新成果。
據悉,鯤鵬昇騰科教創新卓越中心特訓營將持續推進,隨著特訓營在全國重點高校的陸續開展,校企協同育人的創新模式正為國產化AI人才培養注入新動能。
關鍵詞: