葡京娱乐场-富盈娱乐场开户

|
清華大學
  • 259 高校采購信息
  • 691 科技成果項目
  • 12 創新創業項目
  • 0 高校項目需求

人工智能大模型的高性能加速系統

2024-04-29 09:23:47
云上高博會 http://www.a00n.com
點擊收藏
所屬領域:
人工智能
項目成果/簡介:

1. 痛點問題

大模型的發展已成為人工智能領域的一個重要趨勢,其具有更強的表達能力和更高的準確性,可以幫助人類解決更復雜的實際問題。然而,大模型的訓練面臨巨大的計算壓力。主流的大模型參數量已達到TB量級,必然需要使用分布式系統進行處理,通過將模型和數據分配到多個計算設備上進行并行計算,從而提高訓練速度。但是,分布式訓練的成本非常高昂,需要使用大量高性能的計算設備,而這些設備的價格居高不下,甚至在市場上難以獲得。

并行訓練系統的性能優化是降低訓練成本的重要手段。目前開源的分布式訓練軟件包括英偉達公司的 Megatron-LM和微軟公司的 DeepSpeed 等。雖然這些框架可以在給定的硬件平臺上對給定模型進行較好的并行訓練支持,但還存在一些局限性:

(1)性能仍有提升空間。目前廣泛使用的方案基于數據并行,通信量巨大,并行效率低下;

(2)依賴并行專家進行調優。現有系統提供了更多混合的并行方式的選擇,在數量眾多的可行的并行方案中選擇最優的并行方案是十分困難的,而任意選擇的并行方案可能會花費數倍于最優方案的時間;

(3)對于具有動態性的模型支持不足。現有的系統對于混合專家模型等具有動態負載特性的場景缺乏有效的處理機制,導致負載不均衡現象嚴重,從而導致訓練效率低下;

(4)缺乏對于多種不同硬件平臺的支持。目前主流的軟件系統與英偉達公司的GPU硬件綁定程度較深,難以移植到其它硬件平臺。

2. 解決方案

本技術成果包含以下核心技術點:(1)考慮硬件拓撲結構和性能特點的并行訓練軟件系統搭建與調優技術;(2)針對具有動態性的模型的高性能并行訓練系統;(3)向國產算力系統移植并行訓練系統的能力。

基于上述核心技術,本技術成果可支撐大模型并行訓練解決方案。為有大模型訓練需求的客戶,如中小型企業、科研院校,提供高效的大模型并行訓練資源。從超算中心、數據中心、云廠商等處獲取大規模計算資源,并根據客戶的需求部署效率最佳的并行訓練軟件系統,從而支持客戶進行高效的大規模大模型分布式訓練,降低大模型訓練成本。

針對具有動態性的大模型的通信重疊調度機制

項目階段:

本項目擬先進行技術許可。

效益分析:

相比于已有的開源解決方案,本技術成果可提供針對不同硬件環境、目標模型規模,提供定制化并行性能調優,從而比選擇默認并行配置獲得更高的并行效率。例如針對混合專家模型,調優后的系統可獲得超過十倍的效率提升,從而為客戶節省更多成本。相比于專門雇傭并行專業人士的人力成本,使用統一的并行訓練解決方案成本更低。

會員登錄可查看 合作方式、專利情況及聯系方式

掃碼關注,查看更多科技成果

取消
利来国际娱乐网| 网页百家乐的玩法技巧和规则| 江城足球网| 百家乐官网黏土筹码| 澳门百家乐网址多少| 大发888官方pt老虎机| 庞博百家乐官网的玩法技巧和规则 | 太阳百家乐官网破解| 虹乐棋牌是真的吗| 注册百家乐送彩金| 百家乐官网l路单| 游艇会娱乐城| 网上百家乐官网真的假的| 百家乐网络公式| 巴比伦百家乐娱乐城| 跨国际百家乐官网的玩法技巧和规则| 百家乐试玩| 鼎丰娱乐城开户| 百家乐庄闲必胜手段| 百家乐官网神算子| 大发888 护栏| 英皇百家乐官网的玩法技巧和规则| 乐宝百家乐官网游戏| 百家乐有公式| 大中华百家乐官网的玩法技巧和规则| 百家乐官网网站哪个好| 水果机遥控器| 百家乐官网计划工具| 百家乐官网视频游戏账号| 黄金岛棋牌游戏下载| 威尼斯人娱乐城吃饭| 免费百家乐官网分析工具| 百家乐官网开放词典新浪| 爱博| tt娱乐城开户| 真人百家乐官网蓝盾娱乐场| 岳池县| 环球百家乐的玩法技巧和规则| 百家乐官网娱乐软件| 百家乐官网投注技巧球讯网| 百家乐官网如何取胜|