葡京娱乐场-富盈娱乐场开户

|
清華大學
  • 259 高校采購信息
  • 691 科技成果項目
  • 12 創新創業項目
  • 0 高校項目需求

人工智能大模型的高性能加速系統

2024-04-29 09:23:47
云上高博會 http://www.a00n.com
點擊收藏
所屬領域:
人工智能
項目成果/簡介:

1. 痛點問題

大模型的發展已成為人工智能領域的一個重要趨勢,其具有更強的表達能力和更高的準確性,可以幫助人類解決更復雜的實際問題。然而,大模型的訓練面臨巨大的計算壓力。主流的大模型參數量已達到TB量級,必然需要使用分布式系統進行處理,通過將模型和數據分配到多個計算設備上進行并行計算,從而提高訓練速度。但是,分布式訓練的成本非常高昂,需要使用大量高性能的計算設備,而這些設備的價格居高不下,甚至在市場上難以獲得。

并行訓練系統的性能優化是降低訓練成本的重要手段。目前開源的分布式訓練軟件包括英偉達公司的 Megatron-LM和微軟公司的 DeepSpeed 等。雖然這些框架可以在給定的硬件平臺上對給定模型進行較好的并行訓練支持,但還存在一些局限性:

(1)性能仍有提升空間。目前廣泛使用的方案基于數據并行,通信量巨大,并行效率低下;

(2)依賴并行專家進行調優。現有系統提供了更多混合的并行方式的選擇,在數量眾多的可行的并行方案中選擇最優的并行方案是十分困難的,而任意選擇的并行方案可能會花費數倍于最優方案的時間;

(3)對于具有動態性的模型支持不足。現有的系統對于混合專家模型等具有動態負載特性的場景缺乏有效的處理機制,導致負載不均衡現象嚴重,從而導致訓練效率低下;

(4)缺乏對于多種不同硬件平臺的支持。目前主流的軟件系統與英偉達公司的GPU硬件綁定程度較深,難以移植到其它硬件平臺。

2. 解決方案

本技術成果包含以下核心技術點:(1)考慮硬件拓撲結構和性能特點的并行訓練軟件系統搭建與調優技術;(2)針對具有動態性的模型的高性能并行訓練系統;(3)向國產算力系統移植并行訓練系統的能力。

基于上述核心技術,本技術成果可支撐大模型并行訓練解決方案。為有大模型訓練需求的客戶,如中小型企業、科研院校,提供高效的大模型并行訓練資源。從超算中心、數據中心、云廠商等處獲取大規模計算資源,并根據客戶的需求部署效率最佳的并行訓練軟件系統,從而支持客戶進行高效的大規模大模型分布式訓練,降低大模型訓練成本。

針對具有動態性的大模型的通信重疊調度機制

項目階段:

本項目擬先進行技術許可。

效益分析:

相比于已有的開源解決方案,本技術成果可提供針對不同硬件環境、目標模型規模,提供定制化并行性能調優,從而比選擇默認并行配置獲得更高的并行效率。例如針對混合專家模型,調優后的系統可獲得超過十倍的效率提升,從而為客戶節省更多成本。相比于專門雇傭并行專業人士的人力成本,使用統一的并行訓練解決方案成本更低。

會員登錄可查看 合作方式、專利情況及聯系方式

掃碼關注,查看更多科技成果

取消
阿合奇县| 广州百家乐官网赌场| 百家乐官网真钱娱乐| 百家乐推饼| 百家乐官网庄闲必胜手段| 在线百家乐官网有些一| 任我赢百家乐软件| 皇冠足球网址| 百家乐网站赌博| 百家乐官网投注庄闲法| 博彩乐百家乐平台| 沂南县| 澳门百家乐门路| 皇家娱乐| 24山安葬吉凶择日| 五台县| 德晋百家乐的玩法技巧和规则 | 赌百家乐怎样能赢| 玩百家乐官网五湖四海娱乐城| 太阳城娱乐场| 百家乐官网详情| 威尼斯人娱乐城好吗| 百家乐官网加牌规| 行唐县| 万利娱乐城开户| 奇迹百家乐的玩法技巧和规则 | 亲朋棋牌捕鱼辅助| 网上玩百家乐的玩法技巧和规则| 新锦江百家乐官网娱乐场| 威尼斯人娱乐城 活动| 新手百家乐官网指点迷津| 威尼斯人娱乐中心老品牌| 百家乐游戏世界视频| 百家乐官网有秘技吗| 银河国际娱乐场| 大发888娱乐城建账号| 真人百家乐官网网络游戏信誉怎么样| 百家乐官网为什么庄5| 平凉市| 大发扑克娱乐场| 大发888手机客户端|