最近中文字幕国产一区二区,亚洲色swag在线无码,中国美妇的肉逼,无码 有码 日韩 人妻

智源研究院發(fā)布大規(guī)模并行訓(xùn)練效率提升器 將優(yōu)化DeepSpeed并行計(jì)算框架

首頁 > 科技 > > 正文

日期:2021-04-29 14:36:25    來源:中國(guó)科學(xué)報(bào)    

近日,北京智源人工智能研究院(簡(jiǎn)稱智源研究院)發(fā)布大規(guī)模并行訓(xùn)練效率提升器TDS。作為超大規(guī)模智能模型系統(tǒng)“悟道”的階段進(jìn)展,TDS(Tsinghua/Temporary DeepSpeed)插件將進(jìn)一步優(yōu)化現(xiàn)今最流行的DeepSpeed 并行計(jì)算框架,從而“多快好省”地訓(xùn)練一個(gè)大模型。

據(jù)介紹,數(shù)據(jù)、算法、算力是當(dāng)前人工智能技術(shù)崛起的重要驅(qū)動(dòng)力。利用海量數(shù)據(jù)訓(xùn)練大規(guī)模機(jī)器學(xué)習(xí)模型,有助于人類充分學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的知識(shí),達(dá)到更好的訓(xùn)練效果。

然而,隨著訓(xùn)練規(guī)模的擴(kuò)大,單張GPU卡的顯存與計(jì)算效率已經(jīng)無法滿足訓(xùn)練的需要,通過分布式訓(xùn)練框架實(shí)現(xiàn)多GPU并行訓(xùn)練成為了一種新的剛需。為了提升多GPU并行訓(xùn)練的效率,研發(fā)更高效的并行計(jì)算框架十分必要。

為應(yīng)對(duì)大規(guī)模計(jì)算集群高效訓(xùn)練方法的需求,智源研究院發(fā)揮其在硬件設(shè)計(jì)、模型架構(gòu)、編程框架研發(fā)等方面的優(yōu)勢(shì),組織智源“悟道”團(tuán)隊(duì)科研人員研發(fā)了 TDS 插件,對(duì)當(dāng)下主流的并行計(jì)算框架進(jìn)行了優(yōu)化。

據(jù)介紹,TDS 插件重新實(shí)現(xiàn)了DeepSpeed的流水線,通過適配器模式封裝了DeepSpeed 的其它功能,該插件十分易于使用。如果已經(jīng)完成了對(duì) DeepSpeed 的安裝,只需要將TDS的代碼拷貝到工程中,然后加載 DeepSpeed 庫即可。(鄭金武)

關(guān)鍵詞: 智源研究院

下一篇:華大研究院解密狨猴二倍體遺傳信息差異 對(duì)于推進(jìn)人類疾病研究非常重要
上一篇:我國(guó)位列石墨烯研究第一方陣 劉忠范:“石墨烯熱”中更需坐得住冷板凳

科技

 
三原县| 牡丹江市| 肃北| 中超| 隆子县| 文昌市| 巴林左旗| 民权县| 军事| 横峰县| 剑阁县| 黑山县| 周宁县| 都匀市| 宝山区| 荥阳市| 茶陵县| 宜城市| 化州市| 开封县| 阜新市| 镇宁| 衡山县| 常熟市| 东乡族自治县| 遂宁市| 临朐县| 龙胜| 资兴市| 迁安市| 岱山县| 萨嘎县| 房产| 象山县| 烟台市| 武清区| 本溪市| 沛县| 阿拉善右旗| 巴林左旗| 阿拉善盟|