并行訓(xùn)練-流水線 簡(jiǎn)述 并行訓(xùn)練主要有三種策略: 數(shù)據(jù)并行訓(xùn)練加速比最高,但要求每個(gè)設(shè)備上都備份一份模型,顯存占用比較高,但缺點(diǎn)是通信量大。 張量并行,通信量比較高,適合在機(jī)器內(nèi)做模型并行。 流水線并行,訓(xùn)練設(shè)備容易出現(xiàn)空閑狀態(tài),加速效率沒有DP高;但能減少通信邊界支持更多的層數(shù),適合在機(jī)器間使用。
并行訓(xùn)練主要有三種策略:
Micro-batch(Gpipe)將網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行縱向拆分, 每張卡訓(xùn)練其中的幾層. 如果是按照純粹的mini-batch訓(xùn)練, 每層之間是純串行的. 后面的卡會(huì)始終等待前面的卡. 所以引入了micro-batch的概念. 把mini-batch進(jìn)行更細(xì)粒度的拆分, 這樣在完成batch0的fp之后, 卡0可以進(jìn)行batch1的fp, 卡1就能開始batch0的fp. 從而提高并行度.
存在的問題:
實(shí)際應(yīng)用中 當(dāng)mico-batch個(gè)數(shù)大于stageNum的4倍時(shí), 可以忽略bubble_time
機(jī)器學(xué)習(xí):神經(jīng)網(wǎng)絡(luò)構(gòu)建(下)
閱讀華為Mate品牌盛典:HarmonyOS NEXT加持下游戲性能得到充分釋放
閱讀實(shí)現(xiàn)對(duì)象集合與DataTable的相互轉(zhuǎn)換
閱讀鴻蒙NEXT元服務(wù):論如何免費(fèi)快速上架作品
閱讀算法與數(shù)據(jù)結(jié)構(gòu) 1 - 模擬
閱讀5. Spring Cloud OpenFeign 聲明式 WebService 客戶端的超詳細(xì)使用
閱讀Java代理模式:靜態(tài)代理和動(dòng)態(tài)代理的對(duì)比分析
閱讀Win11筆記本“自動(dòng)管理應(yīng)用的顏色”顯示規(guī)則
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2025 haote.com 好特網(wǎng)