Megatron-LM
M
Megatron LM
簡介 :
Megatron-LM 是由 NVIDIA 應用深度學習研究團隊開發的一種強大的大規模 Transformer 模型。該產品用於大規模訓練 Transformer 語言模型的持續研究。我們使用混合精度,高效的模型並行和數據並行,以及多節點的 Transformer 模型(如 GPT、BERT 和 T5)的預訓練。
需求人群 :
適用於訓練大規模語言模型的研究和實踐場景
總訪問量: 474.6M
佔比最多地區: US(18.64%)
本站瀏覽量 : 54.4K
產品特色
高效訓練大規模語言模型
模型並行和數據並行支持
支持 GPT、BERT 和 T5 等 Transformer 模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase