【中國電信發佈單體稠密萬億參數語義模型 用了普通訓練方案9%

【中國電信發佈單體稠密萬億參數語義模型 用了普通訓練方案9%的算力資源】6月19日訊,從中國電信處獲悉,近日,中國電信人工智能研究院(TeleAI)聯合北京智源人工智能研究院發佈了全球首個單體稠密萬億參數語義模型Tele-FLM-1T,成爲國內首批發布稠密萬億參數大模型的機構。記者瞭解到,針對大模型訓練算力消耗高的問題,TeleAI與智源基於模型生長和損失預測等關鍵技術聯合研發出的Tele-FLM系列模型,僅使用了業界普通訓練方案9%的算力資源,基於112臺A800服務器,用時4個月完成了3個模型總計2.3Ttokens的訓練。(每經)
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。