金十數據 - 研究報告 - 新聞快訊 - 【李飛飛團隊s1模型基於Qwen訓練？阿里雲確認：基於Qwe | 群益情爆局

金十數據

【李飛飛團隊s1模型基於Qwen訓練？阿里雲確認：基於Qwen2.5-32B-Instruct模型訓練】2月6日訊，今日，李飛飛等斯坦福大學和華盛頓大學研究人員以不到50美元的雲計算費用訓練了一個名叫s1的人工智能推理模型，該模型在數學和編碼能力測試中的表現與OpenAl的o1和Depsek的R1等尖端推理模型類似，引發廣泛關注。不過很快，該s1模型被指“並非從零開始訓練”，其基座模型爲“阿里通義千問(Qwen)模型”。對此，記者向阿里雲方面求證，阿里雲方面確認了這一消息，並回應稱：“他們以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座，在16塊H100GPU上監督微調26分鐘，訓練出新模型s1-32B，取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比o1-preview高出27%。”（新浪科技）

貼心提醒:
1.本公司所提供之即時報價資訊，不代表勸誘投資人進行期貨交易，且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。

墨西哥官員：墨西哥想要替代半導體進口。

【整理：每日美股市場要聞速遞（2月6日週四）】重要新聞1.

留言請登入帳號