【又一中國模型趕超OpenAI！Qwen2.5-Max數學編

金十數據

【又一中國模型趕超OpenAI！Qwen2.5-Max數學編程能力全球出衆】2月4日訊，4日凌晨，三方基準測試平臺Chatbot Arena公佈了最新的大模型盲測榜單，一週前阿里雲通義團隊剛發佈的Qwen2.5-Max超越DeepSeek V3、OpenAI o1-mini和Claude-3.5-Sonnet等模型，以1332分位列全球第七名，也是非推理類的中國大模型冠軍。同時，Qwen2.5-Max在數學和編程等單項能力上排名第一，在硬提示（Hard prompts）方面排名第二。據瞭解，Chatbot Arena是由LMSYS Org推出的大模型性能測試平臺，目前集成了190多種模型。該榜單採用匿名方式將大模型兩兩組隊，交給用戶進行盲測，用戶根據真實對話體驗對模型能力進行投票。ChatBot Arena官方評價稱，Qwen2.5-Max在多個領域表現強勁，特別是專業技術向的，例如編程、數學、硬提示等。（國是直通車）

貼心提醒:
1.本公司所提供之即時報價資訊，不代表勸誘投資人進行期貨交易，且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。

【歐盟2025年將向摩爾多瓦提供2.5億歐元能源相關支持】2

歐盟委員會主席馮德萊恩：歐盟可以找到協議，這樣的協議甚至可以

留言請登入帳號