【OpenAI員工公開指責Grok3的基準測試結果具有誤導性

【OpenAI員工公開指責Grok3的基準測試結果具有誤導性】2月23日訊,近日,OpenAI的一名員工公開指責埃隆・馬斯克旗下的xAI公司,稱其發佈的最新AI模型Grok3的基準測試結果具有誤導性。對此,xAI的聯合創始人伊戈爾・巴布什金(Igor Babushkin)則堅稱公司並無不當。xAI的圖表顯示,Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表現超過了OpenAI當前最強的可用模型o3-mini-high。然而,OpenAI的員工很快在X平臺上指出,xAI的圖表並未包含o3-mini-high在“cons@64”條件下的AIME 2025得分。巴布什金在X平臺上辯稱,OpenAI過去也曾發佈過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。