【崑崙萬維:天工大模型在權威推理榜單Benchmark GS

【崑崙萬維:天工大模型在權威推理榜單Benchmark GSM8K 測試中大幅領先GPT-3.5】10月19日訊,崑崙萬維在互動平臺表示,天工AI助手的手機APP已開啓內測。日前,崑崙萬維天工大模型在騰訊優圖實驗室聯合廈門大學開展的多模態大語言模型測評中,綜合得分排名第一;在權威推理榜單Benchmark GSM8K 測試中,天工大模型以80%的正確率脫穎而出,大幅領先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),推理能力達到全球領先水平;此外,在基於SuperCLUE綜合性測評基準,包括多輪開放式問題測評SuperCLUE-OPEN和三大能力客觀題測評SuperCLUE-OPT的測試中,天工大模型文理兼顧,躋身中文閉源模型第一梯隊。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。