【騰訊混元宣佈開源首個多模態統一CoT獎勵模型】5月13日訊

【騰訊混元宣佈開源首個多模態統一CoT獎勵模型】5月13日訊,據騰訊混元消息,近日與上海AILab、復旦大學、上海創智學院聯合提出全新研究工作UnifiedReward-Think,構建出首個具備長鏈式推理能力的統一多模態獎勵模型,首次讓獎勵模型在各視覺任務上真正“學會思考”,實現對複雜視覺生成與理解任務的準確評估、跨任務泛化與推理可解釋性的大幅提升。目前,該項目已全面開源,包括模型、數據集、訓練腳本與評測工具。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。