【OpenAI開源BrowseComp,重塑Agent瀏覽器

【OpenAI開源BrowseComp,重塑Agent瀏覽器評測】4月11日訊,今天凌晨2點,OpenAI開源了專門用於智能體瀏覽器功能的測試基準——BrowseComp。這個測試基準非常有難度,連OpenAI自己的GPT-4o、GPT-4.5準確率只有0.6%和0.9%幾乎爲0,即便使用帶瀏覽器功能的GPT-4o也只有1.9%。但OpenAI最新發布的Agent模型Deep Research準確率高達51.5%,在自主搜索、信息整合、準確性校準方面非常優秀。(AIGC開放社區)
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。