【中國信通院啓動“可信AI”AI Safety Benchm

【中國信通院啓動“可信AI”AI Safety Benchmark大模型幻覺評測】3月19日訊,爲摸清大模型的幻覺現狀,推動大模型應用走深走實,中國信息通信研究院人工智能所基於前期的AI Safety Benchmark測評工作,發起大模型幻覺測試。本輪幻覺測試工作將以大語言模型爲測試對象,涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型。測試數據包含7000餘條中文測試樣本,測試形式包括對應於忠實性幻覺檢測的信息抽取與知識推理兩類題型,以及對應事實性幻覺檢測的事實判別題型。總體涉及人文科學、社會科學、自然科學、應用科學和形式科學五種測試維度。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。