【海天瑞聲發佈超大規模中文對話數據集DOTS-NLP-216

【海天瑞聲發佈超大規模中文對話數據集DOTS-NLP-216】7月28日訊,海天瑞聲今日宣佈正式推出中文千萬輪對話語料庫DOTS-NLP-216。據介紹,該語料庫更加符合中國人表達習慣的自然對話數據集,共計約千萬輪,上億級token,包含正式&非正式風格對話,使用偏口語化自然表達,覆蓋工作、生活、校園等場景,及金融、教育、娛樂、體育、汽車、科技等領域。在數據集構成上,DOTS-NLP-216包含了對真實場景的對話採集,及高度還原真實場景的模擬對話兩種方式。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。