台版AI對話引擎年底釋大模型 奠定商業版發展基礎

(中央社記者張璦台北2023年06月14日電)今天亮相
的台版AI對話引擎初代模型,能將「Taiwan’s own
Jay Chou」譯成「臺灣歌手周杰倫」,也可自動摘
要、寫信推薦台灣旅遊必去景點。國科會表示,希望
年底釋出更大的模型,後續團隊擬規劃商業授權版。

人工智慧(AI)浪潮席捲,隨英文、簡體中文版聊
天機器人相繼問世,相關爭議叢生,國科會拍板,公
私協力發展融合台灣元素、以正體中文為主的「可信
任人工智慧對話引擎」(Trustworthy AI Dialog
Engine,TAIDE),TAIDE計畫經費約新台幣2億元至
3億元。

國科會今天召開記者會,公布第一階段完成「7B」
中模型(參數量為70億),此模型是在LLaMA(Meta
推出的語言模型)原型基礎上,由國內學界專家進一
步發展及訓練調校。

何謂「7B」,國科會科技政策諮詢專家室資通訊群
組召集人李育杰解釋,參數量越多,代表這模型的複
雜度越高,訓練的成本就越大,對應的資料量也得更
大;目前ChatGPT採「GPT-3.5」模型則是175B。

談及TAIDE規劃,李育杰表示,目前展示的7B模型
可做到自動摘要、翻譯文本、寫信、寫文章等4個面
向;在記者會播放的示範影片中,7B模型可翻譯簡短
英文段落,把其中的「K-Pop sensation BTS」譯為「韓
國男子音樂團體BTS」、「Taiwan’s own Jay Chou」
翻成「臺灣歌手周杰倫」。

同時,7B模型可用寫信的方式,推薦台灣旅遊的5
個必去景點。

下一步要陸續往大模型推進,李育杰指出,第2階
段在任務處理上,包含認識台灣、事實查核與詐騙防
範,檢視模型能否成為「好幫手」。

針對第3階段的可信任模型,李育杰說明,是做到
信任的提升、阻絕涉及犯罪等不該產生的回應,同時
考量倫理因素。

李育杰表示,最後則是整合前面3階段,展示「昇
華」系統,讓任務的達成更具水準。

李育杰指出,TAIDE模型訓練由小到大,團隊在過
程中累積經驗,是「最科學、最節儉」的方式;下半
年國網中心會增設一些新設備,盼10月順利取得全球
搶單的H100新GPU,讓H100投入大模型的訓練,過了
10月也希望取得較大的算力。

此外,李育杰說,LLaMA是授權學術使用,「不拿
去賺錢、大概就沒什麼問題」;不過,呼應業界商用
及訓練需求,後續團隊擬規劃商業授權版模型,但這
就不會是在LLaMA基礎上。

他指出,業界也很想知道,訓練13B模型要投入多
少成本、基礎模型要怎麼樣Fine-Tune(微調)、後續
如何加強能力,達到真正的合用,因此團隊希望把
SOP、經驗與業界交流。

李育杰表示,未來除做源碼檢測確保資安要求,
TAIDE模型能否抵抗「越獄測試」(比如不能問涉及
犯罪問題,但換個方法問套出答案),也是關鍵,之
後會進行「紅隊演練」 (Red Teaming),由白帽駭
客尋找系統可被利用的潛在高度風險弱點。(編輯:
林興盟)1120614
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。