GPT-4o的奇怪行爲揭祕:OpenAI新語音AI的意外怪異

OpenAIGPT-4o是一種生成式人工智能模型,它爲最近推出的ChatGPT高級語音模式alpha版本提供了支持。這導致它有時會表現得很奇怪——比如模仿與它說話的人的聲音,或者在對話中隨意大喊大叫。

OpenAI在一份新的報告中記錄了該模型的優勢和風險,並揭示了GPT-4o的一些怪癖,比如前面提到的模仿說話人的聲音OpenAI說,在極少數情況下,尤其是當一個人在背景噪聲較大的環境GPT-4o對話時,比如在路上的汽車裏,GPT-4o模仿用戶的聲音。爲什麼?OpenAI認爲,這是因爲模型難以理解畸形語音這很有道理!

OpenAI發言人表示,該公司針對這種行爲添加了系統級緩解措施

GPT-4o還容易在特定提示下產生令人不安或不恰當的非語言發聲和音效,如暴力尖叫和槍聲。OpenAI表示,有證據表明該模型通常會拒絕生成音效的請求,但也承認確實有一些請求得以通過。

GPT-4o還可能侵犯音樂版權——或者說,如果OpenAI沒有實施過濾器來防止侵權的話。OpenAI在報告中說,它指示GPT-4o在高級語音模式下不要唱歌,大概是爲了避免複製知名藝術家的風格、音調和/或音色。

這意味著——但並沒有直接證實——OpenAI在訓練GPT-4o時使用了受版權保護的材料。目前尚不清楚的是,OpenAI是否打算在秋季向更多用戶推出高級語音模式時取消這些限制。

爲了考慮到GPT-4o的音頻模式,我們更新了某些基於文本的過濾器,使其適用於音頻對話,並建立了過濾器來檢測和阻止包含音樂的輸出,OpenAI在報告中寫道。我們對GPT-4o進行了培訓,使其能夠拒絕包括音頻在內的受版權保護內容的請求,這與我們更廣泛的實踐是一致的。

值得注意的是,OpenAI最近表示,如果不使用受版權保護的資料,就不可能訓練出當今領先的模型。雖然該公司與數據提供商達成了多項許可協議,但它也堅持認爲,對於未經許可使用受知識產權保護的數據(包括歌曲等)進行訓練的指控,合理使用是一個合理的辯護理由。

鑑於OpenAI在這場競賽中的優勢,這份報告的價值在於,它確實從整體上描繪了一幅人工智能模型的圖景,通過各種緩解措施和保障措施,該模型變得更加安全。例如,GPT-4o拒絕根據說話方式識別人的身份,拒絕回答這個說話者有多聰明之類的問題。它還會阻止暴力和色情語言的提示,並完全禁止某些類別的內容,如有關極端主義和自殘的討論。

貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。