GPT-4o的奇怪行爲揭祕：OpenAI新語音AI的意外怪異

金十數據

OpenAI的GPT-4o是一種生成式人工智能模型，它爲最近推出的ChatGPT高級語音模式alpha版本提供了支持。這導致它有時會表現得很奇怪——比如模仿與它說話的人的聲音，或者在對話中隨意大喊大叫。

OpenAI在一份新的報告中記錄了該模型的優勢和風險，並揭示了GPT-4o的一些怪癖，比如前面提到的模仿說話人的聲音。OpenAI說，在極少數情況下，尤其是當一個人在“背景噪聲較大的環境”中與GPT-4o對話時，比如在路上的汽車裏，GPT-4o會“模仿用戶的聲音”。爲什麼？OpenAI認爲，這是因爲模型難以理解畸形語音。這很有道理！

OpenAI發言人表示，該公司針對這種行爲添加了“系統級緩解措施”。

GPT-4o還容易在特定提示下產生令人不安或不恰當的“非語言發聲”和音效，如暴力尖叫和槍聲。OpenAI表示，有證據表明該模型通常會拒絕生成音效的請求，但也承認確實有一些請求得以通過。

GPT-4o還可能侵犯音樂版權——或者說，如果OpenAI沒有實施過濾器來防止侵權的話。OpenAI在報告中說，它指示GPT-4o在高級語音模式下不要唱歌，大概是爲了避免複製知名藝術家的風格、音調和/或音色。

這意味著——但並沒有直接證實——OpenAI在訓練GPT-4o時使用了受版權保護的材料。目前尚不清楚的是，OpenAI是否打算在秋季向更多用戶推出高級語音模式時取消這些限制。

“爲了考慮到GPT-4o的音頻模式，我們更新了某些基於文本的過濾器，使其適用於音頻對話，並建立了過濾器來檢測和阻止包含音樂的輸出，”OpenAI在報告中寫道。“我們對GPT-4o進行了培訓，使其能夠拒絕包括音頻在內的受版權保護內容的請求，這與我們更廣泛的實踐是一致的。”

值得注意的是，OpenAI最近表示，如果不使用受版權保護的資料，就“不可能”訓練出當今領先的模型。雖然該公司與數據提供商達成了多項許可協議，但它也堅持認爲，對於未經許可使用受知識產權保護的數據（包括歌曲等）進行訓練的指控，合理使用是一個合理的辯護理由。

鑑於OpenAI在這場競賽中的優勢，這份報告的價值在於，它確實從整體上描繪了一幅人工智能模型的圖景，通過各種緩解措施和保障措施，該模型變得更加安全。例如，GPT-4o拒絕根據說話方式識別人的身份，拒絕回答“這個說話者有多聰明”之類的問題。它還會阻止暴力和色情語言的提示，並完全禁止某些類別的內容，如有關極端主義和自殘的討論。

貼心提醒:
1.本公司所提供之即時報價資訊，不代表勸誘投資人進行期貨交易，且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。

據伊朗國家電臺（IRIB）：伊朗爲革命衛隊海軍增加了“大量”

【國家外匯管理局：上半年服務貿易收支平穩增長】8月9日訊，國

留言請登入帳號