【字節跳動提出Omni Human多模態框架 一張圖配上音頻

【字節跳動提出Omni Human多模態框架 一張圖配上音頻即可生成逼真視頻】2月6日訊,字節跳動提出了一種名爲Omni Human的端到端多模態數字人視頻生成框架,可基於一張圖片和運動信號(如音頻、視頻或兩者)生成視頻。該框架混合數據訓練策略,科技媒體Tech Spot稱它可能是目前最逼真的深度仿真算法。不過,該框架目前暫未向公衆提供服務。
貼心提醒:
1.本公司所提供之即時報價資訊,不代表勸誘投資人進行期貨交易,且不保證此資料之正確性及完整性。
2.實際可交易商品相關資訊請以主管機關公告為限。