12月16日,字節(jié)跳動Seed發(fā)布了新一代音視頻創(chuàng)作模型Seedance1.5pro,該模型支持音視頻聯(lián)合生成,能夠執(zhí)行從文本到音視頻的合成以及圖像引導(dǎo)的音視頻生成等多種任務(wù)。與1.0版本相比,Seedance1.5pro不僅支持音頻同步生成,還致力于提升視覺沖擊力和運(yùn)動效果,通過大膽的技術(shù)方案,在視聽協(xié)同、視覺張力和敘事協(xié)調(diào)性等方面實(shí)現(xiàn)突破。
Seedance1.5pro在音畫同步與多語言、方言支持方面表現(xiàn)出色,模型在生成中實(shí)現(xiàn)了較高的視聽一致性,提升了角色的口型、語調(diào)與表演節(jié)奏的擬合精度。此外,模型原生支持多語種和特色方言口音,能夠捕捉其獨(dú)有的語音韻律與情感張力。在運(yùn)鏡控制與動態(tài)張力方面,模型具備自發(fā)的鏡頭調(diào)度能力,可執(zhí)行長鏡頭跟隨、希區(qū)柯克變焦等高難度運(yùn)鏡,同時(shí)還能實(shí)現(xiàn)電影級的畫面銜接與專業(yè)影調(diào),提升了視頻的動態(tài)張力。
Seedance1.5pro通過增強(qiáng)語義理解,實(shí)現(xiàn)了對敘事語境的較好解析,提升了音視頻段落的整體敘事協(xié)調(diào)性,為專業(yè)級內(nèi)容創(chuàng)作提供支撐。字節(jié)跳動Seed表示,在綜合評測中,Seedance1.5pro各項(xiàng)關(guān)鍵能力處于“業(yè)界前列”。目前,Seedance1.5pro已上線即夢AI和豆包平臺。



來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(www.idc61.net)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。