• 正文
    • 01.基于海量素材,AI一鍵生成文字轉(zhuǎn)視頻
    • 2.一鍵合成定制AI數(shù)字人,堪比真人交互體驗
    • 3.大模型落地移動生態(tài),AI原生創(chuàng)作工具出圈
    • 4.結(jié)語:文心大模型加速落地,開創(chuàng)視頻創(chuàng)作新玩法
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

有這款A(yù)I原生視頻“神器”,創(chuàng)作者的職業(yè)天花板要沖破了?

2023/12/19
1827
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 |??三北,編輯?|??漠影

實測一鍵AI生成視頻,數(shù)字人堪比真人主播。

大模型將如何變革內(nèi)容創(chuàng)作行業(yè)?在PC時代,主要是剪輯師利用專業(yè)軟件制作視頻;在App時代,非專業(yè)人士也開始使用移動端工具創(chuàng)作視頻,打造自媒體;進入AI時代,隨著生成式AI技術(shù)爆發(fā),行業(yè)又會有哪些新變化?百度旗下一款名為“度加”的AI視頻創(chuàng)作工具,試圖用一系列創(chuàng)新功能回答這些問題。在度加上,創(chuàng)作者輸入一篇文案,便能生成一段素材豐富的視頻?!咐短﹪啬虾由闲蕾p夕陽》展示它支持對文案、標題、視頻素材進行一鍵AI潤色,幫創(chuàng)作者節(jié)省大量編輯修改的時間。

如果連腳本都不想寫?用戶可以使用度加的AI改寫功能,或基于熱點新聞直接生成文案腳本。不僅能生成所需視頻,還能準確追溯信源。

還想要一個主播出鏡?近十款風(fēng)格不同的AI數(shù)字人可供選擇,一分鐘生成逼真的主播報幕。

AI生成視頻賽道加速爆發(fā),百度正用一款A(yù)I原生的視頻創(chuàng)作工具開啟視頻行業(yè)的新玩法。度加的真實使用體感如何?它能為創(chuàng)作者帶來什么實在的便利?又是否會成為新的AIGC爆款產(chǎn)品?通過上手體驗度加剪輯App和度加創(chuàng)作工具PC客戶端,智東西對這些問題進行了深入探討。

01.基于海量素材,AI一鍵生成文字轉(zhuǎn)視頻

一個視頻創(chuàng)作者日常會有這些繁瑣工作:提選題、找素材、寫腳本、剪輯包裝、運營發(fā)布……如果有一個AI助手會怎么樣?智東西首先從文轉(zhuǎn)視頻、AI文案和熱點創(chuàng)作三個方面,體驗了度加帶來的視頻創(chuàng)作新玩法。1、輸入文案匹配視頻,5分鐘完成AI人機協(xié)作打開度加剪輯App,智東西首先通過“AI成片”板塊的文生視頻功能,做了一個新聞短視頻?!咐恶R斯克終于承認了一款低價新車》展示操作十分簡單——進入度加的“AI成片”板塊,我將提前寫好的文案粘貼到文本框中,點擊“一鍵成片”,大功告成了一大半。

僅約30秒后,一個素材豐富的視頻就成功生成了。頁面簡潔,上側(cè)顯示著視頻預(yù)覽,下方是可編輯的音視頻軌道。

觀看視頻預(yù)覽,視頻與文本匹配十分精準。對于個別未匹配到的或可以優(yōu)化的素材,智東西點擊“素材推薦”,便在素材庫中一鍵選擇新的視頻插入。

也可以通過插入本地素材,將自己此前下載的新聞視頻補充進來,進一步完善了剛剛生成的視頻。

最后,經(jīng)過對視頻模板、朗讀音、背景音樂等方面的簡單調(diào)整,一個人機協(xié)同創(chuàng)作的視頻就生成了,前后僅花了不到10分鐘。

同樣的體驗,在度加創(chuàng)作工具PC端上能夠如法炮制,智東西也進行了測評,獲得了一致的體驗。

2、細節(jié)里都是AI,從腳本、標題到視頻素材全都能潤色

度加上,AI融入到了創(chuàng)作的各個環(huán)節(jié)。比如在《泰國湄南河上欣賞夕陽》視頻的創(chuàng)作中,智東西就在文案腳本、標題擬定、視頻素材替換等環(huán)節(jié)用到了AI功能?!咐短﹪啬虾由闲蕾p夕陽》展示當智東西將游覽了泰國鄭王廟時寫的一段游記填入到文本框,我立刻獲得了AI生成的視頻腳本,語言更生動和口語化。

點擊“生成視頻”,可以看到一個準確網(wǎng)羅了泰國鄭王廟素材的視頻,畫面里的河水、夕陽、游輪等意象與文字描述精準匹配。點擊發(fā)布,我根據(jù)AI推薦換了一個更具有話題度的標題——《30泰銖體驗湄南河夕陽游輪,浪漫之旅》,然后就能立馬同步到我的百家號賬號,還可以下載并上傳到其他平臺。

可以看到,AI都藏在了這個軟件的各個細節(jié)里,等待用戶探索。3、熱點推薦,文案也不用寫了,全都用AI生成上面提到的都是有文案的基礎(chǔ)上AI成片,如果我還沒有文案,甚至沒有選題思路,該怎么辦呢?度加可以實現(xiàn)“找選題-寫腳本-生成視頻”全流程AI包辦。基于此,智東西制作了題為《王陽明心學(xué)精髓是什么》的短視頻?!咐锻蹶柮餍膶W(xué)精髓是什么》展示當智東西點擊熱門推薦榜單中的“王陽明心學(xué)精髓是什么”話題,點擊“生成文案”,一個腳本文案在30秒左右立馬生成。

我可以在此基礎(chǔ)上進行編輯,然后點擊“去創(chuàng)作”,短短幾十秒之后,一個圖文并茂的短視頻就生成了。視頻素材匹配準確,基本無需修改就能直接用。

這一功能在度加創(chuàng)作工具PC端上同樣適用。新聞講求真實性,信源追溯對自媒體創(chuàng)作來說至關(guān)重要。通過點擊度加推薦熱點旁的“搜索”符號,我發(fā)現(xiàn)能快速獲取第一信源,從而對事實有一個及時了解。比如當我在度加創(chuàng)作工具PC端,點擊“羅永浩支持董宇輝創(chuàng)業(yè)”這一話題旁的“搜索”,我很快地找到了新聞的第一手信源,看到了羅永浩發(fā)的微博原文,這對核實信息來說十分實用。

可以看到,基于百度移動生態(tài)能力,度加已經(jīng)落地了相對成熟的文稿轉(zhuǎn)視頻能力。相比于剪映、快影等市面上的其他剪輯工具,度加或許開辟了新一代的AI視頻創(chuàng)作玩法。用戶點擊熱點,會自動生成視頻文稿,然后文稿會轉(zhuǎn)成視頻,幾次點擊就能生成質(zhì)量不錯的視頻。用戶在操作完成后,還可以對素材、字幕等細節(jié)進行檢查和修改。度加相關(guān)負責(zé)人告訴智東西,團隊目前正在積極探索原生視頻技術(shù),會在2024年逐步落地在度加產(chǎn)品上。

2.一鍵合成定制AI數(shù)字人,堪比真人交互體驗

生成式AI還帶來了AI數(shù)字人的爆發(fā),這是度加的另一大殺手锏。在度加剪輯App上,智東西看到有近十款風(fēng)格各異的AI數(shù)字人可供選擇。其中既有正式西裝的精英,又有形象溫婉的鄰家姐姐,從五官細節(jié)到動作表情都十分逼真。比如,智東西就用正式西裝AI數(shù)字人模板,生成了一個題為《零下34度電動車好開嗎?》的視頻。而全程,也不過花了5分鐘左右,這可比真人錄制要快得多?!咐读阆?4度電動車好開嗎?》展示智東西先是直接粘貼了預(yù)先寫好的文案,然后點擊“生成視頻”。

在經(jīng)過近1分鐘的等待后,一個逼真的數(shù)字人的口播初版視頻就形成了。

接下來,我又進行了AI輔助的二創(chuàng)。AI會自動識別文案中的關(guān)鍵詞,并提供相關(guān)素材的推薦,供我插入視頻,豐富鏡頭語言。

比如度加就自動識別了“特斯拉”一詞,推薦了一系列特斯拉相關(guān)視頻供我選擇插入,智東西便選擇了一個插入。

對于度加沒自動選中的詞,比如“家用充電樁”,智東西自己抹選并在度加素材庫里挑選了對應(yīng)視頻,與數(shù)字人口播進行了穿插播放。

經(jīng)過多處關(guān)鍵詞的素材選擇和插入,一個主播和視頻素材混剪的視頻就生成了。AI數(shù)字人創(chuàng)作同樣支持熱點推薦和AI文案。比如當我輸入一段較官方的“北京發(fā)布大模型三大重要成果”為主題的文案,度加可以用AI幫我改寫出一段更簡潔、口語化的腳本。檢查發(fā)現(xiàn),這段話無需修改就能直接用。

如下所示,這是生成式數(shù)字人口播視頻?!咐侗本┌l(fā)布大模型三大重要成果》展示度加相關(guān)負責(zé)人告訴智東西,數(shù)字人目前對于各行業(yè)的觸達效果比較明顯,用戶對于數(shù)字人的接受程度和認知也越來越高,不再是單一的“紙片人”,而是擁有著更多形態(tài)、性格、語言方式的“數(shù)字生命”。與剪映、快影等其他同行相比,度加的數(shù)字人功能已經(jīng)可以覆蓋到各個領(lǐng)域的創(chuàng)作者,范圍廣泛,例如知識型創(chuàng)作者、娛樂和熱點類創(chuàng)作者、美妝和醫(yī)美賽道創(chuàng)作者……各行各業(yè)的創(chuàng)作者們都可以使用度加數(shù)字人進行內(nèi)容創(chuàng)作,讓AI為內(nèi)容創(chuàng)作賦能。

3.大模型落地移動生態(tài),AI原生創(chuàng)作工具出圈

度加相關(guān)負責(zé)人告訴智東西,視頻創(chuàng)作的發(fā)展歷程可以大概劃分為三個階段:一是PC時代,以Premiere和After Effects等傳統(tǒng)編輯器為主,學(xué)習(xí)成本較高,主要是專業(yè)的剪輯師在使用,日活躍用戶在百萬量級。二是App時代,以快影和剪映等移動端產(chǎn)品為主,操作成本低,用戶上傳一張圖片就能通過模版變?yōu)橐曨l,不需要學(xué)習(xí)剪輯技巧,全球日活躍用戶接近1億。三是AI時代,用戶只需要輸入Prompt(提示詞),就能生成視頻,操作成本進一步降低,生產(chǎn)的效果極具創(chuàng)意,不再受限于用戶已有的圖片和視頻素材,未來產(chǎn)品的日活躍用戶會達到5億+。

那么在AI時代,視頻生產(chǎn)的“AI原生”意味著什么?

“重點還是需要明確用戶在創(chuàng)作過程中,是AI+而不是+AI 。”度加相關(guān)負責(zé)人稱,“我們所推進的AI+,正是端到端的通過AI來進行提效或者創(chuàng)作生成?!?strong>度加AI原生創(chuàng)作者使用度加的產(chǎn)品功能,就可以享受到AI+的創(chuàng)作支持。這離不開百度移動生態(tài)豐富的素材支持。百度擁有百家號海量素材庫實時更新,視覺中國圖片庫豐富且質(zhì)量較高;在追熱點方面,熱點事件半小時內(nèi)入庫,實時更新,覆蓋廣泛垂類,助媒體人追熱點快人一步。同時,度加基于百度集團文心大模型的深厚底座支持,并在AI數(shù)字人、AI文案等賽道具有多年的經(jīng)驗積累,這都使得度加的AI功能的性能更佳,使用體驗更流暢,從而做到真正的降本增效。

4.結(jié)語:文心大模型加速落地,開創(chuàng)視頻創(chuàng)作新玩法

一鍵生成文字轉(zhuǎn)視頻,一分鐘合成定制AI數(shù)字人,百度通過一款產(chǎn)品開啟了AI原生視頻創(chuàng)作的新玩法。經(jīng)過體驗,我們發(fā)現(xiàn)通用AI人機協(xié)同創(chuàng)作的雛形,已經(jīng)在這一名為“度加”的產(chǎn)品里有所體現(xiàn)。背后,百度將其移動生態(tài)大量級素材與文心大模型相結(jié)合,打通了技術(shù)與應(yīng)用場景的“最后一公里”,從而開創(chuàng)了視頻創(chuàng)作的新玩法。度加的上線只是一個開始,AI文生原生視頻等新功能也正在迭代計劃中。百度能否在AI時代持續(xù)占領(lǐng)內(nèi)容創(chuàng)作行業(yè)的先機,我們將持續(xù)關(guān)注。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATSAM4S16BA-AU 1 Atmel Corporation RISC Microcontroller, 32-Bit, FLASH, CORTEX-M4 CPU, 120MHz, CMOS, PQFP64, LQFP-64

ECAD模型

下載ECAD模型
$7.22 查看
MC56F8323VFBE 1 Freescale Semiconductor 16-bit DSC, 56800E core, 32KB Flash, 60MHz, QFP 64

ECAD模型

下載ECAD模型
$14.69 查看
ATXMEGA64A3U-AU 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM THICKNESS, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

ECAD模型

下載ECAD模型
$4.53 查看
百度

百度

百度是擁有強大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關(guān)推薦