我國自研視頻大模型面向全球上線

2024-08-02 06:38 來源：新華社

[手機(jī)看新聞] [字號大中小] [打印本稿]

　　輸入文字描述或上傳圖片，就能生成一段逼真視頻。近日，我國自主研發(fā)的通用視頻大模型Vidu（www.vidu.studio）面向全球正式上線。據(jù)悉，這款視頻大模型開放文生視頻、圖生視頻兩大核心功能，提供4秒和8秒兩種時長選擇，分辨率最高達(dá)1080P，生成一段4秒的視頻片段經(jīng)實測僅需30秒。

　　Vidu由清華大學(xué)聯(lián)合北京生數(shù)科技有限公司共同研發(fā)，于今年4月在2024中關(guān)村論壇年會上首次發(fā)布。清華大學(xué)人工智能研究院副院長、北京生數(shù)科技首席科學(xué)家朱軍介紹，Vidu具有“長時長、高一致性、高動態(tài)性”的特點，可根據(jù)文字和圖片生成高清視頻，且能保持高流暢、高動態(tài)的畫面效果。截至目前，Vidu可支持一次性生成最長32秒的視頻。

　　“Vidu能模擬真實物理世界，生成細(xì)節(jié)復(fù)雜且符合物理規(guī)律的場景，例如合理的光影效果、細(xì)膩的人物表情等，還能創(chuàng)造出具有深度和復(fù)雜性的超現(xiàn)實主義內(nèi)容�！敝燔娬f，對于科幻、西部、浪漫、動畫等多類型電影，Vidu能生成符合對應(yīng)風(fēng)格的畫面片段，還能生成影視級特效畫面，如煙霧、炫光等效果。

　　據(jù)介紹，在動態(tài)性方面，Vidu可生成復(fù)雜動態(tài)鏡頭，支持大幅度、精準(zhǔn)的動作生成，能在畫面里實現(xiàn)遠(yuǎn)景、近景、中景、特寫等不同鏡頭的切換，能直接生成長鏡頭、追焦、轉(zhuǎn)場等效果。

　　記者從北京生數(shù)科技有限公司獲悉，除文生視頻和圖生視頻的兩大基礎(chǔ)功能外，為了給用戶提供更多樣化和個性化的視頻創(chuàng)作體驗，Vidu還上線“動漫風(fēng)格”和“角色一致性”兩大新功能。在“圖生視頻”板塊中，利用“角色一致性”功能，用戶可上傳人像圖或自定義的角色圖，通過文字描述就可指定圖中角色在任意場景中做任意動作。該功能簡化了視頻制作流程，也提升了創(chuàng)作自由度。

　　據(jù)悉，操作Vidu無需申請，用戶直接使用郵箱注冊即可上手體驗。Vidu的技術(shù)突破源于研發(fā)團(tuán)隊在機(jī)器學(xué)習(xí)和多模態(tài)大模型方面的長期積累，其核心技術(shù)架構(gòu)由團(tuán)隊在2022年就提出并持續(xù)開展自主研發(fā)。（記者魏夢佳）

（責(zé)任編輯：歐云海）

虎白女粉嫩在线中国女,日本日本乱码伦视频免费,成人网站色视频免费,中文字幕乱码人在线视频1区,特黄大片做受又粗又硬又大,天天做天天爱天天综合网电影,久久人妻中出按摩

我國自研視頻大模型面向全球上線

我國自研視頻大模型面向全球上線

相關(guān)文章