(文/張睿佳 編輯/張廣凱)
AI開源的風(fēng),又刮到了數(shù)字人領(lǐng)域。
3月9日,硅基智能旗下數(shù)字人模型HeyGem.ai宣布開源,截至目前,該模型在GitHub上已獲得超過1.3k Stars。
作為當(dāng)下AI行業(yè)為數(shù)不多能夠找到PMF(產(chǎn)品市場匹配)的領(lǐng)域,數(shù)字人已經(jīng)讓很多企業(yè)賺到大錢。例如專注海外市場的中國數(shù)字人企業(yè)HeyGen,在去年年中就宣布實現(xiàn)ARR(年度經(jīng)常性收入)3500萬美元。
因此,市面上好用的數(shù)字人產(chǎn)品基本都是付費,開源產(chǎn)品效果相對不佳。
但是HeyGem作為一個非常輕量化的開源免費產(chǎn)品,從演示視頻來看效果非常不錯,其官方簡介也將自己稱為HeyGen平替。
此次開源的HeyGem.ai模型,通過“1秒視頻或1張照片"的輸入,可以實現(xiàn)30秒克隆形象與聲音、60秒生成4K超清視頻,并在復(fù)雜場景下仍能保持100%口型匹配及多表情動作輸出,性能達(dá)全球TOP級水平。
技術(shù)層面,該模型的推理速度達(dá)1:0.5,32幀/秒超高清4K輸出,超越電影級標(biāo)準(zhǔn)。
同時,模型支持Docker一鍵部署,最低NVIDIA 1080Ti顯卡即可運行??梢绘I安裝于Windows和Linux系統(tǒng),在本地實現(xiàn)完整的數(shù)字人克隆和視頻合成,無需額外的算力投入。
值得注意的是,此次硅基智能在GitHub開源硅基數(shù)字人克隆模型的同時,特別提供了硅基數(shù)字人克隆同名軟件安裝包,使得即便是缺乏編程經(jīng)驗的用戶,也能在本地環(huán)境中一鍵安裝并直接使用,實現(xiàn)了零代碼門檻。
正是由于這種高質(zhì)量、低門檻的表現(xiàn),HeyGem.ai被視為首個開源免費的商用級別克隆數(shù)字人模型。對于規(guī)模巨大的電商行業(yè)來說,這無疑是一個新的營銷利器。
那么HeyGem.ai開源且好用的原因何在?
值得注意的是,硅基智能在底層技術(shù)路線上與其它產(chǎn)品有所區(qū)別。
硅基智能成立于2017年8月,總部位于中國南京,早在生成式AI技術(shù)火爆之前就已經(jīng)布局?jǐn)?shù)字人技術(shù),其底層模型專為數(shù)字人打造,并非Sora這類通用視頻生成模型,在成本端擁有天然優(yōu)勢。
而硅基智能方面也向觀察者網(wǎng)透露,既然選擇開源,就代表了技術(shù)上的自信,意味著公司將來還能夠不斷拿出更好的產(chǎn)品。
硅基智能創(chuàng)始人司馬華鵬表示,硅基智能成立之初就確立了為世界造出1億硅基生命的使命,這次開源就是為了加速這個使命的達(dá)成。
事實上,HeyGem.ai并非憑空出現(xiàn),早在2024年5月硅基智能就已率先開源了全球首個2D真人級別、支持AIGC實時渲染的數(shù)字人模型代碼——duix.ai。在GitHub上線以來,已獲得超過4.5k Stars。同年8月,硅基智能推出高保真、實時Face swap算法ReHiFace-S,只需一張照片,無需任何數(shù)據(jù)訓(xùn)練,一鍵即可將視頻中的臉部替換為你選擇的人物形象。
在實際應(yīng)用中,硅基數(shù)字人克隆能夠通過語音或文字輸入驅(qū)動,克隆后的數(shù)字人音色支持英、日、韓、中、法、德、阿拉伯和西班牙語這8種語言輸出,為跨國企業(yè)、在線教育、影視制作、直播營銷等多場景提供了高效、低成本的解決方案。
但在技術(shù)之外,面對由字節(jié)跳動等大公司推出的即夢、剪映等產(chǎn)品的競爭,對于硅基智能這類垂直企業(yè),以開源方式盡快搶占市場并搭建開發(fā)者生態(tài),或許也是商業(yè)層面必須要做出的選擇。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
本文鏈接:1張照片即可生成高清視頻,中國公司又把好用的數(shù)字人開源了http://www.lensthegame.com/show-3-107831-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 蔡崇信:AI不是少數(shù)幾家科技巨頭的獨角戲,AI開源開放將讓中小企業(yè)受益
下一篇: AI融資的明路、暗路、崎嶇路