近日,喜馬拉雅用單田芳AI合成音所制作的TTS(語(yǔ)音合成)專輯總播放量破億,這標(biāo)志著喜馬拉雅在現(xiàn)有的“UGC + PGC + PUGC”內(nèi)容生態(tài)之外,已經(jīng)通過(guò)AIGC探索出內(nèi)容生產(chǎn)的更多可能性。
據(jù)悉,喜馬拉雅“單田芳聲音重現(xiàn)”等賬號(hào)下上線的運(yùn)用單田芳AI合成音所制作的專輯數(shù)量已經(jīng)有100多張,總播放量超過(guò)1億。其中,有15張專輯播放量破百萬(wàn),例如,《民國(guó)四大家族》播放量近730萬(wàn),《十二金錢鏢》播放量近700萬(wàn),《臥虎藏龍全集》播放量超390萬(wàn)。
通過(guò)行業(yè)領(lǐng)先的TTS技術(shù),喜馬拉雅用AIGC引領(lǐng)長(zhǎng)音頻行業(yè)的內(nèi)容生產(chǎn)變革,讓內(nèi)容生產(chǎn)提效。與此同時(shí),喜馬拉雅還通過(guò)多項(xiàng)語(yǔ)音技術(shù)的加持,進(jìn)一步提升用戶的內(nèi)容消費(fèi)體驗(yàn)。
TTS技術(shù)完美復(fù)現(xiàn)單式評(píng)書
去年9月,在北京單田芳藝術(shù)傳播有限責(zé)任公司授權(quán)下,喜馬拉雅用TTS技術(shù)完美還原已逝的單田芳先生的聲音,并首次將單田芳先生的AI合成音全新演繹聽(tīng)眾耳熟能詳?shù)慕?jīng)典之作。
為了能最大程度保留單老那蒼勁、沙啞的獨(dú)特嗓音以及情感充沛的評(píng)書腔調(diào),喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室對(duì)單田芳先生聲音進(jìn)行潛心探索和研發(fā),通過(guò)自主設(shè)計(jì)單獨(dú)的韻律提取模塊,并將其融入到 HiTTS 技術(shù)框架中,不僅完美復(fù)現(xiàn)了單老蒼勁、沙啞的“云遮月”式獨(dú)特嗓音,就連他那情感充沛、起伏跌宕的腔調(diào)也一并保留了下來(lái),讓單老的AI合成音仿佛本尊再現(xiàn)。單田芳先生之子單瑞林也評(píng)價(jià)表示,“聽(tīng)到TTS聲音,心魂間猛然一陣,仿佛父親又回到這個(gè)世界。”
喜馬拉雅已在TTS領(lǐng)域潛心鉆研多年,并專門成立喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室,長(zhǎng)期專注于語(yǔ)音合成、識(shí)別、語(yǔ)音信號(hào)處理、編解碼以及智能音效的研究和開(kāi)發(fā)。喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室的盧恒博士表示,針對(duì)小說(shuō)的TTS系統(tǒng)和音色選取是喜馬拉雅TTS的亮點(diǎn)與特色。用真實(shí)自然的TTS音色演繹有聲小說(shuō)是非常難的,不同于普通的文字轉(zhuǎn)語(yǔ)音,用TTS音色演繹小說(shuō)需要學(xué)習(xí)小說(shuō)中的抑揚(yáng)頓挫、情感表達(dá)、上下文關(guān)系,區(qū)分旁白和對(duì)白,并最終將作品完美演繹出來(lái)。“喜馬拉雅在這方面有著天然的優(yōu)勢(shì)。在音頻賽道耕耘多年后,喜馬拉雅已經(jīng)聚集了海量有聲書內(nèi)容和眾多優(yōu)秀主播。喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室嘗試用各式的聲音來(lái)表達(dá)不同的情感、題材和頻道,因而就有了更大的試驗(yàn)和發(fā)揮空間。”
盧恒博士介紹,喜馬拉雅自研的TTS前端文本處理分析模塊已經(jīng)能夠高精度、全自動(dòng)地對(duì)文本進(jìn)行多音字識(shí)別、韻律預(yù)測(cè)和風(fēng)格分類,并已開(kāi)發(fā)出可以實(shí)現(xiàn)多情感、多風(fēng)格、多語(yǔ)種聲音的TTS技術(shù)模型,不僅可以演繹不同情緒的文字,還可以自動(dòng)區(qū)分旁白、對(duì)白,并支持英文,極大地豐富了TTS能表達(dá)的情感和韻律。
目前,喜馬拉雅已申請(qǐng)了20多項(xiàng)語(yǔ)音技術(shù)相關(guān)專利,其中有10多項(xiàng)TTS語(yǔ)音合成相關(guān)專利。 今年,還有兩項(xiàng)語(yǔ)音技術(shù)成果先后被世界頂尖學(xué)術(shù)會(huì)議“2022年IEEE國(guó)際音頻、語(yǔ)音與信號(hào)處理會(huì)議”收錄,展現(xiàn)了喜馬拉雅強(qiáng)大的語(yǔ)音技術(shù)實(shí)力。
AIGC助力內(nèi)容生產(chǎn)提效
通過(guò)行業(yè)領(lǐng)先的TTS技術(shù),喜馬拉雅成為音頻領(lǐng)域AIGC的先行者。除了評(píng)書,喜馬拉雅多情感、多風(fēng)格、多語(yǔ)種聲音的TTS技術(shù)模型已經(jīng)廣泛被運(yùn)用于新聞、小說(shuō)、財(cái)經(jīng)專輯等多種內(nèi)容的制作中。喜馬拉雅簽約和制作了不同的TTS音色,來(lái)適配不同的內(nèi)容、滿足用戶多樣的需求。
例如,喜馬拉雅原創(chuàng)TTS音色“喜曉峰”和“槍槍”已被應(yīng)用于《聽(tīng)秦說(shuō)》《36氪·氪金大事件》《海清評(píng)財(cái)經(jīng) | 股票、債券及基金投資的一線參謀》等財(cái)經(jīng)專輯內(nèi)容中。其中,“秦朔朋友圈”賬號(hào)下《聽(tīng)秦說(shuō)》專輯過(guò)去更新頻率為每周一次,但在采用喜馬拉雅TTS技術(shù)后,開(kāi)始每日更新。
“秦朔朋友圈”發(fā)起人、中國(guó)商業(yè)文明研究中心聯(lián)席主任及《聽(tīng)秦說(shuō)》主播秦朔表示,過(guò)去沒(méi)有使用喜馬拉雅TTS技術(shù)時(shí),需要真人錄制專輯內(nèi)容,耗時(shí)長(zhǎng),更新頻率低,而使用TTS技術(shù)后,內(nèi)容生產(chǎn)效率大幅提升,可以讓“秦朔朋友圈”的文章即時(shí)音頻更新,輕輕松松便實(shí)現(xiàn)了日更,專輯的播放量和互動(dòng)數(shù)據(jù)都顯著提升。
除此之外,新京報(bào)、環(huán)球時(shí)報(bào)、瀟湘晨報(bào)、時(shí)代周報(bào)、海外網(wǎng)、刺猬公社等數(shù)十家媒體也通過(guò)喜馬拉雅多種標(biāo)準(zhǔn)普通話男聲和女聲的TTS音色上線了超過(guò)40張TTS專輯。
今年,喜馬拉雅基于自研的TTS框架,采集頭部主播“喜道公子”的真聲打造的AI主播“喜小道”,與AI續(xù)寫應(yīng)用“彩云小夢(mèng)”合作,打造了首個(gè)從故事創(chuàng)作到演播均由AI完成的AI電臺(tái)。
AIGC不僅助力喜馬拉雅和內(nèi)容創(chuàng)作者實(shí)現(xiàn)內(nèi)容生產(chǎn)提效,推動(dòng)創(chuàng)作者布局音頻,實(shí)現(xiàn)轉(zhuǎn)型升級(jí),也給用戶帶來(lái)更豐富的內(nèi)容。
AI技術(shù)助力內(nèi)容體驗(yàn)增值
與此同時(shí),喜馬拉雅也通過(guò)TTS、ASR、語(yǔ)音信號(hào)處理算等多種AI技術(shù)進(jìn)一步提升用戶的內(nèi)容消費(fèi)體驗(yàn)。
目前,喜馬拉雅已經(jīng)與近百家網(wǎng)絡(luò)平臺(tái)和出版機(jī)構(gòu)合作上線近6萬(wàn)本電子書,而TTS技術(shù)能為這些電子書實(shí)時(shí)生成TTS聲音,讓用戶可以邊聽(tīng)邊看,從而為用戶帶來(lái)“聽(tīng)看一體”的內(nèi)容服務(wù)。
近期,喜馬拉雅又利用行業(yè)領(lǐng)先的自動(dòng)語(yǔ)音識(shí)別技術(shù)(ASR)以及對(duì)齊算法,上線了全新版本的AI文稿功能,用戶在收聽(tīng)喜馬拉雅音頻內(nèi)容的時(shí)候,也可以在收聽(tīng)頁(yè)面同步閱讀相應(yīng)的文字內(nèi)容,享受“邊聽(tīng)邊看”、“聽(tīng)看一體“的內(nèi)容消費(fèi)體驗(yàn)。
全新上線的AI文稿功能,能有效識(shí)別無(wú)文稿聲音內(nèi)容,為其自動(dòng)生成文稿;對(duì)于已經(jīng)有原始文稿的聲音內(nèi)容,則采用超長(zhǎng)音頻與文本的對(duì)齊技術(shù),將聲音與文稿進(jìn)行時(shí)間戳對(duì)軌,從而在聲音播放的同時(shí),對(duì)相應(yīng)文字進(jìn)行同步高亮,實(shí)現(xiàn)聲字同步,讓用戶能更便捷地享受邊聽(tīng)邊看的內(nèi)容消費(fèi)體驗(yàn)。這不僅進(jìn)一步提升用戶體驗(yàn),有利于增強(qiáng)用戶粘性,也使用戶能夠在不同場(chǎng)景中,自由切換聽(tīng)和看兩種形式,暢享喜馬拉雅平臺(tái)上的豐富內(nèi)容,進(jìn)一步拓展了喜馬拉雅的多元化使用場(chǎng)景。
喜馬拉雅還通過(guò)語(yǔ)音信號(hào)處理算法(SSP)率先在長(zhǎng)音頻領(lǐng)域帶來(lái)智能音效,推出超重低音、劇院混響、清澈人聲三種喜馬拉雅專屬音效,讓用戶可以為不同內(nèi)容匹配不同音效,享受更加優(yōu)質(zhì)的收聽(tīng)體驗(yàn)。接下來(lái),喜馬拉雅將上線更多的專屬音效,為用戶提供更加多樣的收聽(tīng)選擇。
喜馬拉雅作為深受用戶喜愛(ài)的在線音頻平臺(tái),始終堅(jiān)持以科技賦能文化。未來(lái),喜馬拉雅將繼續(xù)讓技術(shù)賦能創(chuàng)作者、服務(wù)用戶,讓內(nèi)容生產(chǎn)提效,讓內(nèi)容體驗(yàn)增值,用技術(shù)加持聲音、用聲音服務(wù)生活。
本文鏈接:喜馬拉雅ipo用科技賦能文化: 用AI技術(shù)讓內(nèi)容生產(chǎn)提效http://www.lensthegame.com/show-1-3844-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 旗修堂高端年份燕屋燕窩引領(lǐng)燕窩產(chǎn)業(yè)新標(biāo)準(zhǔn),加里曼丹——燕窩界傳奇般的存在