AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能-創(chuàng)新互聯(lián)

2016年,美國(guó)一位科技記者James Vlahos,做了一件感動(dòng)無(wú)數(shù)人的事。

創(chuàng)新互聯(lián)堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站制作、做網(wǎng)站、外貿(mào)營(yíng)銷(xiāo)網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿(mǎn)足客戶(hù)于互聯(lián)網(wǎng)時(shí)代的固安網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!

他在父親臨終前幾個(gè)月,下定決心要把父親的聲音和教誨永遠(yuǎn)留在身邊。于是非技術(shù)背景的James在一個(gè)AI項(xiàng)目的幫助下,自學(xué)語(yǔ)音合成與機(jī)器學(xué)習(xí)。在父親的幫助下,他每天錄制父親一到兩個(gè)小時(shí)的聲音,共記錄了9萬(wàn)多個(gè)單詞用來(lái)訓(xùn)練AI模型。最終完成了由父親聲音構(gòu)成的,類(lèi)似siri的語(yǔ)音助手,得以讓James時(shí)時(shí)寄托哀思。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

這個(gè)故事在感動(dòng)了全球無(wú)數(shù)家庭的同時(shí),也讓AI開(kāi)發(fā)者與技術(shù)人員看到了用AI語(yǔ)音定制化的重要意義。毫無(wú)疑問(wèn),全球眾多家庭都在渴望著類(lèi)似功能,無(wú)論是記錄老人的聲音,讓自己的聲音能夠更多陪伴孩子成長(zhǎng),還是戀人之間的聲音陪伴,家庭,正在成為AI語(yǔ)音技術(shù)應(yīng)用場(chǎng)景的主戰(zhàn)場(chǎng)。

這種需求也在不斷受到產(chǎn)業(yè)界的重視。近來(lái)幾年,語(yǔ)音合成、聲音克隆等技術(shù)相繼發(fā)展,自然語(yǔ)言處理整體能力也得到了突飛猛進(jìn)的發(fā)展。AI語(yǔ)音定制化這件事,也早已不用耗時(shí)幾個(gè)月,用數(shù)萬(wàn)條語(yǔ)料進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,而是真正的“飛入尋常百姓家”。

3月初,一直對(duì)AI技術(shù)大舉投入的百度,在小度音箱中上線(xiàn)了語(yǔ)音定制功能。在小度APP中“爸媽講故事”這個(gè)功能場(chǎng)景,用戶(hù)可以錄制自己和家人的語(yǔ)音包。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

這是對(duì)話(huà)式AI硬件中,首次出現(xiàn)用戶(hù)語(yǔ)音定制能力。當(dāng)用戶(hù)可以定制自己的語(yǔ)音包,讓智能音箱不斷傳來(lái)自己的聲音,眾多行業(yè)規(guī)則似乎都在發(fā)生變化。

讓我們從語(yǔ)音合成、對(duì)話(huà)式AI,以及智能語(yǔ)音硬件三者發(fā)展的合流中,審視一下進(jìn)入AI語(yǔ)音定制時(shí)代的2020,可能發(fā)生的三個(gè)改變。

門(mén)檻已去:AI語(yǔ)音進(jìn)入定制化時(shí)代

事實(shí)上,AI語(yǔ)音定制的能力,一直都處在AI行業(yè)與用戶(hù)的高度期待里。一方面讓AI模擬用戶(hù)聲音,關(guān)乎家庭、陪伴、記憶等諸多社會(huì)情感因素;另一方面熟悉的聲音可能觸發(fā)很多新的應(yīng)用想象,比如你可能懶得打開(kāi)音頻課,但如果你的愛(ài)豆或者女神給你上音頻課,你可能都懶得睡覺(jué)。

因此,AI語(yǔ)音定制的工程化與商業(yè)應(yīng)用,始終被抱以高度期待。這條技術(shù)線(xiàn)索可以說(shuō)是AI語(yǔ)音硬件,比如智能音箱、智能屏等產(chǎn)品持續(xù)發(fā)展的奇兵。

而AI語(yǔ)音定制的相關(guān)技術(shù),在過(guò)去幾年間迎來(lái)了不斷降低門(mén)檻、提升應(yīng)用規(guī)模的過(guò)程。James Vlahos用了9萬(wàn)多條語(yǔ)料進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,但如今只需要幾分鐘就可以訓(xùn)練出語(yǔ)義理解和自然語(yǔ)言處理效果遠(yuǎn)遠(yuǎn)超過(guò)siri的定制化語(yǔ)音模型。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

近幾年,隨著技術(shù)的升級(jí),定制用戶(hù)語(yǔ)音的相關(guān)產(chǎn)業(yè)探索一直在前進(jìn)。比如一個(gè)名為Revoice的公益項(xiàng)目,希望能夠幫助漸凍癥患者留住自己的聲音;而汽車(chē)AI廠(chǎng)商Cerence在去年推出了創(chuàng)建用戶(hù)聲音語(yǔ)音助手的功能;微軟的Custom Voice服務(wù),可以一定程度上讓用戶(hù)聲音成為小冰的語(yǔ)音。去年,“語(yǔ)音定制功能”開(kāi)始被應(yīng)用到地圖場(chǎng)景,用戶(hù)在百度地圖APP上錄制20句話(huà),就能夠生成個(gè)人完整語(yǔ)音包。

如今,定制化語(yǔ)音的功能來(lái)到了最復(fù)雜的AI場(chǎng)景里:對(duì)話(huà)式AI設(shè)備。

在小度語(yǔ)音定制功能中,用戶(hù)進(jìn)入小度APP,就可以在“爸媽講故事”這個(gè)功能里錄制自己的專(zhuān)屬語(yǔ)音包。談不上多復(fù)雜,3-5分鐘就可以錄好,錄制的聲音可以播講大段的故事,并且語(yǔ)氣、語(yǔ)調(diào)、頓挫感在百度的AI語(yǔ)音能力加持下非常逼真,沒(méi)有異樣感。

這意味著,AI定制語(yǔ)音的能力已經(jīng)基本不再存在任何用戶(hù)門(mén)檻,我們不用學(xué)習(xí)復(fù)雜的技術(shù),浪費(fèi)大量時(shí)間,忍受一次次的失敗。用戶(hù)將以非常簡(jiǎn)單的方式,就能夠利用智能語(yǔ)音定制來(lái)展開(kāi)實(shí)現(xiàn)家庭場(chǎng)景中的應(yīng)用。語(yǔ)音定制的產(chǎn)業(yè)化通道也就此展開(kāi)。

在另一條軌跡上,我們可以將其看作智能語(yǔ)音助手和對(duì)話(huà)式AI硬件的整體進(jìn)化。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

從2015年,亞馬遜的Ehco誕生起,語(yǔ)音助手就處在用機(jī)器音一問(wèn)一答的基本能力里。用戶(hù)時(shí)常找不到繼續(xù)說(shuō)下去的動(dòng)力。一問(wèn)一答模式也與真人交互并不相似。

2019年,小度助手實(shí)現(xiàn)了全雙工免喚醒能力,可以一次喚醒多次交互,終于讓多輪對(duì)話(huà)在硬件中得以實(shí)現(xiàn),聊天開(kāi)始形似真人。

而AI語(yǔ)音定制的能力,或許可以看作2020年智能語(yǔ)音助手和相關(guān)硬件的又一次升級(jí),用戶(hù)可以借此實(shí)現(xiàn)千人千面的AI硬件,開(kāi)發(fā)者有了新的開(kāi)發(fā)基礎(chǔ)。連鎖發(fā)生的產(chǎn)業(yè)化影響也能夠隨之展開(kāi)。

飯圈&家庭:兩個(gè)場(chǎng)景的AI硬件或爆發(fā)

AI語(yǔ)音定制化帶來(lái)的第一個(gè)改變,就是用戶(hù)可能會(huì)重新開(kāi)始思考自己如何應(yīng)用對(duì)話(huà)式AI硬件,以及為什么購(gòu)買(mǎi)相關(guān)產(chǎn)品。

有了AI語(yǔ)音定制能力后,有兩個(gè)商業(yè)場(chǎng)景的改變是顯而易見(jiàn)的。首先在家庭場(chǎng)景中,定制家人聲音這一能力其實(shí)至關(guān)重要。因?yàn)榧胰说穆曇舸碇惆?、依靠和溫暖,這是人之天性,無(wú)法在任何時(shí)代改變。用父母的聲音給孩子講故事、講知識(shí),讓子女的聲音在智能音箱中陪伴著父母,給父母報(bào)時(shí)間,念新聞。這些溫暖的應(yīng)用,是中國(guó)人的普遍需求,也是繁忙都市工作下的必然選擇。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

今天的情況就是一個(gè)很好的例證,疫情推遲了復(fù)工,這讓很多父母有了更多時(shí)間陪伴孩子,從而產(chǎn)生了“疫情下的父母依賴(lài)”。但返工開(kāi)始,父母不得已又將離開(kāi)孩子怎么辦?在智能音箱家庭使用場(chǎng)景下,語(yǔ)音定制功能就給出了一個(gè)選項(xiàng)。

另一方面,AI語(yǔ)音定制功能的更大紅利還要看飯圈。這幾天飯圈的能量之大,讓整個(gè)社會(huì)頗為領(lǐng)教。那么讓愛(ài)豆的聲音不僅僅出現(xiàn)在地圖導(dǎo)航,而是時(shí)時(shí)留存在智能產(chǎn)品中,與自己時(shí)時(shí)對(duì)話(huà),聊天、講故事、玩游戲——以此產(chǎn)生的購(gòu)買(mǎi)力和再開(kāi)發(fā)能力,簡(jiǎn)直不敢細(xì)想。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

這兩個(gè)場(chǎng)景在AI語(yǔ)音定制能力下,是最有可能快速呈現(xiàn)爆發(fā)的。而以此為基礎(chǔ),一波新的開(kāi)發(fā)者紅利即將上線(xiàn)。

泛化定制:AI語(yǔ)音開(kāi)發(fā)者獲得新船票

隨著AI語(yǔ)音產(chǎn)業(yè)的成熟,開(kāi)發(fā)者技術(shù)支持的日趨完備,已經(jīng)有越來(lái)越多的聲音博主、AI開(kāi)發(fā)者,投身到AI語(yǔ)音生態(tài)的大潮中。而隨著AI語(yǔ)音定制功能的上線(xiàn),開(kāi)發(fā)者的基礎(chǔ)能力又得到了不小突破,“千人千聲”的對(duì)話(huà)式AI設(shè)備不再僅僅是個(gè)產(chǎn)業(yè)想象。

AI語(yǔ)音開(kāi)發(fā)者,或許很快就可以通過(guò)語(yǔ)音定制功能,獲得“泛化定制”的全新機(jī)會(huì)。可以預(yù)見(jiàn),AI語(yǔ)音定制將通過(guò)以下幾種方式影響AI語(yǔ)音的開(kāi)發(fā)空間與產(chǎn)業(yè)價(jià)值:

1、技能定制得到飛速發(fā)展。用家人的聲音定制一個(gè)語(yǔ)音技能,甚至定制只有家庭成員、情侶之間、粉絲專(zhuān)屬的語(yǔ)音技能,是一個(gè)廣闊的產(chǎn)業(yè)想象力。很多語(yǔ)音技能在有了用戶(hù)聲音這個(gè)選項(xiàng)之后,將產(chǎn)生全面改變,可能影響到娛樂(lè)、家庭、教育、陪伴等多個(gè)場(chǎng)景。

2、生活場(chǎng)景定制成為重頭戲。在智能家居、智能手機(jī)助手、智能穿戴設(shè)備中聽(tīng)到自己親人、偶像的聲音,是一件可以充滿(mǎn)各種玩法的事情。開(kāi)發(fā)者將可以借助各種硬件形態(tài),揮灑AI語(yǔ)音定制的想象力。

3、“聲音著作權(quán)”的無(wú)數(shù)新玩法。上面說(shuō)過(guò),AI語(yǔ)音定制能力的出現(xiàn)和普及,將讓“高凈值聲音”成為一種新的版權(quán)資本。明星、偶像、公眾人物,甚至特定領(lǐng)域網(wǎng)紅的聲音,將可以通過(guò)AI交互的形式普及到各種硬件中,造成內(nèi)容產(chǎn)業(yè)與科技產(chǎn)業(yè)的又一個(gè)垂直風(fēng)口。

能夠規(guī)?;涞氐腁I語(yǔ)音泛定制應(yīng)用、硬件,以及專(zhuān)屬服務(wù),是將用戶(hù)、偶像、軟件開(kāi)發(fā)者和硬件品牌融合在一起的全新形式,由此激發(fā)的購(gòu)買(mǎi)欲望和平臺(tái)開(kāi)發(fā)機(jī)遇,也許將是2020年的獨(dú)特風(fēng)景。

AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能

4、AI語(yǔ)音的社會(huì)價(jià)值與意義被重新估判。從James Vlahos的故事不難看出,AI語(yǔ)音定制能力,包含著深刻雋永的親情關(guān)懷與家庭意義。人與人無(wú)法永遠(yuǎn)陪伴,但對(duì)方聲音的智能化,卻可以將很多重要的時(shí)刻與陪伴感放大。AI語(yǔ)音定制化的開(kāi)發(fā)者們,接下來(lái)將可能擔(dān)負(fù)起更多關(guān)于親情、社會(huì)與陪伴的探索。從技術(shù)價(jià)值到社會(huì)價(jià)值,AI語(yǔ)音定制化的影響力也將以此被放大。

AI語(yǔ)音定制化,正在成為對(duì)話(huà)式AI硬件市場(chǎng)上新的驅(qū)動(dòng)因素。細(xì)心觀察近三年來(lái)的對(duì)話(huà)式AI硬件以及AI語(yǔ)音市場(chǎng),就會(huì)發(fā)現(xiàn)市場(chǎng)的波動(dòng)式增長(zhǎng),呈現(xiàn)與技術(shù)突破緊密契合的關(guān)系。在一種硬件形態(tài)處于草創(chuàng)階段的時(shí)候,這種因技術(shù)而爆發(fā)的商業(yè)能量是產(chǎn)業(yè)常態(tài)。

換句話(huà)說(shuō),對(duì)話(huà)式AI打開(kāi)的硬件市場(chǎng),呈現(xiàn)這樣的邏輯關(guān)系:技術(shù)能力突破代表著更好的用戶(hù)體驗(yàn),繼而將直接催生市場(chǎng)回饋。在2019年,小度帶來(lái)全雙工免喚醒能力后,AI語(yǔ)音硬件市場(chǎng)一度解封了三足鼎立的形態(tài),展現(xiàn)出獨(dú)自向前大幅飛躍的局面。而AI語(yǔ)音定制化能力,作為與開(kāi)發(fā)者、技能生態(tài)、內(nèi)容生態(tài)聯(lián)系更緊密的技術(shù)突破,顯然將持續(xù)維護(hù)這種技術(shù)性,帶來(lái)更多的市場(chǎng)回饋,以至于某種市場(chǎng)質(zhì)變的臨近。

但不管最終是哪個(gè)平臺(tái)獲得最后的留場(chǎng)權(quán),對(duì)于AI開(kāi)發(fā)者來(lái)說(shuō),語(yǔ)音定制化能力帶來(lái)的產(chǎn)業(yè)機(jī)遇都剛剛開(kāi)始。千人千面的硬件,千變?nèi)f化的應(yīng)用,千方百計(jì)的技術(shù)突破,是我們最終想在新硬件形態(tài)上看到的結(jié)果。

文章名稱(chēng):AI語(yǔ)音定制化,將給2020帶來(lái)三個(gè)可能-創(chuàng)新互聯(lián)
文章地址:http://bm7419.com/article40/ddhcho.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開(kāi)發(fā)、品牌網(wǎng)站制作網(wǎng)站設(shè)計(jì)公司、手機(jī)網(wǎng)站建設(shè)、品牌網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)