百度算法是怎么進(jìn)行全方位升級(jí)的

2014-08-12    分類: 網(wǎng)站建設(shè)

識(shí)別方面,百度提出流式多級(jí)的截?cái)嘧⒁饬δP蚐MLTA,這是國(guó)際上首次實(shí)現(xiàn)局部注意力建模超越整句的注意力模型,也是國(guó)際上首次實(shí)現(xiàn)在線語(yǔ)音大規(guī)模使用注意力模型。

百度算法是怎么進(jìn)行全方位升級(jí)的


SMLTA在大幅提升識(shí)別速度的同時(shí),也提高了識(shí)別準(zhǔn)確率。在輸入法有效產(chǎn)品相對(duì)準(zhǔn)確率提升15%,音箱有效產(chǎn)品相對(duì)準(zhǔn)確率提升20%.合成方面,針對(duì)現(xiàn)階段面臨風(fēng)格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語(yǔ)音合成技術(shù)Meitron,可以將語(yǔ)音中的音色、風(fēng)格、情感等要素映射到不同的子空間,在使用時(shí),不同要素可以任意組合,靈活的控制合成語(yǔ)音的風(fēng)格。同時(shí)降低語(yǔ)言合成門檻,僅需20句話就可以制作一個(gè)人的專屬聲音。
對(duì)于落地應(yīng)用正在端側(cè)呈現(xiàn)出巨大需求,百度大腦語(yǔ)音團(tuán)隊(duì)研發(fā)出一款針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互打造的芯片--百度芯片。芯片采用"軟件定義芯片"的全新設(shè)計(jì)思路。該芯片采用雙核HiFi4架構(gòu),2.8M大內(nèi)存,臺(tái)積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠(yuǎn)場(chǎng)語(yǔ)音交互核心的陣列信號(hào)處理和語(yǔ)音喚醒能力。同時(shí),按照車規(guī)級(jí)標(biāo)準(zhǔn)打造的芯片,可為車載語(yǔ)音交互,以及智能家居等場(chǎng)景帶來(lái)更大想象力。芯片流片的同時(shí),即實(shí)現(xiàn)了量產(chǎn)。
百度視覺(jué)技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān),5G時(shí)代,越來(lái)越多物理設(shè)備將連接到高可靠、低延時(shí)的網(wǎng)絡(luò)空間,這將徹底改變?nèi)藗兣c環(huán)境及設(shè)備的交互方式。本次全新發(fā)布視覺(jué)語(yǔ)義化平臺(tái)2.0,正在推進(jìn)視覺(jué)技術(shù)由"看清看懂"向"交互"進(jìn)行升級(jí)。視覺(jué)語(yǔ)義化平臺(tái)2.0在交互升級(jí)和軟硬件結(jié)合兩大方面實(shí)現(xiàn)突破。
交互升級(jí)包含一體化人機(jī)交互系統(tǒng)和大場(chǎng)景物理世界交互系統(tǒng)。簡(jiǎn)單而言,一體化人機(jī)交互系統(tǒng)是人與機(jī)器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實(shí)現(xiàn)AR特效的直播、小視頻、特效小程序等場(chǎng)景,已應(yīng)用于百度多款視頻App.大場(chǎng)景物理世界交互系統(tǒng)是將視覺(jué)定位與AR技術(shù)突破性結(jié)合,實(shí)現(xiàn)大范圍的虛擬信息與物理世界的精準(zhǔn)疊加,從而建立起AI時(shí)代全新的交互系統(tǒng)。

百度算法是怎么進(jìn)行全方位升級(jí)的(圖2)


目前,軟硬件結(jié)合可以滿足應(yīng)用場(chǎng)景更高效的視覺(jué)計(jì)算,以及更低延時(shí)的體驗(yàn),同時(shí)能保護(hù)數(shù)據(jù)隱私。百度視覺(jué)方面的軟硬件結(jié)合主要聚焦于模型壓縮平臺(tái)PaddleSlim、多模態(tài)FaceID開發(fā)組件以及軟硬件一體解決方案AI相機(jī)三部分。FaceID覆蓋設(shè)備量已超1200萬(wàn)臺(tái)。
視覺(jué)語(yǔ)義化平臺(tái)2.0更新了許多先進(jìn)的感知技術(shù),也讓機(jī)器人技術(shù)實(shí)現(xiàn)新突破。百度三維視覺(jué)首席科學(xué)家楊睿剛介紹,機(jī)器人就是一個(gè)智能體,除了感知技術(shù),智能體需要決策和動(dòng)作相關(guān)的技術(shù),實(shí)現(xiàn)從環(huán)境感知到主動(dòng)感知。
目前,百度研究的智能體技術(shù)主要集中在自動(dòng)駕駛Apollo、工程機(jī)械和服務(wù)機(jī)器人三大方面。上午主論壇中引人關(guān)注的機(jī)械臂"茶博士"不僅能說(shuō)會(huì)道,還完成了傳統(tǒng)的長(zhǎng)嘴壺倒茶工作,其背后依靠的正是服務(wù)機(jī)器人方案。

網(wǎng)站名稱:百度算法是怎么進(jìn)行全方位升級(jí)的
文章位置:http://bm7419.com/news39/28589.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序、微信公眾號(hào)、商城網(wǎng)站、搜索引擎優(yōu)化、全網(wǎng)營(yíng)銷推廣標(biāo)簽優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站建設(shè)