百度交出年度AI成績單：斬獲23項冠軍，國產(chǎn)自研成大趨勢

2021-02-05 分類：網(wǎng)站建設

剛剛，百度一年AI成績單官宣。

作為中國AI頭雁，百度的成績單不止代表巨頭公司業(yè)績，也代表了技術(shù)前沿現(xiàn)狀和產(chǎn)業(yè)基本情況。

而且諸多進展，也是全新起跑線上全球AI發(fā)展的側(cè)影，比如最明顯的4大趨勢特點：

語音語言領銜基礎技術(shù)突破，AI突破從感知智能進入認知智能時代。
巨頭玩家忙于打造“底座”優(yōu)勢，搭建生態(tài)平臺。
AI落地進入工業(yè)化大生產(chǎn)時代，價值在基礎業(yè)務中展現(xiàn)，也通過新場景中驗證潛力。
自主可控性進一步加強，自研芯片服務器量產(chǎn)，并與國產(chǎn)AI框架、算法產(chǎn)生整合優(yōu)勢。

所以百度這份2019年度成績單，究竟說了啥？又體現(xiàn)了哪些行業(yè)共同趨勢？

我們提綱挈領、抓取歸納其中要點，從點到面一文看懂。

百度AI的2019：技術(shù)→平臺→生產(chǎn)力

整份成績單中，技術(shù)突破與生態(tài)建設是重中之重，占據(jù)了一半篇幅。

剩下的一半中，應用落地與產(chǎn)業(yè)升級占據(jù)了很大篇幅。

這也體現(xiàn)出了AI當前發(fā)展階段——技術(shù)仍舊占據(jù)核心，但落地以及產(chǎn)業(yè)應用正在被放到更加重要的位置。

整體上來看，百度的成績單可以分為三大部分：

一是基礎研究。
二是技術(shù)生產(chǎn)力轉(zhuǎn)換。
三是生態(tài)平臺的建設。

首先看基礎研究，一年包攬了23項國內(nèi)外競賽冠軍。

集中于百度大腦，語音、視覺、自然語言處理、知識圖譜等方面都有成果出現(xiàn)。

特別是語音語言，在2019年迎來階段性豐收時刻。

語音識別方面，百度提出了流式多級的截斷注意力模型 SMLTA，這是全球范圍內(nèi)首次實現(xiàn)流式注意力建模，超越整句注意力模型的性能，大幅提升了語音識別準確率和速度（15%-20%），也是國際上首次實現(xiàn)在線語音識別大規(guī)模使用注意力模型。

語音合成方面，針對風格遷移、音色模擬和情感擬人的三大領域內(nèi)挑戰(zhàn)，百度推出語音合成技術(shù) Meitron ，僅需20句話就可以制作一個人的專屬聲音。

此外，作為認知智能的“奧林匹克”，自然語言處理技術(shù)（NLP）的進展在今年最為奪目，全球亮點頻出。

代表中國“參賽”的百度，交出了可持續(xù)學習的知識增強語義理解框架ERNIE（艾尼），在16 個中英文任務上超越BERT、XLNET，取得SOTA 。

2019年12月，ERNIE在GLUE上登頂?shù)谝?，并?個任務平均得分首次突破90大關(guān)，刷新榜單歷史，超越微軟、谷歌提出的一眾國際頂級預訓練模型。

基于語音和語言方面的突破，百度還提出了基于深度注意網(wǎng)絡的多輪響應選擇匹配模型——DAM，口語理解能力被大幅提升。

值得一提的是，雖然全球范圍內(nèi)視覺為核心的感知智能已經(jīng)邁步廣泛落地應用期，但在2019年，百度還是秀出了“百尺竿頭更進一步”的基礎研發(fā)實力。

除了形成包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術(shù)矩陣。

百度還在CVPR 2019豪奪10項冠軍，包括OCR、物體檢測、視頻理解、目標跟蹤等圖像與視頻技術(shù)領域。

此次AI復興，除了算法，另一項重要基礎變革在于計算力。

百度也在成績單中詳細分享了突破：

2019年12月，基于百度自主研發(fā)的中國首款云端全功能AI芯片“昆侖”的云服務器正式上線，在150瓦功耗下能帶來260萬億次定數(shù)的AI運算，提供512GB/s的內(nèi)存帶寬。

量產(chǎn)了專為遠場語音交互打造的百度鴻鵠芯片，100mW 左右平均工作功耗，即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力等等。

而且，百度的算力發(fā)展并不僅僅只是單點發(fā)展，也已經(jīng)與算法、飛槳框架連點成線，并交織成了堅實的基礎層，形成了協(xié)同效應。

通過芯片、連接、系統(tǒng)和調(diào)度的協(xié)同設計和技術(shù)創(chuàng)新，對AI計算架構(gòu)進行升級，可以提供百萬TOPS的強大算力。

正在建造的計算集群，基于百度飛槳研發(fā)的AI控制系統(tǒng)，設計年均PUE1.15，基礎設施能耗降低70%，每個可用區(qū)每年節(jié)電超過2億度，相當于10萬戶居民一年的用電量。

下一代計算——量子計算方面也有新突破。

研發(fā)出國際、國內(nèi)第一的云上量子脈沖系統(tǒng)“量脈”，可將量子計算軟件指令(邏輯門)轉(zhuǎn)換成控制量子硬件的脈沖序列，算法性能較同類工具實現(xiàn)成倍的提升，是實現(xiàn)量子軟硬件連接的關(guān)鍵橋梁。

當然，區(qū)別于科研機構(gòu)，百度作為企業(yè)組織，基礎技術(shù)突破自然不會止步于理論本身。

在技術(shù)轉(zhuǎn)化成生產(chǎn)力方面，百度展示了一幅AI落地全景圖。

百度旗下的多款應用與業(yè)務中已經(jīng)轉(zhuǎn)換成了AI引擎，而且其也正在開放能力，共享產(chǎn)業(yè)升級紅利。

在

小度助手5.0 援引第三方機構(gòu)數(shù)據(jù)，第二季度小度系列智能音箱出貨量位居全球第二、國內(nèi)第一，同比增長率高達3700%。

而且技術(shù)突破和落地，也進一步打破產(chǎn)品舊邊界。作為“音箱”被歸類的AI交互硬件，在小度系狂飆突進下，開始真正展現(xiàn)AI時代交互終端的樣子——AI音箱不再是音箱。

百度輸入法方面，剛才提到的重要基礎突破，流式截斷的多級注意力模型（SMLTA）已經(jīng)上線，效果立竿見影，在線語音識別相對準確率，比同領域最優(yōu)玩家還有高15%。

好消息是，離線語音識別準確率已經(jīng)達到在線識別水平，且可以實現(xiàn)高精準中英文混合語音輸入、方言免切換語音輸入，這也是業(yè)內(nèi)首次。

在機器翻譯方面，繼提出了多任務學習、多智能體聯(lián)合訓練等前沿方法，在2019年WMT評測中取得中英翻譯第一，提出了首個具有預測和可控時延的同傳模型，也是首個語義單元驅(qū)動的上下文同傳模型，并研發(fā)了語音到語音的同傳系統(tǒng)，無需經(jīng)過語音識別轉(zhuǎn)錄，同樣是業(yè)內(nèi)首次。

而視覺為代表的感知智能落地，最具業(yè)內(nèi)反響的是自動駕駛。

在業(yè)內(nèi)“華山論劍”頂會CVPR 2019，百度Apollo公開了國內(nèi)唯一的純視覺L4級自動駕駛解決方案——Apollo Lite，能夠支持對10路攝像頭、200幀/秒數(shù)據(jù)量的并行處理，單視覺鏈路高丟幀率能夠控制在5‰以下，實現(xiàn)全方位360°實時環(huán)境感知，前向障礙物的穩(wěn)定檢測視距達到240米。

相比旋轉(zhuǎn)式激光雷達感知方案，視覺感知方案價格低廉且便于獲得。并以計算機視覺和AR技術(shù)研發(fā)了一種增強現(xiàn)實的自動駕駛仿真系統(tǒng)（AADS），使用激光雷達（LiDAR）和相機掃描街景。

合成虛擬形象也是今年最“性感”的落地應用之一，并且達到了量產(chǎn)的水平。

百度與央視合作打造AI虛擬主持人小靈，亮相央視2019五四晚會；與澎湃新聞合作打造了第一個真人形象的虛擬主播早晚新聞欄目；與浦發(fā)銀行合作打造了業(yè)內(nèi)首個“金融數(shù)字人”。

基于知識圖譜的視頻語義理解，則已經(jīng)在百度視頻搜索、推薦、內(nèi)容生成等多個產(chǎn)品上線。

通過對視頻的視覺、語音、文本的多模態(tài)知識解析，在多元異構(gòu)知識圖譜上建立關(guān)聯(lián)，并通過計算推理，建立對視頻的深度語義理解，大幅度提升視頻理解效果。

而且AI落地在今年也不再陽春白雪，更多接地氣、可以被尋常百姓家感知的科普式方案也引起反響。

比如百度AI開發(fā)者大會上，打造了能說會道的機器臂“茶博士”。

利用3D視覺技術(shù)，可以對茶杯的位置進行檢測和追蹤。通過機器人運動規(guī)劃和控制，可以對工作空間進行碰撞檢測，避開障礙物。完成實時規(guī)劃運動后，可自動生成倒茶軌跡。語音語義聯(lián)動技術(shù)解析，更是讓機器人像“人”一般，聽得懂，說得好，做得準。

最后，有技術(shù)、有落地應用之外，百度更宏大的雄心也徐徐展露——基于技術(shù)與應用優(yōu)勢，百度希望更進一步：打造平臺，打造生態(tài)，成為AI世界的底座。

今年成績單中，開發(fā)生態(tài)方面的數(shù)據(jù)同樣非常醒目。

從百度當前的業(yè)務布局來看，其已形成了4大底座平臺：

百度大腦AI開放平臺
飛槳產(chǎn)業(yè)級深度學習開源開放平臺
Apollo自動駕駛開放平臺
小度開放平臺

并且在2019年都實現(xiàn)了爆發(fā)。

百度大腦開放平臺已經(jīng)在語音、視覺、語言等方面實現(xiàn)全面升級，具備深度學習框架、場景化AI能力、定制化訓練平臺到軟硬一體模組和解決方案等。

自2016年以來，百度已開放228項AI能力，開發(fā)者數(shù)量超過150萬，日均調(diào)用量突破1萬億次，語音、人臉、NLP、OCR調(diào)用量中國第一，是業(yè)內(nèi)最全面、最、服務規(guī)模大的AI開放平臺。

援引IDC最新報告，百度飛槳與谷歌、Facebook名列前三，領銜中國深度學習平臺市場，也是市場份額前五中唯一的國貨。

Apollo自動駕駛開放平臺已經(jīng)匯聚了全球156家生態(tài)合作伙伴；在全球，有97個國家超過3.6萬名開發(fā)者使用Apollo開源代碼，開源代碼數(shù)量超過65萬，已成為全球最強大、最開放、最活躍的自動駕駛平臺。

而且開放能力進一步打破邊界，在剛召開的首屆Apollo生態(tài)大會上，百度Apollo拓展裂變成三大平臺：自動駕駛開放平臺、車路協(xié)同開放平臺，智能車聯(lián)開放平臺，成為中國自動駕駛基建國家隊代表。

小度技能開放平臺上，技能開發(fā)者數(shù)量已經(jīng)超過3.7萬人，可提供包括游戲、效率工具、網(wǎng)絡電臺、直播、兒童教育、智能家居等3500多種技能支持。合作伙伴數(shù)量已經(jīng)超過500家，可以控制的IoT智能家居設備已經(jīng)超過了7000萬。

此外，百度還開源了中國首個邊緣計算框架BAETYL、自研底層區(qū)塊鏈技術(shù)，并發(fā)布了多個工業(yè)級的領域數(shù)據(jù)集，如大規(guī)模自動駕駛數(shù)據(jù)集、街景圖像數(shù)據(jù)和文字場景數(shù)據(jù)集、視頻精彩片段、場景解析、機器閱讀理解、中文句子及相應的開放域信息提取事實數(shù)據(jù)集等等，來促進算法研究，推動AI發(fā)展。

比如下圖，就是ApolloScape數(shù)據(jù)集示例：上半截為彩色圖像，下半截是其二位語義標簽：

正如百度董事長兼CEO李彥宏所說：“作為一家平臺級企業(yè)，成就他人、造福社會，這是百度創(chuàng)始初心與能力之所在，更是百度在行業(yè)發(fā)展關(guān)鍵時刻責無旁貸之所在！”

正是基于如此，百度才能夠通過百度智能云的“云+AI”能力，為各行各業(yè)大規(guī)模輸送百度的AI技術(shù)成果與平臺能力，成效也非常顯著。

根據(jù)IDC在11月底發(fā)布的中國AI云服務市場報告，百度智能云在AI技術(shù)、市場和商業(yè)上處于中國地位，超過了阿里云、AWS等一眾廠商。

百度CTO王海峰感慨，百度在2019年提出“人工智能進入工業(yè)大生產(chǎn)階段”，如今他們已經(jīng)探索了AI進入“工業(yè)大生產(chǎn)”的真實路徑，推動AI邁入自動化、標準化和模塊化的新階段，并與百度業(yè)務以及各行各業(yè)的生產(chǎn)實踐深入結(jié)合，加速產(chǎn)業(yè)智能化進程。

在互聯(lián)網(wǎng)、金融、智能城市、工業(yè)制造等行業(yè)已經(jīng)擁有標桿性落地案例。

比如，與中國聯(lián)通打造的智能客服已經(jīng)在中國聯(lián)通三省一基地上線；與央視網(wǎng)共建人工智能研發(fā)中心，打造媒體行業(yè)的AI軟硬件產(chǎn)品；與精研科技打造智能質(zhì)檢車間，提升制造業(yè)質(zhì)檢效率，降低用工成本等等。

但百度的技術(shù)，并不僅僅希望體現(xiàn)在商業(yè)價值上，還希望通過社會價值，展現(xiàn)AI福祉。

成績單中披露，2019年“百度 AI 尋人”平臺，用戶發(fā)起照片比對超過了36萬次，9000多個走失者與家庭重新團聚。

百度還發(fā)布了聽障兒童無障礙閱讀計劃，推出了全球首款聽障兒童AI手語翻譯小程序，能將繪本文字翻譯為手語，幫助聽障兒童實現(xiàn)無障礙閱讀。

此外還將AI應用在了臺風路徑查詢、瀕危土家語保護、改造盲人按摩院等方面，進一步發(fā)掘AI價值。

所以百度AI如何回答2019？上述種種業(yè)績就是關(guān)鍵要素。

而且巨頭玩家年度交卷，自然也是整個AI產(chǎn)業(yè)的共性、趨勢反映。

正所謂窺一斑見全豹，百度的成績單又反映出怎樣的AI 2019？

百度成績單背后的全球AI六大趨勢

或許你會疑惑，百度上述新突破、新進展，為何發(fā)生在2019？

背后有百度的技術(shù)積累開花結(jié)果，但也是AI發(fā)展進程使然。

這也是為什么百度的2019更值得被復盤解讀，其中展示全球AI領域發(fā)展的六大趨勢。

趨勢一：CV之后，NLP領域成為下一個突破頻出的領域

在百度交出的AI成績單中，更多的AI突破與生產(chǎn)力轉(zhuǎn)換都集中在語音語言理解方面。

比如語音識別、語音合成、虛擬主播、機器翻譯、人機對話、知識圖譜等等，并落地到了小度助手、百度地圖、百度視頻等等產(chǎn)品與應用之中。

這也體現(xiàn)出了整個人工智能當前的技術(shù)突破集中點：自然語言處理方向。

計算機視覺是人工智能產(chǎn)業(yè)中最為成熟的方向，人臉識別已經(jīng)進入了尋常百姓家，整個方向徹底進入落地期。

早年圍繞這一技術(shù)發(fā)展起來的第一波AI獨角獸，也已經(jīng)在想辦法向更多的方向拓展。曠視發(fā)力IoT供應鏈，依圖做起了芯片，而商湯在教育、AR、自動駕駛方向頻頻發(fā)力等等。

與此形成對應的是，NLP方向突破頻頻。谷歌的BERT直接催生出了更多的變體，機器在自然語言處理與語義理解上更為突出，GPT-2的問世也進一步彰顯出了整個方向的創(chuàng)造力與活力。

眾所周知，AI可以被劃分為“感知智能”和“認知智能”兩大版塊。

但2012年ImageNet石破天驚開始，感知智能的進展要好于認知領域，直觀類比來說，感知就像一個人類能考到95分的試卷，而認知領域，夠到及格還挑戰(zhàn)連連。

于是2019年，全新氣象和里程碑進展頻頻，以語言語音為代表的認知，進入突破期。

趨勢二：落地為王，價值重估，AI發(fā)展回歸理性

2019年，整個人工智能產(chǎn)業(yè)變得更加務實。

絢麗的Demo少了，關(guān)于將AI應用到產(chǎn)品、落地到場景中呼聲更多了。

這是對前些年人工智能領域“大躍進”的最直接回應，AI發(fā)展理性回歸，從資本方到企業(yè)，整個行業(yè)的參與者都在要求AI展示“降本增效”，來轉(zhuǎn)化成真實的生產(chǎn)力。

2019年的百度，在落地與AI生產(chǎn)力轉(zhuǎn)換方面再明顯不過。

最典型如自動駕駛領域有L4級視覺感知解決方案Apollo Lite和增強現(xiàn)實的自動駕駛仿真系統(tǒng)，對于自動駕駛落地，全球都在要求進入“平民”時代，依靠堆高精尖傳感器的“貴族”玩法，市場空間越來越小。

這也是全球自動駕駛經(jīng)受重估的一年。

國際上，Waymo模式遭遇質(zhì)疑和重估，摩根大通將其估值調(diào)低40%，而在貨運領域自動駕駛落地則熱火朝天，兩種不同形態(tài)一對比，才知道“看不見的手”想要的不再是遙遠的迷人圖景，它想要的是——少廢話，證明價值吧。

趨勢三：人工智能進入工業(yè)大生產(chǎn)階段，需要標準化、自動化和模塊化

在談到人工智能的時候，很多人都會將其提為“新一輪的科技革命”，并將其比作蒸汽、電力等等。

但現(xiàn)實給出的種種反饋都頗為直接地展現(xiàn)出，在給出這一結(jié)論的時候，要用將來時態(tài)。從現(xiàn)在到將來缺了什么？

王海峰在2019年提出觀點稱，前三次工業(yè)革命的核心技術(shù)都具有很強的通用性，呈現(xiàn)出標準化、自動化和模塊化的工業(yè)大生產(chǎn)特征。

而人工智能想要如此，自然也需要具備這些特征。這也是人工智能產(chǎn)業(yè)向前發(fā)展的根本所在。

前些年的人工智能落地，都體現(xiàn)在一個case接一個case的模式，現(xiàn)在進入工業(yè)大生產(chǎn)階段，則要求人工智能體現(xiàn)出更加通用特征，一個產(chǎn)品能夠處理多個case，人工智能的能力要標準化、自動化和模塊化。

百度的成績單中，百度大腦、飛槳、小度助手、Apollo等平臺，都是百度對這一趨勢給出的回應。

飛槳、Apollo等開放平臺被國際知名第三方機構(gòu)波士頓咨詢，作為中國AI發(fā)展的代表，并在全球范圍內(nèi)與谷歌相提并論，認為開放平臺正是巨頭優(yōu)勢和推動智能化變革的關(guān)鍵。

由此第四大趨勢

網(wǎng)站題目：百度交出年度AI成績單：斬獲23項冠軍，國產(chǎn)自研成大趨勢
URL地址：http://www.bm7419.com/news/99201.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供響應式網(wǎng)站、搜索引擎優(yōu)化、Google、品牌網(wǎng)站設計、網(wǎng)站營銷、服務器托管

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

域名很重要嗎？域名重要性體現(xiàn)在哪 2021-02-04
deepin+wps 你想象不到的純凈 2021-02-04
縱向SaaS和橫向SaaS簡介 2021-02-04
初學者的云計算指南 2021-02-04
什么內(nèi)容容易被百度判斷優(yōu)質(zhì)內(nèi)容？ 2021-02-04
什么是O2O？什么是新零售？ 2021-02-04
全網(wǎng)營銷的形式下，企業(yè)網(wǎng)站應該怎樣做？ 2021-02-04
社交電商模式與未來發(fā)展之路——未來的電商將如何 2021-02-04
閑聊數(shù)據(jù)庫高可用容災規(guī)劃設計 2021-02-04

百度交出年度AI成績單：斬獲23項冠軍，國產(chǎn)自研成大趨勢

百度AI的2019：技術(shù)→平臺→生產(chǎn)力

百度成績單背后的全球AI六大趨勢

百度交出年度AI成績單：斬獲23項冠軍，國產(chǎn)自研成大趨勢