做人類語言謎題的破壁人：百度ERNIE2.0的突破與創(chuàng)造-創(chuàng)新互聯(lián)

這兩天AI圈有一個(gè)廣受關(guān)注的新聞，百度發(fā)布了持續(xù)學(xué)習(xí)的語義理解框架ERNIE 2.0，這個(gè)模型在1.0版本中文任務(wù)中全面超越BERT的基礎(chǔ)上，英文任務(wù)取得了全新突破，在共計(jì)16個(gè)中英文任務(wù)上超越了BERT和XLNet, 取得了SOTA效果。

10年積累的網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè)經(jīng)驗(yàn)，可以快速應(yīng)對(duì)客戶對(duì)網(wǎng)站的新想法和需求。提供各種問題對(duì)應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識(shí)你，你也不認(rèn)識(shí)我。但先網(wǎng)站制作后付款的網(wǎng)站建設(shè)流程，更有臨潁免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

可能對(duì)于大部分AI技術(shù)的關(guān)注者與AI開發(fā)者來說，ERNIE 2.0最直接的價(jià)值在于業(yè)界又將獲得一個(gè)效果強(qiáng)勁的NLP模型，同時(shí)也是中國AI技術(shù)又一次令人興奮的成果。

成績之外，ERNIE 2.0背后蘊(yùn)藏的產(chǎn)業(yè)價(jià)值同樣不容忽視。尤其是在目前國際貿(mào)易與科技背景下，ERNIE 2.0代表的無監(jiān)督預(yù)訓(xùn)練語言模型正處在非常關(guān)鍵的產(chǎn)業(yè)位置。

ERNIE 2.0與BERT、XLNet的巔峰對(duì)決背后，是一場(chǎng)全球NLP產(chǎn)業(yè)格局的變幻與交鋒。

NLP的提速換擋時(shí)代

讓我們先把時(shí)間向前倒回一點(diǎn)，看看BERT和ERNIE這對(duì)《芝麻街》的里的朋友，為什么變成了整個(gè)AI行業(yè)關(guān)注的明星。

做人類語言謎題的破壁人：百度ERNIE 2.0的突破與創(chuàng)造

NLP，即自然語言處理，是AI領(lǐng)域極其重要的一條技術(shù)路徑。它關(guān)乎于智能體如何理解人類的語言與文字，并在理解基礎(chǔ)上人機(jī)智能交互。這個(gè)領(lǐng)域的重要性顯而易見，而令業(yè)界興奮的是，去年年底到今天，NLP技術(shù)在全球范圍內(nèi)掀起了一場(chǎng)“提速競(jìng)賽”。

去年10月，谷歌發(fā)布了被認(rèn)為具備里程碑意義的NLP模型BERT。這種模型采用極大數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練的模式，一舉刷新了AI在大量NLP數(shù)據(jù)集的最高分?jǐn)?shù)。甚至在機(jī)器閱讀理解等任務(wù)中，展現(xiàn)出了與人類不相上下的表現(xiàn)。

做人類語言謎題的破壁人：百度ERNIE 2.0的突破與創(chuàng)造

被AI業(yè)內(nèi)人士稱為“殘暴到不留活路”的BERT，可以說將NLP提升到了新的軌道。另一個(gè)好消息，是BERT并沒有就此進(jìn)入一統(tǒng)江湖模式。今年3月，百度發(fā)布了基于知識(shí)增強(qiáng)技術(shù)的NLP模型ERNIE，在多個(gè)中文NLP任務(wù)中超越了BERT;今年6月，谷歌和CMU提出的NLP模型XLNet在20多項(xiàng)測(cè)試中排行第一，性能全面超越BERT;而Facebook不久前優(yōu)化過的新BERT，又拿回了不少屬于自己的記錄。

故事至此，無監(jiān)督預(yù)訓(xùn)練語言NLP模型基本進(jìn)入了“三國殺”時(shí)代，背后隱隱浮現(xiàn)著谷歌與百度，東西兩大AI巨頭的技術(shù)攀躍。

而從產(chǎn)業(yè)價(jià)值上看，基于大規(guī)模數(shù)據(jù)的無監(jiān)督預(yù)訓(xùn)練語言模型你追我趕，不斷刷新記錄，給NLP技術(shù)應(yīng)用到各行各業(yè)帶來了全新的機(jī)遇。作為NLP問題的基礎(chǔ)解法，這些模型讓機(jī)器閱讀理解、情緒識(shí)別、文本分類等任務(wù)都達(dá)到了新高度，語音助手、在線客服、智能金融、對(duì)話機(jī)器人等廣泛領(lǐng)域都將從中受益。

或許我們可以將這10個(gè)月以來的NLP進(jìn)化，理解為一場(chǎng)提速換擋。語言智能領(lǐng)域，剛剛經(jīng)歷了柴油換汽油的劇變，這是一個(gè)時(shí)代的劃頁。

在這個(gè)具有廣袤想象力的NLP時(shí)代，ERNIE 2.0來了。

ERNIE 2.0一劍東來，巴別塔之戰(zhàn)格局變幻

如上文所述，今天的NLP競(jìng)速，是頂級(jí)高手間相互刷新AI記錄的一場(chǎng)游戲，頗有點(diǎn)紫禁之巔葉孤城大戰(zhàn)西門吹雪的味道。而這場(chǎng)競(jìng)速，發(fā)生在人類語言智能的巴別塔之巔。

而剛剛發(fā)布的ERNIE 2.0實(shí)際上代表了這樣一件事：這場(chǎng)巔峰之戰(zhàn)中，百度奪得了賽事的主動(dòng)權(quán)。

從3月發(fā)布ERNIE 1.0，經(jīng)過短短幾個(gè)月時(shí)間，百度就完成了ERNIE的再升級(jí)，發(fā)布了能夠持續(xù)學(xué)習(xí)的語義理解框架ERNIE 2.0，以及基于框架的ERNIE 2.0預(yù)訓(xùn)練模型。

整體來看，ERNIE 2.0不僅完成了一次記錄刷新表演，同時(shí)也解決了BERT長時(shí)間被產(chǎn)業(yè)界詬病的“大力出奇跡”問題。對(duì)算力和數(shù)據(jù)量的要求更少，讓無監(jiān)督預(yù)處理語言模型更加貼近產(chǎn)業(yè)現(xiàn)實(shí)?？傮w來看，ERNIE 2.0閃耀NLP舞臺(tái)，有三大硬核能力：

1、更好的效果：ERNIE英文任務(wù)方面取得全新突破，在共計(jì)16個(gè)中英文任務(wù)上超越了BERT和XLNet, 取得了SOTA效果。在英文任務(wù)上，ERNIE 2.0在自然語言理解數(shù)據(jù)集GLUE的7個(gè)任務(wù)上擊敗了BERT和XLNet;中文任務(wù)中，ERNIE 2.0在包括閱讀理解、情感分析、問答等不同類型的9個(gè)數(shù)據(jù)集上超越了BERT并刷新了SOTA。可以說在NLP領(lǐng)域的關(guān)鍵問題中，推動(dòng)了業(yè)界的前沿探索與突破。

做人類語言謎題的破壁人：百度ERNIE 2.0的突破與創(chuàng)造

2、更小的數(shù)據(jù)：無監(jiān)督預(yù)訓(xùn)練NLP模型，一直被業(yè)界認(rèn)為是數(shù)據(jù)越多，效果越好，有種大力出奇跡的意味。然而ERNIE 2.0在充分借助百度PaddlePaddle(飛槳)多機(jī)分布式訓(xùn)練優(yōu)勢(shì)的情況下，利用 79億tokens數(shù)據(jù)就完成了模型的訓(xùn)練，約等于四分之一的XLNet數(shù)據(jù)。

3、更少的算力：無監(jiān)督預(yù)訓(xùn)練語言模型一大問題，在于算力消耗過大，訓(xùn)練時(shí)間過長，從而導(dǎo)致產(chǎn)業(yè)化困難。ERNIE 2.0在這一點(diǎn)上也有出色表現(xiàn)，其僅僅使用64張V100 ，約八分之一XLNet硬件算力就實(shí)現(xiàn)了效果，而且為開發(fā)人員定制自己的NLP模型提供了方案。

在優(yōu)秀的數(shù)據(jù)表現(xiàn)背后，或許我們還應(yīng)該注意到更加宏觀的產(chǎn)業(yè)問題：ERNIE 2.0代表的，是這場(chǎng)國際矚目的NLP競(jìng)速里，中國能量從未缺席。

AI不缺席：NLP之路上的中國能量

過去，我們總是認(rèn)為中國在科技創(chuàng)新上是落后的，中國科技產(chǎn)業(yè)善于模仿和塑造應(yīng)用，但在基礎(chǔ)研究與突破上往往缺席。然而ERNIE 2.0卻證明了，在AI之路上的關(guān)鍵技術(shù)、關(guān)鍵話題，中國AI可以第一時(shí)間參與進(jìn)來，貢獻(xiàn)自己的力量。中國科技在AI時(shí)代不再缺席。

ERNIE 2.0與BERT、XLNet的競(jìng)速發(fā)展中，可以看到三層中國能量正在產(chǎn)業(yè)中閃耀。百度AI正在帶給世界AI產(chǎn)業(yè)以驚喜。

1、中國智慧：BERT最為人詬病的一點(diǎn)，是它用龐大數(shù)據(jù)集砸入模型，產(chǎn)生了簡(jiǎn)單粗暴有效的效果。但在算法層面卻缺乏創(chuàng)新。而在ERNIE 2.0中，百度實(shí)現(xiàn)了可持續(xù)學(xué)習(xí)語義理解能量。通過支持增量引入詞匯(lexical)、語法 (syntactic) 、語義 (semantic) 等3個(gè)層次的自定義預(yù)訓(xùn)練任務(wù)，能夠全面捕捉訓(xùn)練語料中的詞法、語法、語義等潛在信息。這些任務(wù)通過多任務(wù)學(xué)習(xí)對(duì)模型進(jìn)行訓(xùn)練更新，每當(dāng)引入新任務(wù)時(shí)，就可在學(xué)習(xí)該任務(wù)的同時(shí)，不遺忘之前學(xué)到過的信息。

做人類語言謎題的破壁人：百度ERNIE 2.0的突破與創(chuàng)造

(ERNIE 2.0：可持續(xù)學(xué)習(xí)語義理解框架)

這意味著，ERNIE 2.0可以通過持續(xù)構(gòu)建訓(xùn)練包含詞法、句法、語義等預(yù)訓(xùn)練任務(wù)，持續(xù)提升模型效果。也就是說，ERNIE 2.0通過語言學(xué)與AI科學(xué)的跨領(lǐng)域結(jié)合，完成了算法邏輯上的大量創(chuàng)新，并驗(yàn)證了可持續(xù)學(xué)習(xí)語義理解的任務(wù)表現(xiàn)。這給AI行業(yè)開啟了一條新的道路，為NLP領(lǐng)域打開了新的發(fā)展軌跡。這條中國智慧的貢獻(xiàn)，恰好作用于AI界聚焦的前沿探索中，為全球AI技術(shù)提升貢獻(xiàn)了獨(dú)特力量。

2、中國位置：NLP的產(chǎn)業(yè)應(yīng)用正在飛速發(fā)展，無監(jiān)督預(yù)訓(xùn)練語言模型被認(rèn)為在各類NLP應(yīng)用中處于骨干網(wǎng)絡(luò)的地位，是構(gòu)成下一代NLP技術(shù)的底層。如果這個(gè)位置被BERT完全卡住，或者說被歐美公司完全卡住，那么很容易又會(huì)出現(xiàn)底層科技卡脖子問題。另一方面，BERT等模型并不精于中文任務(wù)，長期下去NLP領(lǐng)域英文應(yīng)用可能大幅度領(lǐng)先中文應(yīng)用，影響產(chǎn)業(yè)進(jìn)程。這都是我們不愿意看到的。

ERNIE 2.0則證明，在這場(chǎng)底層技術(shù)角逐中，中國位置已經(jīng)確立。中國科技在百度AI的全力以赴下，成為了領(lǐng)導(dǎo)者和探索者。

3、中國速度：去年評(píng)選全世界最受重視的AI新技術(shù)時(shí)，BERT和圖網(wǎng)絡(luò)占據(jù)前二。這不難看出全球科技產(chǎn)業(yè)對(duì)BERT的重視。然而幾個(gè)月過去，中國已經(jīng)有了可以媲美甚至領(lǐng)先BERT的NLP模型。這也是AI時(shí)代中國速度的一個(gè)體現(xiàn)。

ERNIE 2.0可以作為一個(gè)橫軸，從中可以證明基礎(chǔ)算法這個(gè)AI最核心領(lǐng)域，中國已經(jīng)逐漸跟上了美國的速度，并且可以超越歐美頂級(jí)AI公司的算法。反向輸出核心算法，用中國速度領(lǐng)跑AI。百度的AI硬核實(shí)力，可以看出正在呈現(xiàn)不斷加速的特征。今年谷歌大會(huì)上，已經(jīng)被外界評(píng)論為算法創(chuàng)新上的疲軟。然而百度卻接住了這個(gè)難題，逆勢(shì)而上。中國AI速度，正在百度拋向世界的一個(gè)個(gè)算法中展現(xiàn)出來。

做人類語言謎題的破壁人：百度ERNIE 2.0的突破與創(chuàng)造

必須承認(rèn)的是，今天的AI賽場(chǎng)上，中國能量已經(jīng)不可忽視。這條路并非朝夕鋪就，而是經(jīng)過無數(shù)中國AI人的努力凝結(jié)而成。比如在剛結(jié)束的ACL上，百度共有10篇論文被大會(huì)收錄，研究領(lǐng)域涵蓋了多個(gè)NLP領(lǐng)域的熱點(diǎn)話題與前沿方向，展現(xiàn)出了國際頂級(jí)水準(zhǔn)的技術(shù)積淀。

而在學(xué)術(shù)與產(chǎn)業(yè)的不斷突破背后，是百度從2010年起就加速發(fā)展NLP事業(yè)，在AI技術(shù)尚未被世界熱捧的時(shí)候，就潛心NLP的前沿技術(shù)研究與產(chǎn)業(yè)應(yīng)用。為業(yè)內(nèi)培養(yǎng)了大量AI人才，成為國際頂級(jí)研究機(jī)構(gòu)的百度NLP部門，在AI界素有“鐵軍”的美譽(yù)。目前，百度大腦語言與知識(shí)技術(shù)擁有大的多元語義知識(shí)圖譜以及最好的中文語義表示模型，目前可提供30+項(xiàng)技術(shù)工具，囊括了文本審核、機(jī)器翻譯、語言生成等多項(xiàng)能力，面向業(yè)界提供多樣、靈活、可定制的服務(wù)與場(chǎng)景解決方案。

由此可見，今天的成果，背后是十年磨一劍的技術(shù)探索與人才培養(yǎng)。一劍東來的百度，背后凝結(jié)了十年面壁圖破壁的NLP苦功。其實(shí)，每次中國AI閃耀于世界賽場(chǎng)的第一線，背后或多或少都藏著這樣的故事。

網(wǎng)站名稱：做人類語言謎題的破壁人：百度ERNIE2.0的突破與創(chuàng)造-創(chuàng)新互聯(lián)
URL鏈接：http://bm7419.com/article34/dgdhse.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供外貿(mào)網(wǎng)站建設(shè)、標(biāo)簽優(yōu)化、服務(wù)器托管、ChatGPT、外貿(mào)建站、域名注冊(cè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容