谷歌三大法寶:知識(shí)圖譜、語音搜索和Google Now

2016-09-04    分類: Google


1月18日消息,美國網(wǎng)站medium.com日前刊登文章,講述谷歌為保持其在搜索領(lǐng)域的主導(dǎo)地位,不斷開拓革新,發(fā)展形成了知識(shí)圖譜、語音搜索和Google Now這三個(gè)重要的組成部件。以下為文章主要內(nèi)容:

天空為什么是藍(lán)色的? 這是小孩常常會(huì)提出的一個(gè)問題,而大部分家長都無法獨(dú)立解答。在不太久以前,尋找正確的答案至少需要求助于百科全書,甚至意味著跑一趟圖書館。在最近這幾年,父母只需要跑到電腦前,登陸谷歌(Google),評(píng)估與該問題相關(guān)的鏈接,快速瀏覽解釋,深入理解這個(gè)問題,從而給孩子們滿意的答復(fù)。

但是到了2015年,即使這個(gè)看似已經(jīng)提速的過程還是未能達(dá)到預(yù)期。一方面,問題不只是被拼寫到搜索框中,更多是直接向移動(dòng)設(shè)備口頭提出。另一方面,雖然從經(jīng)過排列的鏈接清單中選擇最具相關(guān)性的一條仍然是大部分問題的有效解決辦法,但那些獲得明確答案的提問者開始希望迅速得到答案。一旦谷歌不能做到,他們就感到失望,甚至生氣。

因此……“谷歌,為什么天空是藍(lán)色的?”(注:語音提問)

Android手機(jī)只花了不到一秒鐘就對(duì)這個(gè)口頭問題作出回應(yīng)—以一種可以讓人理解但又明顯自動(dòng)化的音調(diào)。

“在晴朗、無云的白天,天空之所以是藍(lán)色的是因?yàn)榇髿庵械奈⒘?duì)來自太陽的藍(lán)色光散射能力高于紅色光。

谷歌搜索團(tuán)隊(duì)負(fù)責(zé)人阿密特·辛格哈爾(Amit Singhal)利用這個(gè)解釋來幫助證明,迄今為止全球最受歡迎的搜索引擎在過去幾年是如何進(jìn)行自我改革的。在過去幾年我對(duì)他進(jìn)行的采訪中,辛格哈爾將推行重大調(diào)整比喻為在半空飛行過程中更換發(fā)動(dòng)機(jī),因?yàn)楣雀鑼⑵渌惴ā帮w行計(jì)劃”更改為改善排名、增加新的信息材料(如圖片、書本或者旅行),或者在用戶還沒有輸入完問題之前就開始進(jìn)行搜索。不過,在過去幾年,谷歌不僅改變了飛機(jī)的發(fā)動(dòng)機(jī),還改變了駕駛艙的大部分。移動(dòng)端不可阻擋的勢(shì)頭(在2015年手機(jī)和平板電腦搜索量可能超過PC搜索量)促成了一些更為重大的變革:鑒于出現(xiàn)如此重大的變化,需要對(duì)未來的使命進(jìn)行重新考慮。

他表示:“我們都必須深入地考慮,在已經(jīng)進(jìn)入移動(dòng)化的世界里,搜索真正意味著什么。想到這個(gè)問題的時(shí)候,我們頭都大了。

不斷變革

在過去17年歷史里,谷歌搜索不斷進(jìn)化,在這個(gè)過程中該公司經(jīng)常發(fā)表慶祝性的博客文章并偶然進(jìn)行新聞發(fā)布會(huì)(不過一旦要對(duì)這些變革進(jìn)行量化,谷歌又恢復(fù)到一貫的“惜字如金”—多年來,該公司對(duì)其用于幫助排列搜索詞條的提示的數(shù)量描述為“超過200條”)。因?yàn)樗阉魅匀皇窃摴镜钠炫灝a(chǎn)品—并且支持搜索廣告的平臺(tái)仍然是谷歌的主要收入來源—谷歌一直在努力改善這個(gè)數(shù)十億人用以尋找信息的途徑。在過去幾年,通過短期和長期努力,該公司加快了這種節(jié)奏,以期于競(jìng)爭(zhēng)對(duì)手。

用戶不應(yīng)錯(cuò)過部分變革。搜索速度更快,內(nèi)容更加新鮮,也更具社交性(不過這是在Google Plus推出后,當(dāng)時(shí)該公司大力推廣“社交搜索”,現(xiàn)在大家已經(jīng)很少聽到這個(gè)口號(hào)了)。谷歌搜索的頁面也不一樣了。谷歌搜索體驗(yàn)負(fù)責(zé)人之一塔瑪爾·耶霍舒亞(Tamar Yehoshua)表示: “在早期,頁面較為簡(jiǎn)潔—只有主頁面和搜索結(jié)果。現(xiàn)在,在搜索結(jié)果頁面上有很多不同的功能和產(chǎn)品。

展望未來,谷歌一直在擴(kuò)展人工智能的邊界,從而打造一個(gè)巨型“大腦”—能夠更好地理解用戶和世界、甚至在人們還沒提問之前就列出準(zhǔn)確結(jié)果。

但是部分批評(píng)者指出,谷歌搜索正在走下坡路。他們埋怨垃圾結(jié)果太多,或者對(duì)較新信息的過分強(qiáng)調(diào)導(dǎo)致較早前出現(xiàn)但更具相關(guān)性的結(jié)果被阻擋。大家都聽說過,谷歌自夸的“10個(gè)藍(lán)色鏈接”( ten blue links)已經(jīng)被大量令人迷惑和謀求私利的功能(如購物、新聞及多媒體結(jié)果)所污染(另一方面,谷歌在美國大的競(jìng)爭(zhēng)對(duì)手微軟必應(yīng)吹噓稱,谷歌仍然非常依賴于10個(gè)藍(lán)色鏈接)。美國新聞聚合網(wǎng)站Buzzfeed去年一則新聞的標(biāo)題指出,“我們正進(jìn)入現(xiàn)代歷史最糟糕的時(shí)期”,接著直接指責(zé)稱“谷歌的實(shí)用性正在降低”。

辛格哈爾對(duì)此作出嚴(yán)詞回應(yīng)?!笆聦?shí)完全相反,”他表示?!拔艺{(diào)查了這些投訴,發(fā)現(xiàn)當(dāng)中存在一些懷舊情緒。我們現(xiàn)在的搜索遠(yuǎn)好于去年或者兩年前。

辛格哈爾的評(píng)論表明了谷歌搜索的關(guān)鍵人物現(xiàn)在所具有的自豪感和信心。在幾年前,盡管谷歌認(rèn)為其搜索質(zhì)量無人能比,但也存在真實(shí)的憂慮—擔(dān)心該公司的統(tǒng)治地位可能被削弱。谷歌當(dāng)時(shí)處于Facebook恐慌的陣痛之中?!拔覀儾粨碛羞@些聯(lián)系,”辛格哈爾在2011年告訴我,顯然他指的是Facebook的網(wǎng)絡(luò)(Facebook禁止谷歌抓取其數(shù)據(jù))?!拔也恢佬畔⒃谶@些網(wǎng)絡(luò)里如何流動(dòng)?!痹谶@種躁狂癥最嚴(yán)重的時(shí)期,辛格哈爾在谷歌擔(dān)當(dāng)類似于兇事預(yù)言家的角色,在某個(gè)時(shí)刻攔住該公司的社交業(yè)務(wù)負(fù)責(zé)人維克·岡多特拉(VicGundotra),高聲指出這些封閉網(wǎng)絡(luò)可能會(huì)威脅谷歌的存在。辛格哈爾在接受采訪時(shí)跟我說,如果有人他向提出這種威脅與谷歌在搜索領(lǐng)域無人能敵的威力不可相提并論,他會(huì)回答說:“在我小時(shí)候,泛美航空公司(Pan Am,1991年倒閉)也是看起來非常強(qiáng)大的。

不過實(shí)際上這些擔(dān)心有點(diǎn)過頭了;現(xiàn)在不可能有人將谷歌比喻為這家已經(jīng)破產(chǎn)的航空公司。Facebook的“圖譜搜索"(Graph Search)仍然是剛起步的產(chǎn)品,但發(fā)展勢(shì)頭緩慢,對(duì)谷歌造成的沖擊較小。必應(yīng)雖然在搜索質(zhì)量上可稱得上是受人尊敬的競(jìng)爭(zhēng)對(duì)手,但所持市場(chǎng)份額仍然不足五分之一。雖然Google Plus的成績(jī)未及公司預(yù)期,未能最終形成一款轟動(dòng)的社交網(wǎng)絡(luò)產(chǎn)品,但的確成功地吸引了很多搜索用戶注冊(cè)加入。

統(tǒng)治地位

谷歌現(xiàn)在面臨的威脅并不是由強(qiáng)勁對(duì)手所組建的封閉網(wǎng)絡(luò),而是搜索現(xiàn)在似乎已經(jīng)從網(wǎng)絡(luò)遷移至各款應(yīng)用程序(向移動(dòng)端轉(zhuǎn)移也代表了谷歌的搜索廣告收入受到挑戰(zhàn))。谷歌認(rèn)為這種應(yīng)用內(nèi)部信息的崛起是可以被其征服的—畢竟,移動(dòng)開發(fā)者也希望自己的信息能夠被世人了解。自從2013年秋天以來,谷歌啟動(dòng)了一個(gè)名為App Indexing的項(xiàng)目,希望將移動(dòng)應(yīng)用程序內(nèi)的數(shù)據(jù)集中到其總索引。不過應(yīng)用索引目前并不包括iOS應(yīng)用,這是一個(gè)比較大的問題。App Indexing產(chǎn)品經(jīng)理勞倫斯·張(Lawrence Chang)表示:“仍然有一條很長的路要走。不過我們已經(jīng)打造了基礎(chǔ)性的結(jié)構(gòu)單元。

不過現(xiàn)在,網(wǎng)絡(luò)應(yīng)用世界的挑戰(zhàn)并沒有影響谷歌在搜索領(lǐng)域的統(tǒng)治地位。數(shù)據(jù)仍然大得令人驚訝。谷歌每天接受超過30億條搜索詞條。在美國,三分之二的搜索使用谷歌—在全球范圍內(nèi),該公司仍然享受類似的統(tǒng)治地位(最近市場(chǎng)份額降低主要不是因?yàn)樗阉髻|(zhì)量問題,而是雅虎與火狐達(dá)成協(xié)議,取代谷歌成為該瀏覽器的默認(rèn)搜索引擎)。甚至更為令人印象深刻的是,谷歌處理超過80%移動(dòng)搜索。2013年谷歌遭遇持續(xù)5分鐘的宕機(jī)事件,網(wǎng)絡(luò)流量減少40%。

沒有任何一家搜索領(lǐng)域競(jìng)爭(zhēng)對(duì)手能達(dá)到谷歌的基礎(chǔ)設(shè)施、人才儲(chǔ)備或者經(jīng)驗(yàn)。沒多少企業(yè)能有谷歌的雄心壯志。因此盡管有關(guān)谷歌的新聞報(bào)道出現(xiàn)了監(jiān)管問題、谷歌眼鏡的幸運(yùn)與不幸以及YouTube的青少年超級(jí)巨星,搜索一直進(jìn)行著穩(wěn)定且高強(qiáng)度的革新。

從某些方面看,這些革新只是延續(xù)谷歌自最初以來對(duì)搜索所進(jìn)行的變革。在微觀基礎(chǔ)上,谷歌對(duì)其算法進(jìn)行了一些細(xì)微調(diào)整,在每周一次的搜索質(zhì)量發(fā)布會(huì)上對(duì)其大加稱贊。之后,每2年或3年,其排名系統(tǒng)會(huì)出現(xiàn)重大更新,從而在那些與關(guān)鍵字高度相關(guān)的企業(yè)之間產(chǎn)生贏家和輸家。最近一次是在2013年,推出代號(hào)為Hummingbird的算法。過去10年,本·戈麥斯(Ben Gomes)一直在搜索部門擔(dān)任辛格哈爾的副手,他指出谷歌在過去3年對(duì)搜索排名進(jìn)行的調(diào)整超過了此前13年。

從各個(gè)方面看,大的挑戰(zhàn)一直在于針對(duì)從PC向便攜設(shè)備轉(zhuǎn)移的趨勢(shì)進(jìn)行調(diào)整。正如很多互聯(lián)網(wǎng)企業(yè)一樣,谷歌搜索采用一種以移動(dòng)為中心的辦法。谷歌搜索的主設(shè)計(jì)師瓊·威利(Jon Wiley) 表示:“移動(dòng)端對(duì)我們?nèi)绾慰紤]設(shè)計(jì)產(chǎn)生巨大影響。”在執(zhí)掌搜索設(shè)計(jì)領(lǐng)導(dǎo)職位后,他首先做的一樣事情是將移動(dòng)和PC團(tuán)隊(duì)整合在一起。最初,這個(gè)想法是將大量努力投入到手機(jī)端—現(xiàn)在,他表示,完全是關(guān)于將搜索視為一種多設(shè)備的體驗(yàn)。

知識(shí)圖譜

重大變革當(dāng)中,哪項(xiàng)最為意義重大的?谷歌搜索團(tuán)隊(duì)對(duì)此毫不掩飾。搜索業(yè)務(wù)負(fù)責(zé)人辛格爾明確表示:“當(dāng)然是知識(shí)圖譜(Knowledge Graph),只要你開始進(jìn)行打造,就能慢慢了解現(xiàn)實(shí)世界。第二是語音輸入—因?yàn)槲也荒茉谶@里打字,”他一邊說著,一邊向手腕上的三星智能手表打手勢(shì)。“我們還意識(shí)到,除了預(yù)測(cè)外還需要一些科學(xué),這樣的話人們就不必總是提出問題,因此我們開發(fā)了Google Now。

知識(shí)圖譜將全世界的知識(shí)打造成一個(gè)廣大的數(shù)據(jù)庫。語音搜索將語音帶到搜索。Google Now在用戶提問之前就告知答案。所有這三項(xiàng)都與谷歌對(duì)移動(dòng)端的關(guān)注密切相關(guān)。這些組成部分—以及它們運(yùn)作的方式—已經(jīng)在過去三年幫助對(duì)谷歌搜索進(jìn)行改造:從一個(gè)“10個(gè)藍(lán)色鏈接”的投遞系統(tǒng)到某些幾乎超自然的東西—這個(gè)系統(tǒng)的行為并不像計(jì)算機(jī),而是一個(gè)智能的知識(shí)儲(chǔ)備庫,能夠聰明地解譯和滿足你的信息需求。在你還沒有開始予以尋找的時(shí)候,它已經(jīng)完成一切。

谷歌在2010年收購一家名為MetaWeb的公司,該消息并沒有引起太多關(guān)注。但事實(shí)證明這筆并購成為了谷歌搜索史上一項(xiàng)最意義重大的變革的關(guān)鍵。

MetaWeb在2005年由丹尼·希利斯(Danny Hillis)創(chuàng)辦,他是一位知名的計(jì)算機(jī)科學(xué)家和企業(yè)家。在經(jīng)營他的公司Applied Minds時(shí),希利斯構(gòu)想了大量創(chuàng)造性項(xiàng)目,不過他認(rèn)為MetaWeb項(xiàng)目非常意義重大,因而將其剝離出來成為一家獨(dú)立公司。MetaWeb公司在2007年成立,是所謂的Semantic Web的首批重大利用成果之一。Semantic Web實(shí)際上是一種處理多數(shù)據(jù)庫的辦法,經(jīng)整合后數(shù)據(jù)庫中的信息可被輕松閱讀。希利斯說:“我們嘗試創(chuàng)造一個(gè)全球性的數(shù)據(jù)庫,包含全世界的信息?!庇捎贛etaweb可以掃描互聯(lián)網(wǎng)來回答問題,因而被廣泛視為是谷歌的競(jìng)爭(zhēng)對(duì)手。不過在經(jīng)過幾年的經(jīng)營以及超過5000萬美元融資后,希利斯意識(shí)到只有加入一家規(guī)模更大的公司—即谷歌—這個(gè)想法才能開花結(jié)果。

當(dāng)時(shí),谷歌已經(jīng)在向用戶提問提供一些直接的回答:如果你輸入“奧巴馬生日”,它會(huì)在搜索結(jié)果的頂部顯示“1961年8月14日”。不過,正如谷歌在2010年7月一篇宣布收購Metaweb的博客文章上解釋說,谷歌的搜索引擎未能回答像“美國西岸學(xué)費(fèi)低于3萬美元的大學(xué)”或“至少奪得過一個(gè)奧斯卡獎(jiǎng)項(xiàng)的40歲以上藝人”這樣的問題。該篇博客承諾Metaweb將幫助谷歌提供這些答案。

產(chǎn)品經(jīng)理艾米麗·莫斯利(Emily Moxley)從2011年就開始參與到Metaweb項(xiàng)目,她表示:“谷歌收購Metaweb的時(shí)候,知道‘物’的概念將成為搜索一個(gè)非常重要的部分。我們認(rèn)為這是快速呈現(xiàn)一些簡(jiǎn)要事實(shí)以及人們所關(guān)注事物的有關(guān)信息的良好途徑。

在2012年5月,谷歌推出了這些Metaweb材料,將其稱為“知識(shí)圖譜”(Knowledge Graph)。該項(xiàng)目從1200萬實(shí)體發(fā)展至5億。該產(chǎn)品可以在自認(rèn)為合適的時(shí)候?qū)λ阉鹘Y(jié)果提供補(bǔ)充性的答案:多項(xiàng)有關(guān)所搜索主題的關(guān)鍵事實(shí),其位置位于平常的搜索排名的右側(cè)。這看起來有點(diǎn)“手氣不錯(cuò)”(I’m feeling lucky)的感覺。

在介紹谷歌如何考慮哪些詞條應(yīng)該獲得知識(shí)圖譜結(jié)果時(shí),莫斯利引用了弗吉尼亞州里奇蒙德(Richmond, Virginia)地區(qū)的洲際高速公路系統(tǒng)。從西北向佛羅里達(dá)州進(jìn)發(fā)的游客應(yīng)該非常清楚這種情況—在里奇蒙德背部,95號(hào)公路出現(xiàn)分叉,駕駛員可以選擇繼續(xù)沿南北主干道行駛并途徑市中心,或者選擇295號(hào)公路,在外圍繞過該城市并在里奇蒙德南部再進(jìn)入95號(hào)公路。

她解釋說,如果用戶提供一個(gè)搜索詞條,谷歌將其擴(kuò)展為替代性的形式以及同義詞等,之后提供一個(gè)算法測(cè)試,從而了解它是否與“知識(shí)圖譜”結(jié)果具有相關(guān)性?!叭缓螅脩艨赡軙?huì)選擇295號(hào)公路的出口,說‘好,有什么可能的知識(shí)圖譜內(nèi)容會(huì)對(duì)這個(gè)詞條有用?’—我們搜索所有的文件,給出相關(guān)的內(nèi)容。之后用戶再次回到95號(hào)公路,我們說‘好,我們認(rèn)為這些內(nèi)容足夠有用,讓我們更顯著地呈現(xiàn)這些信息吧’。

谷歌搜索與“知識(shí)圖譜”整合的2年多里,該公司繼續(xù)改善這款產(chǎn)品(谷歌并未正式公布設(shè)計(jì)“知識(shí)圖譜”回答的詞條比例,不過似乎大約為25%)。最初,“知識(shí)圖譜”較為動(dòng)態(tài)。不過這款產(chǎn)品逐漸掌握谷歌搜索本身所具有的學(xué)習(xí)能力,能夠分析用戶的習(xí)慣。莫斯利舉了“誰在電影《太空炮彈》(Spaceballs)中扮演Barf?”作為例子,“知識(shí)圖譜”已經(jīng)接觸了非常多詞條,因而知道如何提供涉及演員和電影的圖解—并且以非??斓乃俣韧瓿?。

“知識(shí)圖譜”也在另一個(gè)重要領(lǐng)域—新鮮度—取得較大進(jìn)步。由于谷歌假定對(duì)一個(gè)問題提供一個(gè)正確答案,因此其信息必須與時(shí)俱進(jìn)。否則,答案會(huì)是錯(cuò)誤的,對(duì)用戶造成的影響會(huì)比沒有答案更糟糕。莫斯利表示,“知識(shí)圖譜”在2012年推出的時(shí)候,其中一個(gè)實(shí)體的變化—例如大眾汽車(Volkswagen)決定聘請(qǐng)新的首席執(zhí)行官—該系統(tǒng)可能要花長達(dá)2周來反映這種變化?,F(xiàn)在該系統(tǒng)能夠在幾分鐘內(nèi)處理這些新聞并進(jìn)行調(diào)整。但是她承認(rèn),對(duì)“知識(shí)圖譜”而言,這種特定的“大眾汽車首席執(zhí)行官”詞條既是成功也是失敗。新任首席執(zhí)行官要幾個(gè)月后才會(huì)正式上任?!爸R(shí)圖譜”仍然展示當(dāng)前的領(lǐng)導(dǎo)人,不過很多在谷歌輸入“大眾汽車首席執(zhí)行官”詞條的用戶可能尋求的是有關(guān)繼任者的信息。因此,盡管“知識(shí)圖譜”是正確的,其回復(fù)可能不會(huì)令用戶滿意。

谷歌還需要進(jìn)行很多改進(jìn)。首先是增加更多領(lǐng)域和行業(yè);該項(xiàng)目最近增加了汽車、視頻游戲及雨果獎(jiǎng)(Hugo Award)獲獎(jiǎng)?wù)叩闹R(shí)。不過她表示,谷歌正嘗試找出如何提供更加復(fù)雜的結(jié)果—不再只是快速事實(shí),還提供更主觀、更模糊的聯(lián)想?!叭藗儾恢皇菍?duì)事實(shí)感興趣,”她說?!八麄儗?duì)一些主觀性的東西也感興趣,如該電視節(jié)目是否好看。這些東西能幫助將‘知識(shí)圖譜’提升至新的級(jí)別?!边@就像谷歌并不希望讓用戶感覺自己在進(jìn)行機(jī)械搜索,而是咨詢一位圣人,這位圣人不僅無所不知而且在文化方面還具有自己的獨(dú)立見解。

不過這還需要走很長的路,并且由于對(duì)“知識(shí)圖譜”所提供信息的預(yù)期提升,其所犯錯(cuò)誤也不斷令用戶感到失望。莫斯利最近較為煩惱,因?yàn)樗庾R(shí)到“知識(shí)圖譜”雖然了解電視節(jié)目的信息,但是缺乏有關(guān)新節(jié)目以及何時(shí)播出的內(nèi)容。她說:“我希望有這樣的提醒,能告訴我本周有新節(jié)目播出,我也想知道哪些網(wǎng)站有放映,從而可以登陸觀看,”承諾最終谷歌將穿越這個(gè)“中間階段”,雖然該項(xiàng)目還沒有將所有東西都收入到目錄中。

談到期望提升,可能“知識(shí)圖譜”最顯眼的錯(cuò)誤是谷歌在2010年夏天收購Metaweb時(shí)提到的兩個(gè)問題。4年后,其搜索引擎仍然未能對(duì)“美國西岸學(xué)費(fèi)低于3萬美元的大學(xué)”或“至少奪得過一個(gè)奧斯卡獎(jiǎng)項(xiàng)的40歲以上藝人”等問題提供一站式答案。

語音輸入

在意識(shí)到移動(dòng)技術(shù)將變得無處不在后,谷歌決定對(duì)搜索業(yè)務(wù)進(jìn)行一項(xiàng)細(xì)微但意義重大的調(diào)整。該公司不再將搜索詞條視為向計(jì)算機(jī)系統(tǒng)提交的指令,而是把所有輸入的內(nèi)容都當(dāng)成是對(duì)話?!昂茱@然,一旦你擁有這種類型的設(shè)備(他舉起手機(jī)做例證),語音輸入將變得非常重要,”本·戈麥斯說,“同樣非常明確的是,用戶說話比打字更自然。

這種調(diào)整不僅涉及改變搜索引擎處理詞條的方式。它意味著改變我們。我們現(xiàn)在可以將搜索框—不管在PC或在移動(dòng)端上—視為可以進(jìn)行對(duì)話的對(duì)象。塔瑪爾·耶霍舒亞(Tamar Yehoshua) 表示:“在谷歌出現(xiàn)前,人們并沒有詞條的概念,我們花了多年時(shí)間教會(huì)大家使用詞條。不過,如果你以平常的方式進(jìn)行交流,不必進(jìn)行很認(rèn)真的思考,這樣不是更輕松嗎?這會(huì)是非常美好的情景。

進(jìn)行這種變革需要2個(gè)方面。首先,谷歌的搜索引擎必須加強(qiáng),從而更仔細(xì)地傾聽,對(duì)輸入的語音內(nèi)容進(jìn)行分析。之后谷歌必須確保當(dāng)用戶向手機(jī)發(fā)出語音指示—或者在搜索框通過文字進(jìn)行交流,其系統(tǒng)會(huì)理解用戶在說什么。

的確,谷歌已經(jīng)在語音識(shí)別方面進(jìn)行了一段時(shí)間的努力?!霸诤芏嗄昵?,我們當(dāng)然知道這些基礎(chǔ)部分—語音、自然語言處理—將具有重要意義,”耶霍舒亞說?!拔覀冎滥切┒际峭顿Y,都是科技界未曾解決的問題,我們需要花多年時(shí)間才能收獲成果。”在20世紀(jì)初的幾年里,谷歌有一項(xiàng)服務(wù)名為Google 411,所做的事情跟用戶撥打(付費(fèi))電話號(hào)碼查詢系統(tǒng)時(shí)電話公司所做的事情一樣。谷歌使用那數(shù)百萬的免費(fèi)電話來學(xué)會(huì)如何正確地解譯不同語言和口音的語音。這一點(diǎn)非常有用,不過在其他一些地方,谷歌并沒有獲得分析語音輸入所需的大約2500個(gè)短語樣本。因此,該公司開始派遣小型團(tuán)隊(duì)到多個(gè)不同的地區(qū),并在此之前在谷歌網(wǎng)絡(luò)發(fā)布消息稱該公司希望收集語音樣本。在印度尼西亞進(jìn)行的努力具有代表意義。谷歌語音專家林奈·哈(Linne Ha)說:“在第二天,有900人現(xiàn)身?!惫雀柽M(jìn)行這些研究的時(shí)候,會(huì)選擇在與該地區(qū)相匹配的現(xiàn)場(chǎng)條件進(jìn)行收集:如在香港的街道和巴黎的地鐵路里記錄物體。

這些努力獲得了回報(bào)—谷歌搜索支持159種語言,語音搜素(Voice Search)現(xiàn)在支持其中58種語言。谷歌聲稱該應(yīng)用的“錯(cuò)詞率”已經(jīng)降低至8%。

戈麥斯自豪地指出谷歌發(fā)展過程中的一個(gè)里程碑:他現(xiàn)在親自進(jìn)行語音展示?!拔业目谝舴浅2粯?biāo)準(zhǔn),”這位印度裔工程師說?!拔业脑舭l(fā)音是美國的,不過我不發(fā)R的的音?!痹谶@個(gè)語音項(xiàng)目前,戈麥斯從未親自去證明谷歌在語音識(shí)別方面的努力:相反,該公司使用一位內(nèi)部的專家,他具有純正的美國口音,能夠與機(jī)器和諧共處?,F(xiàn)在,戈麥斯已經(jīng)與這位專家失去聯(lián)系?!八辉偈菍?duì)這份工作非常重要,”他說?!拔铱梢杂H自進(jìn)行展示。讓我坐在記者面前,親自進(jìn)行語音輸入,我對(duì)此毫不畏懼。

谷歌還必須考慮電話向用戶回應(yīng)的方式。應(yīng)該像Siri那樣的擬人化形象,還是使用明顯的機(jī)器人語調(diào)從而讓用戶意識(shí)到自己在跟系統(tǒng)對(duì)話?谷歌選擇了后者。該公司搜索設(shè)計(jì)主管瓊·威利表示,為了成功實(shí)現(xiàn)與一個(gè)有意識(shí)個(gè)體對(duì)話這種錯(cuò)覺,他們必須達(dá)到皮克斯(Pixar)般故事自動(dòng)敘述能力?!拔艺J(rèn)為從具有個(gè)性的計(jì)算機(jī)到人類與之自然交流還有很長的路要走。

不過科技迅速發(fā)展,已經(jīng)足以讓谷歌(當(dāng)然,也包括其他一些公司)達(dá)到研究人員數(shù)十年來所幻想的語音互動(dòng)級(jí)別?!拔艺J(rèn)為三或四樣?xùn)|西推動(dòng)實(shí)現(xiàn)了這種可能性,”戈麥斯說?!帮@然,計(jì)算機(jī)變得更快且運(yùn)算能力變得更強(qiáng)。硬件—麥克風(fēng)—也變得更好。軟件算法方面也有進(jìn)步。不過大的變化是我們理解語言的能力。

費(fèi)爾南多·佩雷拉(Fernando Pereira)是搜索部門的“杰出搜索科學(xué)家”(Distinguished Research Scientist),過去30年他一直從事自然語言處理(NLP)工作。他表示,這幾年來,谷歌變得非常善于找出如何接收搜索詞條以及將詞條與網(wǎng)絡(luò)及其他其他信息庫上的文件配對(duì)。他說:“當(dāng)你進(jìn)行搜索的時(shí)候,很有可能你在詞條中使用的詞語會(huì)出現(xiàn)在部分搜索結(jié)果中?!辈贿^將“知識(shí)圖譜”這樣的數(shù)據(jù)庫增加到搜索引擎中會(huì)帶來新的挑戰(zhàn)和機(jī)遇。他指出:“要預(yù)期所使用的語言是否與數(shù)據(jù)庫所設(shè)計(jì)的方式配對(duì)變得更具難度。

一方面,這并不容易。當(dāng)谷歌收到像“巨人隊(duì)在哪里打比賽?”這樣的詞條,它必須知道很多東西:該詞條涉及體育,球隊(duì)所比賽的場(chǎng)館等。它還必須作出選擇—這是棒球聯(lián)盟的巨人隊(duì)還是橄欖球隊(duì)?用戶希望知道的是該球隊(duì)通常在哪里打比賽,如主場(chǎng),還是該球隊(duì)下周的比賽在哪里進(jìn)行?谷歌使用詞條中的信號(hào)以及用戶此前的習(xí)慣來確定答案。佩雷拉說:“所有這些思考,所有的推理,都是在幾年前不能做到的。

一旦這些障礙被去清除,谷歌的NLP系統(tǒng)可以憑借“知識(shí)圖譜”而實(shí)現(xiàn)進(jìn)一步提升?!拔覀冮_始理解世界上的事物,”戈麥斯說。這讓谷歌能夠正確地猜測(cè)用戶在詢問什么,甚至即使詞條的拼寫存在錯(cuò)誤或者語言輸入不太正確。戈麥斯指出,例如有人向手機(jī)說“大衛(wèi)·卡梅倫(David Cameron)”,系統(tǒng)已經(jīng)知道這兩個(gè)詞通常是配對(duì)在一起的,而且還是男性—因而可以使用替代詞“他”。即使麥克風(fēng)沒有太聽清楚后面說到的姓,“知識(shí)圖譜”也可以想到指的是英國首相。

谷歌懂得的東西越多,對(duì)用戶就越了解。

Google Now

在2004年,我問拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)對(duì)于搜索的長期展望。佩奇表示,搜索將融入到人們的大腦中。“當(dāng)你考慮某些東西并且對(duì)其了解不是太多,你會(huì)自動(dòng)獲得信息?!辈剂种赋?,關(guān)鍵點(diǎn)是,“你可以讓與你進(jìn)行交流的設(shè)備或者讓關(guān)注周邊事物的計(jì)算機(jī),提出有用的信息。

在2010年,兩位在Android部門工作的工程師巴利斯·古爾特金(Baris Gultekin)和安德魯·基爾斯姆(Andrew Kirsme)著手一項(xiàng)與上述展望非常相符的課外項(xiàng)目,從而創(chuàng)辦了Google Now。

根據(jù)古爾特金(去年從Google Now調(diào)任至該公司其他項(xiàng)目),這款產(chǎn)品恪守他們最初的宣傳文件?!昂诵牡穆暶魇牵F(xiàn)在大家的手機(jī)并不智能,不過它們可以變得智能,”他說?!叭绻覀兛梢詫⑦@些具有各種功能、強(qiáng)勁和連接互聯(lián)網(wǎng)的設(shè)備的能力與谷歌的能力合并在一起,那會(huì)怎么樣?

換言之,Google Now可以回答那些你沒有主動(dòng)提出來的詞條。這意味著將多個(gè)領(lǐng)域的信息合并起來,解決某些重要的事情。古爾特金表示,最開始創(chuàng)造一個(gè)系統(tǒng)來這樣做是令人恐懼的,不過他和他的合作伙伴開始分解在計(jì)算領(lǐng)域內(nèi)可以如何實(shí)現(xiàn)這個(gè)目標(biāo)。即使某些類似具有限制性的東西也要求系統(tǒng)具有實(shí)質(zhì)性的知識(shí):家和辦公室的地理位置、好路線、交通信息等。如果Google Maps知道如何在路網(wǎng)中導(dǎo)航,肯定會(huì)有幫助作用—但這恰恰就是關(guān)鍵的地方。谷歌會(huì)使用其全部能力去放大這種搜索工具。很快,他們擁有了一款優(yōu)秀的應(yīng)用程序來幫助通勤者?!安贿^我們不希望它只是作為一款通勤應(yīng)用,”古爾特金表示。“我們希望它成為一位主動(dòng)的助手,可以處理很多事情。”因此他們?cè)?012年7月推出了Google Now,主要關(guān)注幾個(gè)領(lǐng)域:通勤、航班、體育比賽、附近的場(chǎng)所、出游、公共交通運(yùn)輸以及天氣?,F(xiàn)在,它已經(jīng)覆蓋超過70個(gè)領(lǐng)域,并且正迅速增加。古爾特金說:“我的遠(yuǎn)大目標(biāo)是,Google Now向用戶提供大部分所需的信息,而其他東西都只成為備用品。

Google Now的有效性取決于將對(duì)世界的了解(所有這些都是谷歌搜索以及“知識(shí)圖譜”能夠提供的)與個(gè)人信息深度融合。這正是為什么有人可能指出,這個(gè)搜索的細(xì)分部門可視為是谷歌的替代品:每一次Google Now及時(shí)提供信息卡,都會(huì)利用大量谷歌服務(wù)。一張普通的信息卡會(huì)將來自個(gè)人電子郵件、日程表和通訊錄的信息與公交線路安排、交通信息及天氣進(jìn)行整合。

很多時(shí)候,只有在Google Now行動(dòng)后,人們才會(huì)準(zhǔn)確知道它干些什么。例如,當(dāng)你停好車后,Google Now會(huì)記錄你停車并記住你停車的位置—以防你忘記了。如果你的電子郵件告訴Google Now你在找房子,該項(xiàng)服務(wù)可能會(huì)向你推送你希望居住地區(qū)的待租售房屋的照片。

隨著Google Now進(jìn)化,它從一個(gè)課外項(xiàng)目發(fā)展為一項(xiàng)全職服務(wù)。不過其大的助推器可能出現(xiàn)在2011年,當(dāng)時(shí)蘋果推出了Siri,這在谷歌總部引起了一些擔(dān)憂情緒,也為這個(gè)以語音為方向的項(xiàng)目吸引了更多資源。它成為搜索部門的一個(gè)正式組成部分,盡管該團(tuán)隊(duì)實(shí)際上受命于搜索和Android兩個(gè)部門。古爾特金表示:“搜索和Google Now都值得贊美。我們希望在用戶搜索之前就為其提供信息,不過在很多情況里,我們不知道你的水管爆裂了,你需要水管工。

(當(dāng)然, 在未來,通過谷歌旗下智能家居企業(yè)Nest,谷歌將知道你家的水管何時(shí)破裂,或者你家是否著火了。古爾特金表示,整合Nest“可能會(huì)在將來,但不是現(xiàn)在”。)

與傳統(tǒng)版本的搜索不同的是,Google Now搜索只有在你全部采用谷歌產(chǎn)品的情況下才能起到效果。耶霍舒亞表示:“拉里(佩奇)曾說過,搜索應(yīng)該理解你的意圖并提供你所需的信息。這是一個(gè)谷歌生態(tài)系統(tǒng),如果你在手機(jī)端和PC上注冊(cè)登陸后,我們可以予以利用。如果你想要獲得航班信息并追蹤你的包裹以及任何來自Gmail的信息,我們都會(huì)帶給你。如果你沒有使用Gmail,你就不會(huì)得到信息—不過你還是可以利用我們的語音服務(wù)并獲得答案。

沒有其他解決辦法—如果你想要使用Google Now但Gmail不是你默認(rèn)的郵箱,你不會(huì)得到Google Now甚至谷歌搜索的全部?jī)r(jià)值。“如果我們可以將這些信息分享給所有人,這會(huì)是非常美好的事情。我不認(rèn)為這會(huì)在明天出現(xiàn)。當(dāng)然,蘋果也會(huì)給我們帶來壓力。

谷歌非??桃獾夭粚oogle Now作為一款獨(dú)立的產(chǎn)品。相反,該公司將其視為搜索應(yīng)用的一部分。該應(yīng)用并不是以搜索作為名稱,而是冠名“谷歌”。這種命名法不僅顯示搜索非常密切地與谷歌聯(lián)系在以前,還顯示Googe Now對(duì)該公司非常重要。

盡管如此,Googe Now部件仍是可選部件。所有人使用的時(shí)候都會(huì)考慮隱私警告;該產(chǎn)品看起來無所不知,但也從側(cè)面提醒我們這家巨頭對(duì)我們是多么了解。隨著谷歌對(duì)個(gè)人信息的掌控引發(fā)更多麻煩,特別是在歐洲,當(dāng)?shù)卣苿?dòng)加強(qiáng)監(jiān)管并實(shí)施罰款,甚至威脅將其分拆,該公司希望服務(wù)大眾的雄心壯志可能會(huì)被隱私擔(dān)憂所挫敗。即使對(duì)于那些信任谷歌的人士而言,斯諾登事件證明政府可以很輕松地訪問我們的信息。如果Google Now知道你把車停在哪里,當(dāng)?shù)氐那閳?bào)部門也是如此,對(duì)吧?

辛格哈爾認(rèn)為,搜索的第一個(gè)時(shí)代是以人們想象在他們與某些遙遠(yuǎn)機(jī)器之間進(jìn)行互動(dòng)為標(biāo)志的?,F(xiàn)在這個(gè)新時(shí)代清除了這個(gè)障礙。我們預(yù)期電話會(huì)明白我們的意思。我們預(yù)期搜索也同樣精通于提供涉及我們個(gè)人信息的答案,因?yàn)樗诎l(fā)掘來自網(wǎng)頁、文件和公共數(shù)據(jù)庫的信息。

“我認(rèn)為搜索是所有計(jì)算的界面,”辛格哈爾說?!爱?dāng)設(shè)備消失或者變小,你將如何與它們互動(dòng)?因?yàn)樵诖蟛糠謺r(shí)間里,你需要采取行動(dòng)—可能簡(jiǎn)單如播放音樂,或復(fù)雜如寫便簽來提醒自己經(jīng)過附近雜貨店時(shí)買牛奶?;蛘吣阆胫榔拮拥暮桨嗍欠駵?zhǔn)點(diǎn)?或者奧巴馬有多高?

人們可能認(rèn)為這是理所當(dāng)然的—他們甚至可能抱怨說谷歌搜索不再像以前那樣了。不過辛格哈爾認(rèn)為,搜索已經(jīng)跨越了一個(gè)他在過去幾十年所對(duì)付的障礙。辛格哈爾說:“20年來,我作為研究員未能做到這一點(diǎn)”,他指的是他的團(tuán)隊(duì)為谷歌搜索實(shí)現(xiàn)的成就。他承認(rèn),有很多問題還有待解決。不過在描述詞條后面的科學(xué)時(shí),他充滿了自豪感。當(dāng)有人提出“天空為什么是藍(lán)色”這樣簡(jiǎn)單的問題時(shí),谷歌能夠成功地進(jìn)行回應(yīng)。

網(wǎng)站標(biāo)題:谷歌三大法寶:知識(shí)圖譜、語音搜索和Google Now
本文地址:http://www.bm7419.com/news/46117.html

網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián),是專注品牌與效果的網(wǎng)站制作,網(wǎng)絡(luò)營銷seo公司;服務(wù)項(xiàng)目有Google

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設(shè)