搜索引擎的發(fā)展歷史和現(xiàn)狀分析

2024-01-29    分類: 網(wǎng)站建設(shè)

搜索引擎的發(fā)展歷史
搜索引擎的起源:
1990年,加拿大麥吉爾大學(xué)(University of McGill)計(jì)算機(jī)學(xué)院的師生(Alan Emtage、Peter Deutsch、Bill Wheelan)開發(fā)出Archie(Archie FAQ).當(dāng)時,萬維網(wǎng)(World Wide Web)還沒有出現(xiàn),人們通過FTP來共享交流資源.Alan Emtage等想到了開發(fā)一個可以用文件名查找文件的系統(tǒng),于是便有了Archie.Archie是第一個自動索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,能定期搜集并分析FTP服務(wù)器上的文件名信息,提供查找分別在各個FTP主機(jī)中的文件,但它還不是真正的搜索引擎,Archie用戶必須輸入精確的文件名進(jìn)行搜索,Archie告訴用戶哪個FTP服務(wù)器能下載該文件.雖然Archie搜集的信息資源不是網(wǎng)頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務(wù).所以,Archie被公認(rèn)為現(xiàn)代搜索引擎的鼻祖.
由于Archie深受歡迎,受其啟發(fā),Nevada System Computing Services大學(xué)于1993年開發(fā)了一個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ).Jughead是后來另一個Gopher搜索工具.

Spider的出現(xiàn)
當(dāng)“蜘蛛”程序出現(xiàn)時,現(xiàn)代意義上的搜索引擎才初露端倪.它實(shí)際上是一種電腦“機(jī)器人”(Computer Robot),由于專門用于檢索信息的“機(jī)器人”程序就象蜘蛛一樣在網(wǎng)絡(luò)間爬來爬去,反反復(fù)復(fù),不知疲倦.所以,搜索引擎的“機(jī)器人”程序就被稱為“蜘蛛”程序.現(xiàn)在主流定義的[搜索引擎的工作原理] ,無不把spider放在相當(dāng)重要的位置.
這種程序?qū)嶋H是利用html文檔之間的鏈接關(guān)系,在Web上一個網(wǎng)頁一個網(wǎng)頁的爬?。╟rawl),將這些網(wǎng)頁抓到系統(tǒng)來進(jìn)行分析,并放入數(shù)據(jù)庫中.第一個開發(fā)出“蜘蛛”程序的是Matthew Gray,他于1993年開發(fā)了World Wide Web Wanderer,它最初建立時是為了統(tǒng)計(jì)互聯(lián)網(wǎng)上的服務(wù)器數(shù)量,到后來發(fā)展到能夠捕獲網(wǎng)址.現(xiàn)代搜索引擎的思路就來源于Wanderer,后來很多人在此基礎(chǔ)上對蜘蛛程序進(jìn)行了改進(jìn).
1994年7月20日發(fā)布的Lycos網(wǎng)站第一個將 “蜘蛛”程序接入到其索引程序中.引入“蜘蛛”后給其帶來的大優(yōu)勢就在于其遠(yuǎn)勝于其它搜索引擎的數(shù)據(jù)量.自此之后幾乎所有占據(jù)主導(dǎo)地位的搜索引擎中,都靠“蜘蛛”來搜集網(wǎng)頁信息.
1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創(chuàng)立了Inktomi,1996年5月20日,Inktomi公司成立,強(qiáng)大的HotBot出現(xiàn)在世人面前.聲稱每天能抓取索引1千萬頁以上,所以有遠(yuǎn)超過其它搜索引擎的新內(nèi)容.HotBot也大量運(yùn)用cookie儲存用戶的個人搜索喜好設(shè)置.

可搜索目錄
1994年4月,斯坦福大學(xué)的兩名博士生,美籍華人楊致遠(yuǎn)和David Filo共同創(chuàng)辦了Yahoo!.隨著訪問量和收錄鏈接數(shù)的增長,Yahoo目錄開始支持簡單的數(shù)據(jù)庫搜索.Yahoo!中收錄的網(wǎng)站,因?yàn)槎几接泻喗樾畔?所以搜索效率明顯提高.
1996年8月,sohu公司成立,制作中文網(wǎng)站分類目錄,曾有“出門找地圖,上網(wǎng)找搜狐”的美譽(yù).
他們因?yàn)閿?shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個可搜索的目錄.隨著互聯(lián)網(wǎng)網(wǎng)站的急劇增加,這種人工編輯的分類目錄已經(jīng)不適應(yīng).
1997年8月,Northernlight搜索引擎正式現(xiàn)身.它曾是擁有大數(shù)據(jù)庫的搜索引擎之一,它沒有Stop Words,它有出色的Current News、7100多出版物組成的Special Collection、良好的高級搜索語法,第一個支持對搜索結(jié)果進(jìn)行簡單的自動分類.

元搜索引擎
1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎(Meta Search Engine).用戶只需提交一次搜索請求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢結(jié)果,集中起來處理后再返回給用戶.
第一個元搜索引擎,是Washington大學(xué)碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler.元搜索引擎概念上好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強(qiáng)勢地位.

實(shí)現(xiàn)高級搜索語法
1995年12月,DEC的正式發(fā)布AltaVista.AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實(shí)現(xiàn)高級搜索語法的搜索引擎(如AND、 OR、 NOT等).用戶可以用AltaVista搜索新聞組(Newsgroups)的內(nèi)容并從互聯(lián)網(wǎng)上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects.AltaVista也聲稱是第一個支持用戶自己向網(wǎng)頁索引庫提交或刪除URL的搜索引擎,并能在24小時內(nèi)上線.AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網(wǎng)站.在面向用戶的界面上,AltaVista也作了大量革新.它在搜索框區(qū)域下放了“tips”以幫助用戶更好的表達(dá)搜索式,這些小tip經(jīng)常更新,這樣,在搜索過幾次以后,用戶會看到很多他們可能從來不知道的的有趣功能.這系列功能,逐漸被其它搜索引擎廣泛采用.1997年,AltaVista發(fā)布了一個圖形演示系統(tǒng)LiveTopics,幫助用戶從成千上萬的搜索結(jié)果中找到想要的.

智能檢索的產(chǎn)生:
它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進(jìn)一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關(guān)同級詞典檢索處理形成一個知識體系或概念網(wǎng)絡(luò),給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果.
1998年10月之前,Google只是斯坦福大學(xué)(Stanford University)的一個小項(xiàng)目BackRub.1995年博士生Larry Page開始學(xué)習(xí)搜索引擎設(shè)計(jì),于1997年9月15日注冊了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo.1999年2月,Google完成了從Alpha版到Beta版的蛻變.Google公司則把1998年9月27日認(rèn)作自己的生日.Google以網(wǎng)頁級別(Pagerank)為基礎(chǔ),判斷網(wǎng)頁的重要性,使得搜索結(jié)果的相關(guān)性大大增強(qiáng).Google公司的奇客(Geek)文化氛圍、不作惡(Don’t be evil)的理念,為Google贏得了極高的口碑和品牌美譽(yù).2006年4月,Google宣布其中文名稱“谷歌”,這是Google第一個在非英語國家起的名字.
2000年1月,兩位北大校友,超鏈分析專利發(fā)明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士后)在成都中關(guān)村創(chuàng)立了百度(Baidu)公司.2001年8月發(fā)布Baidu.com搜索引擎Beta版(此前Baidu只為其它門戶網(wǎng)站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發(fā)布Baidu搜索引擎,專注于中文搜索.Baidu搜索引擎的其它特色包括:百度快照、網(wǎng)頁預(yù)覽/預(yù)覽全部網(wǎng)頁、相關(guān)搜索詞、錯別字糾正提示等.2002年3月閃電計(jì)劃(Blitzen Project)開始后,技術(shù)升級明顯加快.后推出貼吧、知道、地圖、國學(xué)、百科、文檔、視頻、博客等一系列產(chǎn)品,深受網(wǎng)民歡迎.2005年8月5日在納斯達(dá)克上市,發(fā)行價為USD 27.00,代號為BIDU.開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創(chuàng)下了5年以來美國股市上市新股當(dāng)日漲幅最高紀(jì)錄.

個性化趨勢
個性化搜索是搜索引擎的一個未來發(fā)展的重要特征和必然趨勢之一:一種通過搜索引擎的社區(qū)化產(chǎn)品(即對注冊用戶提供服務(wù))的方式來組織個人信息,然后在搜索引擎基礎(chǔ)信息庫的檢索中引入個人因素進(jìn)行分析,獲得針對個人不同的搜索結(jié)果.自2004年10月yahoo推出myweb測試版,到11月a9推出個性化功能,到2005年Google search history基本上都沿著一條路子走,分析特定用戶的搜索需求限定的范圍,然后按照用戶需求范圍擴(kuò)展到互聯(lián)網(wǎng)上其他的同類網(wǎng)站給出最相關(guān)的結(jié)果.另外一種是針對大眾化的,Google個性化搜索引擎,或者yahooMindSet,或者我們都知道的前臺聚類的vivisimo

網(wǎng)站名稱:搜索引擎的發(fā)展歷史和現(xiàn)狀分析
當(dāng)前地址:http://www.bm7419.com/news8/316108.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)、企業(yè)網(wǎng)站制作、商城網(wǎng)站、自適應(yīng)網(wǎng)站、品牌網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站