- 相關(guān)推薦
計(jì)算機(jī)三級(jí)考試網(wǎng)絡(luò)搜索技術(shù)知識(shí)輔導(dǎo)
導(dǎo)語(yǔ):Google是目前世界上使用率和搜索精度最高的全文搜索引擎,下面就由小編為大家?guī)?lái)計(jì)算機(jī)三級(jí)考試網(wǎng)絡(luò)搜索技術(shù)知識(shí)輔導(dǎo),希望能給大家?guī)?lái)幫助!
1.搜索引擎的原理和組成
(1)搜索引擎的原理
搜索引擎的原理起源于傳統(tǒng)的信息全文檢索理論,即計(jì)算機(jī)程序通過(guò)掃描一篇文章中的所有詞,建立以詞為單位的排序文件,檢索程序根據(jù)檢索詞在每篇文章中出現(xiàn)的頻率和概率,對(duì)包含這些檢索詞的文章排序,最后輸出排序結(jié)果。
(2)全文搜索引擎功能模塊的組成
現(xiàn)在的全文搜索引擎一般由搜索器、索引器、檢索器和用戶接口4個(gè)部分組成。
、偎阉髌。搜索器也稱為“蜘蛛”、“機(jī)器人”或“爬蟲(chóng)”,實(shí)際上是一種基于Web的程序。搜索器在Internet上逐個(gè)訪問(wèn)服務(wù)器來(lái)收集信息,它通過(guò)請(qǐng)求Web站點(diǎn)上的HTML網(wǎng)頁(yè)來(lái)采集該 HTML網(wǎng)頁(yè),并建立一個(gè)網(wǎng)站的關(guān)鍵字列表。搜索器建立關(guān)鍵字列表的過(guò)程稱為網(wǎng)絡(luò)爬行。
②索引器。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫(kù)的索引表。索引器可使用集中式索引算法或分布式索引算法。索引算法對(duì)索引器的性能有很大的影響。一個(gè)搜索引擎的有效性在很大程度上取決于索引的質(zhì)量。
、蹤z索器。檢索器的功能是根據(jù)用戶查詢?cè)谒饕龓?kù)中快速地檢索出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶相關(guān)性的反饋機(jī)制。網(wǎng)頁(yè)檢索器是一個(gè)在Web服務(wù)器上運(yùn)行的CGI(公共網(wǎng)關(guān)接口)程序。
④用戶接口。用戶接口的作用是輸入用戶查詢,顯示查詢結(jié)果,提供用戶相關(guān)性反饋機(jī)制。用戶接口可以分為簡(jiǎn)單接口和復(fù)雜接口兩種。
(3)目錄導(dǎo)航式搜索引擎和網(wǎng)頁(yè)搜索引擎的組成
目錄導(dǎo)航式搜索引擎的信息搜集系統(tǒng)主要由人工完成,搜索引擎的標(biāo)引專(zhuān)家依靠手工來(lái)搜尋不斷出現(xiàn)的新網(wǎng)站,給每個(gè)網(wǎng)站一個(gè)標(biāo)題和大概描述,將其放入相應(yīng)的類(lèi)目體系中。在頁(yè)面上體現(xiàn)為每個(gè)類(lèi)目路徑下排列著的相關(guān)網(wǎng)站,所以也稱為目錄導(dǎo)航。目錄導(dǎo)航式搜索引擎提供兩種查詢接口形式:一種是直接單擊目錄樹(shù),另一種是關(guān)鍵字檢索。
2.Google和百度搜索引擎
Google是目前世界上使用率和搜索精度最高的全文搜索引擎,百度則是全球最大的中文搜索引擎,兩者分別是國(guó)外、國(guó)內(nèi)搜索引擎的領(lǐng)頭羊。
(l)Google的主要技術(shù)
Google成立于1998年,創(chuàng)始人為美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的兩位博士。Google一詞由英文單詞googol變化而來(lái),表示1后面有100個(gè)零的數(shù)字,顯示了Google搜索能力的強(qiáng)大。
Google的主要技術(shù)有以下幾點(diǎn):
、倬W(wǎng)頁(yè)采集技術(shù)——分布式爬行系統(tǒng)。該系統(tǒng)通常由一個(gè)URL服務(wù)器將URL列表提供給網(wǎng)絡(luò)爬行器(Google同時(shí)運(yùn)行3個(gè)爬行器)。每個(gè)爬行器同時(shí)保持大約300個(gè)網(wǎng)絡(luò)連接。
、陧(yè)面等級(jí)技術(shù)(Page Rank)。Google是以O(shè)pen Directory Project為類(lèi)目基礎(chǔ),開(kāi)發(fā)了獨(dú)樹(shù)一幟的Page Rank技術(shù)。
、鄢谋酒ヅ浞治黾夹g(shù)。超文本匹配分析技術(shù)是目前搜索引擎中最先進(jìn)的檢索技術(shù)。
(2)百度的主要技術(shù)
百度(www.Baidu.com)于1999年底在美國(guó)硅谷成立,創(chuàng)始人是北京大學(xué)的兩位畢業(yè)生李彥宏和徐勇。“百度”一詞來(lái)源于辛棄疾的名句“眾人尋他千百度”。
、僦悄苄、可擴(kuò)展搜索技術(shù)。
、谥悄芑形恼Z(yǔ)言處理技術(shù)。
③分布式結(jié)構(gòu)化算法與容錯(cuò)設(shè)計(jì)。
、苤悄芑嚓P(guān)度算法技術(shù)。
⑤檢索結(jié)果的智能化輸出技術(shù)。
、薷咝У乃阉魉惴ê头⻊(wù)器本地化。
在檢索功能方面,百度還具有如下的功能:體貼的提示功能、快照功能、專(zhuān)業(yè)的MP3搜索功能、便于用戶交流的“貼吧”功能、百度常用搜索功能等。
【計(jì)算機(jī)三級(jí)考試網(wǎng)絡(luò)搜索技術(shù)知識(shí)輔導(dǎo)】相關(guān)文章:
計(jì)算機(jī)三級(jí)網(wǎng)絡(luò)技術(shù)考點(diǎn)網(wǎng)絡(luò)搜索技術(shù)概述06-30
計(jì)算機(jī)三級(jí)網(wǎng)絡(luò)技術(shù)輔導(dǎo)知識(shí)07-15
計(jì)算機(jī)三級(jí)網(wǎng)絡(luò)技術(shù)輔導(dǎo):網(wǎng)絡(luò)安全技術(shù)08-20
計(jì)算機(jī)三級(jí)網(wǎng)絡(luò)技術(shù)輔導(dǎo):網(wǎng)絡(luò)應(yīng)用技術(shù)08-25
計(jì)算機(jī)等考三級(jí)網(wǎng)絡(luò)技術(shù)知識(shí)點(diǎn):安全技術(shù)應(yīng)用08-09
計(jì)算機(jī)等考三級(jí)網(wǎng)絡(luò)技術(shù)知識(shí)點(diǎn):加密技術(shù)08-27
2016計(jì)算機(jī)三級(jí)網(wǎng)絡(luò)技術(shù)輔導(dǎo):VoIP08-31
計(jì)算機(jī)等級(jí)考試三級(jí)網(wǎng)絡(luò)的經(jīng)驗(yàn)08-19
計(jì)算機(jī)等考三級(jí)網(wǎng)絡(luò)技術(shù)輔導(dǎo):網(wǎng)絡(luò)應(yīng)用技術(shù)10-02