導航:首頁 > 使用方法 > 構建檢索式常用的方法是

構建檢索式常用的方法是

發布時間:2025-08-21 11:17:40

如何構建搜索引擎的檢索式

檢索式的構建
檢索式是搜索引擎能夠理解和運算的查詢串,由關鍵詞、邏輯運算符、搜索指令(搜索語法)等構成。關鍵詞是檢索式的主體,邏輯運算符和搜索指令根據具體的查詢要求從不同的角度對關鍵詞進行搜索限定。
1、關鍵詞
關鍵詞是描述搜索內容的關鍵性詞語。網路搜索中的關鍵詞是一個廣義的概念,屬於非受控自由詞,凡是具有實際意義的表達及其書寫形式,如字、詞、片語、短語和字母、數字、符號、公式等,都可以用作搜索關鍵詞。

網路搜索,實際上是在搜索引擎的索引資料庫中進行匹配檢索。搜索引擎並不對其資料庫進行可控語言標引,而只是機械地輸出與關鍵詞形式匹配的網頁,隨著資料庫規模的不斷增長,符合形式匹配條件的結果輸出將會越來越多,盡管一些搜索引擎採用了智能分詞技術,具有一定程度的概念檢索功能,但仍然不可避免地會出現大量的無用信息。在形式匹配的技術條件下,關鍵詞優化是最大限度地消除無用信息的主要方法。關鍵詞在網路搜索中起著「關鍵」的作用,關鍵詞選擇准確與否直接關繫到搜索的成敗,而成功搜索的標志是在結果列表的首頁就能夠滿足查詢需求。

從形式上看,關鍵詞的數量與結果輸出成反比,使用關鍵詞越多結果輸出越少,如用「搜索引擎優化」在GOOGLE中搜索,「約有603,000項符合搜索引擎優化的查詢結果」、「搜索引擎優化 網站推廣」搜索,「約有215,000項符合搜索引擎優化 網站推廣的查詢結果」、「搜索引擎優化 網站推廣 競價排名」搜索,「約有30,800項符合搜索引擎優化 網站推廣 競價排名 的查詢結果」。從語義上分析,關鍵詞的外延越小結果越趨於准確,如用「圖書館參考咨詢工作」、「圖書館讀者服務工作」等搜索,要比用「圖書館工作」更有實際搜索意義,結果也更加具體、適用。從詞間的邏輯關系講,「與」和「非」(and & not)採用多詞限制和無關排除的方法縮小搜索范圍,用於提高查准率,如「劉德華and身高and體重and籍貫」、「天龍八部 –電視劇」等。「或」(OR)利用多詞擴展的方法擴大搜索范圍,如用「劉德華 OR "Andy Lau"」搜索,可以得到較高的查全率。

准確選擇關鍵詞需要從表述方式、行文習慣、書寫規則等方面揣度查詢內容,力求關鍵詞與內容描述詞的一致。由於搜索引擎的形式匹配原理,使用同一概念的不同詞語搜索的結果截然不同。例如,用「北京」搜索不會出現「首都」字樣,「北京圖書館」找不到「國圖」的有關內容,「WTO」與「世界貿易組織」的搜索結果大向徑庭等等。因此,必須注意對習慣用語、專業術語、全稱、簡稱、同義詞、近義詞,以及拼音文字的前綴、後綴的了解和運用,盡可能地提高關鍵詞的形式匹配幾率,最大限度地減少誤檢和漏檢。
關鍵詞可以分為主題關鍵詞和特徵關鍵詞。主題關鍵詞是指表述主要搜索內容的必用的詞語,不使用主題關鍵詞就不能准確地搜索到特定的內容。特徵關鍵詞是指在內容描述中與主題關鍵詞同時出現且位置較近的量詞、形容詞、名詞等進一步說明和限定主題關鍵詞的詞語,特徵關鍵詞可以有效地縮小搜索范圍,使結果排序更加趨前。在搜索實踐中經常會遇到這樣的情況:即盡管主題關鍵詞選擇准確、使用得當,查詢內容仍然不在結果首頁或前三頁之中,這時如果增加使用特徵關鍵詞,搜索結果就會明顯改善。例如,查找國際象棋有幾個棋子,在網路中用「國際象棋 棋子」搜索,有42,600項結果,前幾頁結果均無明確的答案,而增加特徵關鍵詞「個」,以「國際象棋 個棋子」搜索,結果減少至1,270項,結果首頁第一項即有「國際象棋共有32個棋子,分為兩方,淺色的棋子稱為白棋,深色的棋子稱為黑棋……」的網頁摘要。

正確選擇關鍵詞,需要對查詢內容有一定了解,有一個根據搜索結果從模糊到准確的逐步調整關鍵詞的練習過程。例如,查找有關「電動玩具」的英文資料,一般會選擇「Electrical toy」搜索,但通過對其搜索結果進行分析,可以發現「Electrically operated toy」、「Battery operated toy」等也是查找「電動玩具」的必用關鍵詞。又如,查找國外「指甲剪生產廠家」的信息,從「"nail scissors" factory」的搜索結果可以了解到,「指甲剪」和「廠家」習慣用「Nail Clippers」和「Manufacturer」表示,使用「"Nail Clippers" Manufacturer」搜索可以更好地滿足查詢需求。搜索的過程是一個學習和信息甄別的過程,要學會在搜索中選擇和提煉關鍵詞,豐富的搜索實踐是成為搜索高手的必由之路。

2、邏輯運算符

網路搜索中有「與(and)」、「或(or)」、「非(not)」三種邏輯關系,分別用「+」、「OR」、「-」表示,它們稱為布爾邏輯符或邏輯運算符。

「與」關系為「A+B」形式,表示A和B必須同時出現在網頁之中;「或」關系為「A OR B」形式,表示結果中,要麼有A,要麼有B,要麼同時有A和B;「非」為「A –B」形式,表示B一定不會出現在搜索結果之中。

在搜索引擎中,表示「與」關系的「+」通常可以省略,以詞間空格代替,或者說,詞間空格默認為「and」運算。「或」關系多以「OR」表示,但不同的搜索引擎對其大小寫有嚴格的要求(如在GOOGLE中必須大寫),或採用其它的符號表示(如「網路」以「|」表示)。「非」關系用「not」或「and not」表示,減號「-」是「not」運算的唯一符號形式。

使用邏輯運算符之前,須閱讀搜索引擎的「幫助(Help)」文件,確認其支持何種邏輯運算,了解和掌握邏輯符號的形式及其用法。

3、通配符

通配符(wildcard)是一類鍵盤字元,用來代替規定的對象。搜索引擎最常用的通配符有星號(*)和問號 (?)等,通常星號(*)表示替代若干字母,問號 (?)表示替代一個字母。

通配符又可以分為「詞間通配符」(partial-word wildcard)和「全詞通配符」(full-word wildcard)兩種。詞間通配符只能代替單詞中的一個或幾個字母,而不是整個單詞;全詞通配符用來代替一個單詞,而不是單詞中的某個或幾個字母。

截詞檢索(truncation)是網路搜索的常用方法,它使用「詞間通配符」,用截斷的詞的一個局部進行的檢索,按截斷的位置可分為前截斷、中截斷和後截斷三種,搜索引擎多支持中截斷和後截斷檢索。例如,「wom?n」可以搜索到包含woman、women、womyn、womin等單詞的網頁,「Comput*」對Computer、Computing、Computation 等以Comput 開頭的單詞進行搜索。

Google使用的通配符屬於「全詞通配符」,通配符為星號(*),一次檢索可以使用若干個*。全詞通配符雖不及詞間通配符常用,但它在實際搜索中的功能是不可忽視和替代的。如解答「How often does Halley's comet appear?」(哈雷彗星多少年出現一次?),用「Halley's comet appears every * years」搜索,可以輕而易舉地得到答案:Halley's comet appears every 76 years。

搜索引擎對截詞檢索的支持程度和通配符的規定多有不同,了解和使用通配符,請參閱搜索引擎的幫助文件。

4、搜索指令

搜索指令是從不同角度限定網路搜索的功能性詞語和符號,對搜索結果起著定向和控制的作用。搜索引擎使用不同的搜索指令實現不同的搜索功能,即使是相同或相似的搜索功能也可能採用不同的搜索指令。搜索指令形式的多樣化給實際的搜索應用帶來一定的困難。在搜索實踐中,我們可以按照搜索功能對常用的搜索指令進行區分與歸納,以便於了解、掌握和正確使用搜索指令。

閱讀全文

與構建檢索式常用的方法是相關的資料

熱點內容
治療兒童咳嗽的方法 瀏覽:118
辨識危險源的方法有哪些 瀏覽:630
評價方法層次分析法 瀏覽:128
鼻噴霧劑的正確使用方法步驟 瀏覽:176
檢測幽門螺桿菌最有效方法 瀏覽:910
紫砂壺刻字是用什麼方法 瀏覽:568
絞牙避震後李子串安裝方法 瀏覽:504
筆記本電腦鍵盤轉換方法 瀏覽:453
oqo高壓鍋的使用方法 瀏覽:758
教育有哪些方法有哪些特點 瀏覽:679
線條單一訓練方法 瀏覽:513
構建檢索式常用的方法是 瀏覽:747
五八炮訓練方法 瀏覽:100
裝飾包邊安裝方法 瀏覽:511
腳踝濕疹怎麼治療方法 瀏覽:764
六歲孩子不睡覺用什麼方法 瀏覽:429
調漂找底方法視頻 瀏覽:641
成都大板套裁安裝方法 瀏覽:81
茶葉好壞判斷方法視頻 瀏覽:743
血管性頭疼不治療方法 瀏覽:801