淺析索引量、收錄量、site結果之間的關系
從搜索原理上講,蜘蛛先抓取到一個網頁的URL,然后對這個URL對應網頁的內容進行下載、分析,對于符合其質量標準或有一定用途的網頁進行索引,把索引后的網頁放入索引數據庫中。這時候索引庫內的營銷型網站建設有些具有用戶檢索價值的,有些是具有搜索引擎自身的檢索價值的,對于對用戶有檢索價值的被索引的網頁,會進行輸出,也即是我們說的收錄。而對僅僅有搜索引擎自身檢索價值的網頁可能并不輸出,僅僅有一定的索引量而沒有輸出結果數,因此我們可以看到很多時候收錄量會比索引量低很多。
站在搜索的角度而言,一個網站的網頁數量有時候是大于目前所擁有的網頁數量的。舉例來講,比如一個站有100個網頁,對于用戶或者站長而言,是100個網頁,但是這100個網頁可能進行了數據更新,網頁改變等多個操作,不同版本或許能滿足不同的需求,(因此我們也可以看到很多時候一個網頁有不同的快照。)從這個角度而言,在搜索的眼中一個網站的網頁數量是可以大于網站目前所擁有的輸出網頁數量的,特別對于頻繁修改的網站或者URL不規范的站點。同時,站在搜索引擎的數據角度而言,其數據量可能由歷史數據和更新數據等組成的,因此site相關結果值也大于site結果數。
依據上面的說法,我們把四者的關系重新梳理下:
索引量和收錄量:索引量是所有對搜素有價值頁面的集合,這些頁面有些對用戶有價值,把這些頁面輸出出來就是收錄量(不同的人可能定義不一樣),有些頁面僅僅對搜索引擎自身有價值,這些頁面數量就造成了索引量高于收錄量的數值。
site結果數與相關結果值:我們很多時候會看到site結果一般如下圖:

我們看到一個問題,相關結果數為2790,而site結果僅僅為100左右,兩者差距甚大。造成期差距的原因可能是有多個因素造成的,比如有些網頁可能被重復計算了,有些網頁雖然被收錄了(檢索價值是有的)但是頁面質量不高(網頁價值和檢索價值不是一碼事,網頁檢索價值僅僅是網頁價值的一個基礎而已,而網頁價值是多個因素組成的。)
同時我們也要知道,蜘蛛畢竟是機器,而且互聯網上很多網站的網頁數量在不同地進行著變化,一直有新的網頁產生和老網頁的刪除,我們某個時候看到的值是一個大體準確的值,而并不是100%準確的。
從包含關系而言,這四者的關系大體如下:
索引量大于收錄量,收錄量大于site結果數,而相關結果數是大于site結果數。不過在一般情況下,我們個人建議采用下面的方法簡化這些關系:
1,site直接結果數對seo意義和價值較大,除了可以用site結果數來判斷一些頁面價值外,在收錄上我們建議提高site結果數和百度索引量的比值、百度索引量與整個網站網頁數量的比值,從這2個比值入手進行seo優化和操作。至于其中糾糾結結的概念這類的,直接無視就好了。
2,百度索引量=百度收錄量,因為收錄量其實是無法看到的,site結果數和相關結果值也無法代表收錄量。
推薦新聞
更多行業-
百度算法并不是完全隨著用戶體驗而改變
百度算法并不是完全隨著用戶體驗而改變百度算法每每變更,許多朋儕都嘗到了...
2011-11-19 -
什么是網絡適配器
網絡適配器(Network Interface Adapter, NI...
2014-06-23 -
騰訊Soso搜索引擎快照技術還不夠完善
騰訊Soso搜索引擎快照技術還不夠完善自己用織夢CMS建了一個資源網站...
2011-11-20 -
企業網站設計的一些"小建議"
在今天的生活中,互聯網的使用越來越普遍,我們大多數人幾乎每天都要訪問一...
2020-10-22 -
SEO網站優化問題檢測的順序
SEO網站優化問題檢測的順序你不得不相信SEO網站優化問題的檢測也是有...
2011-12-18 -
如何安裝Zend Studio
Zend Studio是Zend公司出從的一款榮獲多個大獎的PHP網站...
2015-12-14
預約專業咨詢顧問溝通!
免責聲明
非常感謝您訪問我們的網站。在您使用本網站之前,請您仔細閱讀本聲明的所有條款。
1、本站部分內容來源自網絡,涉及到的部分文章和圖片版權屬于原作者,本站轉載僅供大家學習和交流,切勿用于任何商業活動。
2、本站不承擔用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國家有關法律法規,當本聲明與國家法律法規沖突時,以國家法律法規為準。
4、如果侵害了您的合法權益,請您及時與我們,我們會在第一時間刪除相關內容!
聯系方式:010-60259772
電子郵件:394588593@qq.com