百度檢測網(wǎng)站網(wǎng)頁質量總結,成都網(wǎng)站建設
計算網(wǎng)頁權威性時,將參與計算的所有網(wǎng)頁作為一個集合,并通過集合內網(wǎng)頁之間的鏈接關系迭代計算網(wǎng)頁的權威性。
但是隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)上的網(wǎng)頁越來越多,如果將互聯(lián)網(wǎng)上所有網(wǎng)頁都作為參與權威性計算的網(wǎng)頁,則對計算系統(tǒng)的架構要求非常高,因此通常僅挑選各網(wǎng)站與外部網(wǎng)站存在鏈接關系的網(wǎng)頁作為參與權威性計算的網(wǎng)頁,但是現(xiàn)有技術的這種方式,會導致各網(wǎng)站內部的一些優(yōu)秀網(wǎng)頁無法得到權威性值,此外,也會影響參與計算的網(wǎng)頁得到的權威性值的準確性。
為了改善上述問題,現(xiàn)有技術有一種做法,是將網(wǎng)站內與外部網(wǎng)站存在鏈接關系的網(wǎng)頁,以及網(wǎng)站內的一些重要網(wǎng)頁一起提取出來,作為參與網(wǎng)頁權威性計算的網(wǎng)頁。
在現(xiàn)有技術中,是通過網(wǎng)站中網(wǎng)頁的站內反鏈數(shù)量來確定網(wǎng)頁的重要性的,例如將網(wǎng)站中站內反鏈數(shù)量大于設定閾值的網(wǎng)頁提取出來,如果這些網(wǎng)頁所指向網(wǎng)頁的站內反鏈數(shù)量也大于設定閾值,則將這些網(wǎng)頁及所指網(wǎng)頁作為重點網(wǎng)頁。但是這種現(xiàn)有技術的方法,召回率較低,準確性也較差。
?。▉碓从诎俣人惴▽@麅热荩?/p>
新算法權威度調整
1.網(wǎng)頁中的所有鏈接提取出來
2.對網(wǎng)站所有鏈接進行拆分重組排列(源代碼里最近的鏈接組成)3.從各個鏈接(內鏈)中進行匹配出現(xiàn)值最高的鏈接 例:多次A鏈接B,或不同ABC鏈接D4.有一個預定的閥值,如果不超過閥值那么將歸類于普通頁面,如沒有任何重點頁面(入口頁)則僅留下首頁為重點頁面.
5.重點鏈接是有數(shù)量上限,取決于鏈接對最多的頁面權威性,頁面權威性越高,重點頁面的數(shù)量就越高,比例通常在10-30%浮動,也就是一萬個頁面,可以出現(xiàn)1000-3000的參與排名的頁面。
6.百度訓練模型將對鏈接對進行一次匹配分類,區(qū)分重要程度。
7.百度訓練模型的對鏈接進行重要鏈接比對和非重要鏈接比對8.對重要鏈接進行分類特征對比,以確定重要鏈接的參數(shù)范圍和特征范圍。
9.百度會對鏈接先進行參數(shù)范圍和特征范圍匹配,然后在進行重要程序分級。
10.內鏈和反鏈的出面度是根據(jù)數(shù)量來決定,如果一個頁面有3個內鏈,那么他的出面度就是311.對重要頁面的深度進行說明,從首頁跳轉到對應頁面的最短次數(shù),這個次數(shù)被定義為深度,重要頁面的深度會一定程度的影響頁面屬性。
12.內鏈指向重要頁面的錨文本總數(shù),是根據(jù)切詞組成,也就是例如抽動癥治療頁面指向給了抽動癥,那么抽動癥這個頁面的錨文本總數(shù)就是3個,抽動癥治療,抽動癥,治療。3個錨文本。
13.根據(jù)重點頁面相互連接生成網(wǎng)站骨架,以定義網(wǎng)站的類型總結:頁面的權威度由頁面的深度,被指向內鏈的深度對比,錨文本詞頻、頁面出度、兩個頁面深度之間的差值來綜合評比頁面權威度。
? ? ? 總結:頁面的權威度由頁面的深度,被指向內鏈的深度對比,錨文本詞頻、頁面出度、兩個頁面深度之間的差值來綜合評比頁面權威度。
成都奕博科技有限公司專注服務于軟件開發(fā)、APP移動應用、網(wǎng)站建設、網(wǎng)站優(yōu)化、虛擬現(xiàn)實智能化設備研發(fā)。服務熱線:028-66713560?咨詢產(chǎn)品
請留下您的聯(lián)系方式我們會第一時間跟你聯(lián)系!