SEO網站權重,PageRank算法研究
在之前關于網站權重討論的幾篇文章之中,更為適用于Web搜索引擎的個性化PageRank方案是利用添加修正參數來計算個性化PageRank值。這個方法較前者而言,不要求全面獲取Web資源的使用情況,所以無需過多地在遍歷網頁結構時重新定義不同超鏈的權重分配關系。與此相反,該方法只需要在得到全部網頁的簡單超鏈結構關系后,直接通過引入修正參數來體現用戶的個性化特征信息。
這種引入修正參數的方式可以適用于多種特殊情況下的PageRank值計算要求。第一,可以表達個性化用戶特征,改變傳統PageRank公式中僅僅使用同一個標準權重初始值來設置全部網頁的起始權重,而且在網頁隨機跳轉因子的設定上也存在忽視用戶個性化需求的特點;第二,還可以利用修正參數來反映主題化的PageRank網頁權重值。傳統的PageRank方法在計算每個網頁具體的重要性權值時根本沒有考慮到任何網頁本身內容特征對權值的影響,完全忽略了網頁具有不同的主題。事實上,不同的網頁在不同的主題要求下應該具有不同的重要性權值。也就是說,在用戶查詢的時候,網頁重要性權值的大小與查詢所表達的主題關系很大。其實,在HITS算法中恰恰考慮了這種因素,所以它更易于表達與特定查詢主題相關的相關度排序,有效地在PageRank算法中考慮查詢主題對網頁權重值的影響是一個有效改進此算法的重要方法.同時,這種主題化的PageRank計算方法也能通過相同網頁的不同主題化PageRank值來表現用戶的個性化需求。最后,這種方法還可以解決一些其他問題,如傳統PageRank算法沒有考慮網頁的創建時間對網頁權重的影響程度,也不對新舊網頁進行有效的區分,相反,按照PageRank的既有算法甚至會產生舊網頁具有比新網頁具有較高重要性權值的可能性。
從實質上看,解決上述幾個問題具有相似的處理方式,那就是對傳統PageRank算法中的很多參數設定不再使用單一的值,相反,這些值要能充分體現主題差異和用戶的個性化差異。
在之前的文章中,我們已經得到基于關鍵詞訪問序列的用戶事務聚類模式,也就是說,每個訪問用戶都會對應若干個不同聚類模式。所以,最好的考慮是利用已有的聚類模式來計算各個不同模式所對應的網頁PageRank值,同時在用戶查詢時,就可以直接利用用戶所屬聚類模式對應的PageRank值來對網頁進行相關度排序,這樣既可以加快查詢時的運算速度,同時也能充分考慮用戶的個性化特點。
相關的文章還有:
1.什么是網站權重,有什么作用
2.SEO網頁質量
3.SEO結合網頁質量分析的搜索模式
4.SEO網頁質量直接測度指標
5.SEO網頁質量間接測度指標
6.SEO個性化網頁權重研究
7.SEO個性化網頁權重研究之二
8.個性化網頁權重PageRank算法研究
9.基于關鍵詞的網頁權重方法研究
搜索引擎經過這幾年的發展,算法已經變的相當成熟。特別是Google排名算法,更是全球SEOER熱衷的研究對象。搜索引擎優化行業的門檻,也變的越來越高。基礎性的SEO技巧例如:描述標簽優化、網頁標題優化、關鍵字優化等,作用越來越小。要實施搜索引擎優化項目,更加需要策略、系統、戰略性思維。