基于網頁關鍵詞的SEO分析
網頁關鍵詞對于SEO來說,應該說不并陌生。關鍵詞調研、關鍵詞布局這些都屬于關鍵詞優化范疇。基于網頁關鍵詞的SEO分析,思億歐(www.seo.com.cn)本文的主要目的是介紹一張網頁當中,搜索引擎會如何評價網頁關鍵詞并進行權重處理。
基于詞頻統計是對關鍵詞的出現次數進行加權分析,根據各特征項對網頁內容的貢獻,經過多次統計學習完成。在HTML文檔中,各詞條在不同內容的網頁中所呈現出的頻率分布是不同的,因此可根據類別詞的頻率和標記特性進行權重評價。
一個有效的特征項集必須具備以下兩個特性:完全性,特征項能夠體現目標內容;區分性,根據特征項集,能將目標同其他文檔相區分。如何用計算類別詞的權重來確切地表示網頁類別,除了要求能理解正文的含義之外,還需有總結概括的能力或有較深的領域知識。根據網頁文檔和標記信息,提取類別詞權重可以選擇對揭示網頁的主題內容具有更加重要的作用的標記,如標題(<TITLE>)、強調(<EM>)等標記。提取類別詞權重的步驟如下:
(1)計算每個類別詞在網頁中出現的次數;
(2)統計標題(<TITLE>)所標記信息的類別詞,如果有,在該類別詞計數器中加一個整數TO;
(3)統計一級標題(<H1>),二級標題(<H2>),三級標題(<H3>)所標記信息的類別詞,如果有,在該類別詞計數器中分別加一個整數T1,T2,T3;
(4)統計強壯(<STRONG>)、強調(<EM>)所標記信息的類別詞,如果有,在該類別詞計數器中加一個整數T4,T5;
(5)找出超文本中的一些關鍵句,對在關鍵句中出現的類別詞,除進行上述處理外,再在相應的計數器中加一個整數T6;
(6)對于一些特殊的領域,根據受限自然語言理解技術和有關專家的意見,設立其他加權方案進行加權,對一些專有名詞加一個整數T7;
(7)處理同義詞或蘊含詞。在出現的多個同義詞或蘊含詞中選擇計數器的積分最高者,保留該詞和相應計數器,然后把其他同義詞或蘊含詞的計數器中的計分全部加入保留計數器中;
(8)處理近義詞,在出現的多個近義詞中選擇計數器的積分最高者,保留該詞和相應計數器,然后對其他近義詞根據它與保留的近義詞的語義近似程度加入保留的計數器。通過上述方法,可以計算各類別詞在網頁中的權重,從中提取出HTML文檔的含義。
這只是基本的的關鍵詞密度分析算法,而實際上搜索引擎對于關鍵詞的分析,要復雜的多。而且,思億歐認為搜索引擎的算法已經比過去智能太多了。搜索引擎算法會設置一系列的規則來識別網站是否有存在SEO問題,如果我們都按照以往的優化教條去執行SEO項目的話,基本上是行不通的。
在思億歐與本文章相關的另外一篇文章SEO中網頁描述以及重要內容的優化,所有談及的都是對文章頁面的優化技巧。這些技巧,可能都有用,也可能都沒用。因為影響搜索引擎排名的因素的作用,是相對的。它并不是說,你將所有該優化的地方都優化了,就一一給你加分。