【網站優化】2017年SEO新考驗：搜尋引擎的新趨勢「自然語言機制」(一)

專業提醒：

【點擊付費已因競價，效益日益遞減】

文章標籤：網站優化人工智慧自然語言機制同意詞

『網站優化新趨勢』

隨著時間的演進，Google搜尋引擎在諸多工程師不斷改寫程式、導入更精準的演算法下，今日的搜尋引擎已能更能近乎精準地，滿足每一位使用者的搜尋需求，加上手機裝置行動運算在軟硬體上的不斷提升，搜尋引擎從被動的數據接收，逐步進展到主動收集可能的任何線索，將這些線索及時彙整，並在第一時間回應搜尋者的需求，這樣的一套執行思路，已然是每個人手機上的現在進行式。然而，Google工程師們並未就此感到滿足，他們深信搜尋引擎除了快速處理資料外，還可以更加具有人性，讓每一份搜尋結果資料，和人類情緒作結合，創造出更多的搜尋價值可能。在參入了人類感情的真實評價判斷後，SEO將不再只有「關鍵字」這個戰場；依循此思維，以下便是本文奠基於「更加人工智慧化的搜尋引擎」之發展方向，所要提出的四個關於Google未來將發展的「自然語言機制」，所需要注意的核心議題，不但是SEO前端從業人員在網站優化上的重要新知，也是關鍵字行銷人員在關鍵字廣告領域上，不可不讀的未來趨勢。

何謂自然語言機制(Natural Language Processing)？這是一個結合了語言學、統計學、程式語言的複合領域，由Gooole的工程師操刀，由程式語言領域主導，結合語言學與統計學的學理知識，為的是模擬出接近人類閱讀文字時，對於該文章會有的邏輯價值判斷，引擎工程師在這部分的努力方向，大致可以分為下列四個重點，藉由這四個點的相輔作用，達成其目的：

(1)字頻判定機制(TF-IDF)

該機制，以計量統計學為基礎，用以評估一個字詞(關鍵字)，對於一份網頁文本是否具有重要性和代表性，藉由TF-字頻(term frequency)，即一個字詞出現在一段文版中的頻率，其重要性會隨著它在文件中出現的次數呈現正比增加；而IDF-逆文件判定(inverse document frequency)，即一個字詞(關鍵字)出現的頻率，會隨著它在整個文本的總字詞庫中，出現的頻率次數呈現IDF値反比下降；以上兩個指標會彼此制衡，去判讀出某字詞(關鍵字)對於某類網頁文版，是否具有代表性和重要性。試舉一個較明顯的例子：若我們針對「醫療健康議題」收集大量的網路頁面文本，並將這些文本，分別針對「冷水」、「養生」進行這兩個字，何者對於「醫療健康議題」較具代表性、重要性的判讀時，我們可以預期，藉由「養生」字詞在文本中的大量出現，並且在頻率上會很顯著地多過「冷水」；同時，「養生」字詞所出現的文本，在這些文本的字詞庫中，若能具有適中出現的次數，這個「養生」則相對於「冷水」，對於網路上海量的健康議題文本資料，更具有代表性和重要性。搜尋引擎在未來，便會藉由這個判定機制，不斷地去比較數億個字詞之間，對於數百萬種議題之文本，何者更具有代表性，再將這些比較後得出的結果，作為提供給搜尋使用者搜尋結果時，重要的參考數據。而針對字頻判定機制(TF-IDF)，要特別補充的一個重點是，TF-IDF在面對大量的網頁文版時，會自動過濾掉一些連接詞、感情詞、動作詞、語氣詞，而將專有名詞、事務性字詞(特別名詞)，列為重要關注的字詞，將之收進每一個文版的字詞庫中。所以，面對這樣的搜尋引擎趨勢，SEO/關鍵字行銷產業之從業人員，未來勢必要作出相關的因應，特別在頁面佈局、重要標籤語法操作上，會面臨新一番的專業考驗。

(2)同義詞判定機制

談到「同義詞判定機制」這件事，對於Google搜尋引擎來說，其實已經不是新鮮事了，早在10年之前，Google官方就已經在網路世界上，藉由大量的實體文本(報紙、雜誌、書籍、辭典)，以及蜘蛛蟲程式在網路世界大規模收集資料，開始了這項長期且需要耐心的多語言「字詞收集計畫」，藉由大量字詞的收集，及其所依附文本的內容，判定哪些字詞之間，具有同樣的指涉意涵。而根據非官方人士的推測，Google已經完成了世界各語言中，百分之70的同義詞判定工作，即使是近代人們口語上常見的熱門字詞，也都已經在Google的資料庫中收錄完成。而面對Google 如此高完成度的字詞收集計畫，同時該計畫持續不斷的進行中，SEO/關鍵字行銷相關產業人員尤其需要注意的是，引擎在字海茫茫的網路世界中，對於「同義詞的收集作為」這回事，會對於Anchor text和Backlink所標住的字詞，特別敏感且高度關注，意即當我們在撰寫每一篇網頁文本、美一個Anchor text和Backlink內的文字時，更要去精準判定所要表達的意念，避免造成引擎在整體文版、關鍵字詞的意念判讀上，把它和其他非預期的意涵作連結，讓所操作的網站在SEO/關鍵字行銷的價值上，偏離了原本的規劃的方向。

(系列文 1/2)

回[SEO廣告服務說明]列表

回[技術牆]

虛擬業務派遣系統

【技術牆】
bestkeyword / 自然排序區：SEO關鍵字廣告的絕對優勢

【網站優化】2017年SEO新考驗：搜尋引擎的新趨勢「自然語言機制」(一)

【點擊付費已因競價，效益日益遞減】

『網站優化新趨勢』

(1)字頻判定機制(TF-IDF)

(2)同義詞判定機制

虛擬業務派遣系統

【技術牆】bestkeyword / 自然排序區：SEO關鍵字廣告的絕對優勢

【網站優化】2017年SEO新考驗：搜尋引擎的新趨勢「自然語言機制」(一)

【點擊付費已因競價，效益日益遞減】

『網站優化 新趨勢』

(1)字頻判定機制(TF-IDF)

(2)同義詞判定機制

【技術牆】
bestkeyword / 自然排序區：SEO關鍵字廣告的絕對優勢

『網站優化新趨勢』