【技術牆】
bestkeyword / 自然排序區:SEO關鍵字廣告的絕對優勢

【網站優化】2017年SEO新考驗:搜尋引擎的新趨勢「自然語言機制」(一)

專業提醒:

【點擊付費已因競價,效益日益遞減】

『網站優化 新趨勢』

隨著時間的演進,Google搜尋引擎在諸多工程師不斷改寫程式、導入更精準的演算法下,今日的搜尋引擎已能更能近乎精準地,滿足每一位使用者的搜尋需求,加上手機裝置行動運算在軟硬體上的不斷提升,搜尋引擎從被動的數據接收,逐步進展到主動收集可能的任何線索,將這些線索及時彙整,並在第一時間回應搜尋者的需求,這樣的一套執行思路,已然是每個人手機上的現在進行式。然而,Google工程師們並未就此感到滿足,他們深信搜尋引擎除了快速處理資料外,還可以更加具有人性,讓每一份搜尋結果資料,和人類情緒作結合,創造出更多的搜尋價值可能。在參入了人類感情的真實評價判斷後,SEO將不再只有「關鍵字」這個戰場;依循此思維,以下便是本文奠基於「更加人工智慧化的搜尋引擎」之發展方向,所要提出的四個關於Google未來將發展的「自然語言機制」,所需要注意的核心議題,不但是SEO前端從業人員在網站優化上的重要新知,也是關鍵字行銷人員在關鍵字廣告領域上,不可不讀的未來趨勢。

何謂自然語言機制(Natural Language Processing)?這是一個結合了語言學、統計學、程式語言的複合領域,由Gooole的工程師操刀,由程式語言領域主導,結合語言學與統計學的學理知識,為的是模擬出接近人類閱讀文字時,對於該文章會有的邏輯價值判斷,引擎工程師在這部分的努力方向,大致可以分為下列四個重點,藉由這四個點的相輔作用,達成其目的:

(1)字頻判定機制(TF-IDF)

該機制,以計量統計學為基礎,用以評估一個字詞(關鍵字),對於一份網頁文本是否具有重要性和代表性,藉由TF-字頻(term frequency),即一個字詞出現在一段文版中的頻率,其重要性會隨著它在文件中出現的次數呈現正比增加;而IDF-逆文件判定(inverse document frequency),即一個字詞(關鍵字)出現的頻率,會隨著它在整個文本的總字詞庫中,出現的頻率次數呈現IDF値反比下降;以上兩個指標會彼此制衡,去判讀出某字詞(關鍵字)對於某類網頁文版,是否具有代表性和重要性。 試舉一個較明顯的例子: 若我們針對「醫療健康議題」收集大量的網路頁面文本,並將這些文本,分別針對「冷水」、「養生」進行這兩個字,何者對於「醫療健康議題」較具代表性、重要性的判讀時,我們可以預期,藉由「養生」字詞在文本中的大量出現,並且在頻率上會很顯著地多過「冷水」;同時,「養生」字詞所出現的文本,在這些文本的字詞庫中,若能具有適中出現的次數,這個「養生」則相對於「冷水」,對於網路上海量的健康議題文本資料,更具有代表性和重要性。搜尋引擎在未來,便會藉由這個判定機制,不斷地去比較數億個字詞之間,對於數百萬種議題之文本,何者更具有代表性,再將這些比較後得出的結果,作為提供給搜尋使用者搜尋結果時,重要的參考數據。 而針對字頻判定機制(TF-IDF),要特別補充的一個重點是,TF-IDF在面對大量的網頁文版時,會自動過濾掉一些連接詞、感情詞、動作詞、語氣詞,而將專有名詞、事務性字詞(特別名詞),列為重要關注的字詞,將之收進每一個文版的字詞庫中。所以,面對這樣的搜尋引擎趨勢,SEO/關鍵字行銷產業之從業人員,未來勢必要作出相關的因應,特別在頁面佈局、重要標籤語法操作上,會面臨新一番的專業考驗。

(2)同義詞判定機制

談到「同義詞判定機制」這件事,對於Google搜尋引擎來說,其實已經不是新鮮事了,早在10年之前,Google官方就已經在網路世界上,藉由大量的實體文本(報紙、雜誌、書籍、辭典),以及蜘蛛蟲程式在網路世界大規模收集資料,開始了這項長期且需要耐心的多語言「字詞收集計畫」,藉由大量字詞的收集,及其所依附文本的內容,判定哪些字詞之間,具有同樣的指涉意涵。而根據非官方人士的推測,Google已經完成了世界各語言中,百分之70的同義詞判定工作,即使是近代人們口語上常見的熱門字詞,也都已經在Google的資料庫中收錄完成。 而面對Google 如此高完成度的字詞收集計畫,同時該計畫持續不斷的進行中,SEO/關鍵字行銷相關產業人員尤其需要注意的是,引擎在字海茫茫的網路世界中,對於「同義詞的收集作為」這回事,會對於Anchor text和Backlink所標住的字詞,特別敏感且高度關注,意即當我們在撰寫每一篇網頁文本、美一個Anchor text和Backlink內的文字時,更要去精準判定所要表達的意念,避免造成引擎在整體文版、關鍵字詞的意念判讀上,把它和其他非預期的意涵作連結,讓所操作的網站在SEO/關鍵字行銷的價值上,偏離了原本的規劃的方向。

(系列文 1/2)