Google bezustannie wprowadza nowe poprawki do swojego algorytmu. Nie ma się co dziwić, że wciąż udoskonala jego działanie, starając się coraz lepiej oceniać strony internetowe.

Poprawka algorytmu, którą zamierzam opisać jest już dobrze znana osobom zajmującym się optymalizacją stron i sklepów dla wyszukiwarki Google, jednak całkiem niedawno została oficjalnie potwierdzona, a raczej zatwierdzona patentem. Chodzi tu o identyfikację treści strony docelowej i wpływ na jej ranking dzięki linkom znajdującym się w treści tematycznego teksu.

Nie chodzi tu o tekst zakotwiczenie odnośnika (ang. anchor text), ale o tematykę treści strony – tekstu otaczającego lub znajdującego się w najbliższym jego sąsiedztwie.

Nowe / stare techniki oceny tematyki i popularności strony przez Google

Jak już wspomniałem fakt, że wyszukiwarka Google działa w ten sposób podejrzewano od kilku lat, ale dopiero po prawie 10 latach firma otrzymała patent na tą metodę (link). Co zarazem oficjalnie potwierdza dotychczasowe spostrzeżenia.

Jak to się ma do pozycjonowania stron? Otóż, z całą pewnością stwierdzić można, że trudniej jest osobom stosującym szybkie i mało przemyślane techniki pozycjonowania tj.:

  • systemy wymiany linków (SWL), słabej jakości katalogi stron, farmy linków,
  • linki sponsorowane i wtyczki podmieniające automatycznie określony tekst na link,
  • i inne metody, w których nie mamy znacznego wpływu na treść strony prezentowanej wyszukiwarce.

Linki umieszczane w ten sposób nie zawsze oddają tematykę strony docelowej, co wpływa negatywnie na wiarygodność odnośnika. Dodatkowo, nie można określić jednoznacznie, jaki zakres tekstu z lewej i z prawej strony będzie brany pod uwagę. Może się zdarzyć, że w identyfikacji treści strony docelowej brać będzie udział tekst o całkowicie innej tematyce.

Kolejną rzeczą jest dopasowanie tekstu otaczającego odnośnik do ogólnej treści strony – ta w przypadku stron generujących ją losowo (np. boksy sponsorowane na stronie) jest całkowicie nie do przewidzenia. I tak mimo, że w bezpośrednim sąsiedztwie odnośnika znajdować się będzie tekst, o który nam chodzi, analizując całą stronę algorytm może zrozumieć ją inaczej – co również sprawi, że link będzie wyglądał „podejrzanie”.

dopasowanie tekstu otaczającego odnośnik do ogólnej treści strony

Identyfikacja za pomocą najrzadszych słów

Co się jeszcze okazuje… metoda ta działa na zasadzie identyfikacji najrzadziej występującego słowa z analizowanej próbki tekstu po lewej i prawej stronie z osobna, których długość może być większa lub mniejsza niż pięć słów. To za ich pomocą określana jest prawdopodobna tematyka strony docelowej.

Wykluczenie okolicznych słów

Przyznam, że sposób oceny treści strony docelowej za pomocą okalającego link tekstu nie jest rzeczą nową. Wartym uwagi jest jednak fakt wykluczenia powtarzających się słów i to, że zamiast wzmacniać przekaz, działają odwrotnie na pobliski odnośnik – zaniżają lub całkowicie wykluczają swoją wartość.