Różnice w czasie między indeksowaniem stron przez różne Google Datacenter

18 grudnia 2013 0
Różnice w czasie między indeksowaniem stron przez różne Google Datacenter

To czysto techniczna sprawa. Warto jednak zacząć od tego, czym jest Google Data Center dla zwykłego użytkownika internetu. Otóż to baza danych – jedna z wielu kopii – zaindeksowanych stron i informacji, do której mają dostęp osoby korzystające np. z wyszukiwarki. Takich baz danych Google posiada na świecie kilkadziesiąt, a ich gęstość występowania na danym obszarze zależy w dużej mierze właśnie od nas, czyli od ilości osób, które w określonym regionie korzystają np. z wyszukiwarki.

Oczywiście, w ramach oszczędności poszczególne Data Center różnią się od siebie zawartością przechowywanych stron – w dużej mierze skupiają się na witrynach z danego rejonu, a to dlatego, że przeciętny internauta z Polski, Niemiec czy Czech stosunkowo rzadko korzysta (przegląda) ze stron np. japońskich. Także niepotrzebne jest przechowywanie dużej ich ilości w pobliskich bazach Google a sama firma może zaoszczędzić na kosztach niepotrzebnej jej rozbudowy. Stąd też różnice w ilości wyników dla konkretnych zapytań – zależą one od zasobów bazy, która aktualnie nas obsługuje.

To tak pokrótce,  czym są i na czym polega funkcjonowanie Google Data Center. Przejdźmy teraz do sedna tematu.

Otóż pisząc tekst na stronie internetowej i publikując go w internecie, po pewnym czasie zostanie on zaindeksowany przez roboty Google. I tu zachodzi problem, które Data Center nas zaindeksuje (zazwyczaj obsługuje nas najmniej obciążone). Okazuje się, że różnice w czasie publikacji mogą wystąpić i są one dość znaczne.

Różnice w czasie między indeksowaniem stron przez Google Datacenter

W praktyce wygląda to tak, że jeżeli np. publikujemy nowy wpis na blogu, następnie przesyłamy jego adres URL  do indeksu wyszukiwarki za pomocą narzędzi dla webmasterów Google. Jest to najszybszy sposób indeksowania strony, jednak korzystałem z niego wyłącznie do potwierdzenia zawartych w tym artykule twierdzeń, gdyż każdy adres należy przesyłać pojedynczo – czasochłonna praca. Muszę powiedzieć, że strony w wyszukiwarce pokazują się bardzo szybko (od 10 sekund do 2 minut, sprawdzane za pomocą funkcji site:)

I tu zaczęło się robić ciekawie… Okazało się, że wpis przesłany do wyszukiwarki minutę temu widnieje w indeksie z datą – opisem „1 dzień temu”.  Od razu dodam, że publikacja nastąpiła tuż po północy. Ten mały teścik przeprowadzony został dla 100+ innych wpisów, natomiast rozpiętość czasowa wynosiła od 1 minuty do 1 dnia. Na podstawie tego można wyciągnąć kilka wniosków:

  1. Oczywiście, nie mamy wpływu na fakt, które Data Center obsłuży indeksacje naszej publikacji.
  2. Datacenter podaje datę publikacji na podstawie czasu lokalnego, w którym się znajduje.
  3. Na podstawie prezentowanego czasu publikacji, możemy określić, do której strefy czasowej trafił nasz wpis.

A teraz pytanie – jeżeli od razu po publikacji, nasz wpis widnieje w wyszukiwarce z datą 12 godzin, czyli trafił do Data Center po drugiej stronie globu, jak to wpłynie na jego wyświetlanie się w polskich wynikach bezpośrednio po udostępnieniu go w sieci? Piszę bezpośrednio, gdyż bazy danych są bezustannie aktualizowane – jednak tylko częściowo.

Dodaj komentarz

Adres email nie zostanie opublikowany. Wymagane pola oznaczone są *.



Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>