Różnice w algorytmie wyszukiwania cz.1 – Kraj i Język

2

Wyszukiwarka Google i rozwiązania jakie w niej zastosowano należą do jednych z najbardziej zaawansowanych technicznie. Musi sprostać ponad miliardowi pytań zadawanych jej w ciągu dnia. By zapewnić optymalne wyniki wyszukiwania oraz zrównoważyć rzetelność i szybkość ich wyświetlania, Google musiało pójść na kilka kompromisów.

 

Największy wpływ na ilość opcjonalnych wyników, które widzimy w postaci przybliżonej liczby „Około 90 900 000 wyników ” i pozycję, ma wpływ: język, w którym zostało sformułowane pytanie, odległość od najbliższego centrum danych (Data Center), przeglądarka internetowa (np. Chrome, Firefox, Internet Explorer), z której korzystamy a także fakt, czy jesteśmy zalogowani na swoje konto Google oraz czy już korzystaliśmy na danym komputerze z wyszukiwarki (pozostaje historia poprzednich wyszukiwań). Nie możemy też zapomnieć o naszej geolokalizacji, zwłaszcza przy pytaniach zawierających nazwy miejscowości (wyniki lokalne).

 

Wszystkie te czynniki mają bezpośredni wpływ na pozycje strony w wynikach wyszukiwania. Jednak to nie wszystko, istnieją różne wersje algorytmu Google, na podstawie których wyliczana jest pozycja dla określonej lokalizacji i języka. To wszystko sprawia, że ustalenie dokładnej pozycji strony staje się dość trudne. Nawet Google w Narzędziach dla Webmasterów nie używa określenie pozycja, lecz średnia pozycja – bazując na wynikach uwzględniających powyższe zależności.

 

Poniżej postaram się przedstawić to na przykładzie wyszukiwania jednej frazy ogólnej w różnych krajach i korzystając z różnych wersji językowych wyszukiwarki Google, np. USA -> www.google.com, Hong Kong -> www.google.com.hk, RPA -> www.google.co.za. Dzięki dodatkowym, niestandardowym operatorom dla wyników, wyłączona została personalizacja wyszukiwania oraz restrykcje związane z krajem i językiem. Przeanalizowane zostało 100 domen www.google.* z całego świata, łącznie z dostępnymi językami, które w danych krajach występują. Najbardziej reprezentatywne wyniki naniesione zostały na mapę (czerwony punkt to orientacyjna lokalizacja najbliższego centrum danych).

 

Różnice w algorytmie wyszukiwania cz.1 - Kraj i Język

 

Teorie i przypuszczenia

1. Co najmniej trzy „wersje” algorytmu – a) wg statystyk, najbardziej wyróżniały się wyniki zadawane anglojęzycznym wersjom wyszukiwarki Google i to niezależnie od kraju, np. Kanada, Hong Kong, Haiti, b) pozycja na pytanie zadane „ojczystej” wersji  wyszukiwarki była najwyższa, c) wyniki w pozostałych  krajach / językach nie różnią się istotnie.

 
2. Odległość od Data Center – prawdopodobnie na ilość wyników wpływ ma odległość od centrum danych, które obsługuje nasze pytanie (czyt. ilość hopów między serwerami). Przy dłuższej trasie, Google zwraca większą liczbę, bardziej surowych wyników. Możliwe, że jest to spowodowane oszczędnością czasu przy wysyłaniu danych i nie marnowaniu go na zawężanie wyświetlanej liczby wyników.
 

 

VN:F [1.9.21_1169]
Rating: 5.0/5 (2 votes cast)
Różnice w algorytmie wyszukiwania cz.1 - Kraj i Język, 5.0 out of 5 based on 2 ratings
2 odpowiedzi do artykułu
  1. Bartek 28 listopada 2012 o 20:26

    Ciekawy wpis, fajna infografika. Brakuje takich technicznych informacji na innych blogach. Pozdrawiam

    Odpowiedz
  2. Urszula 29 listopada 2012 o 16:31

    Artykuł ciekawy ale infografiki to ja tu nie widzę;)

    Odpowiedz

Dodaj komentarz