Bez Google: czy to jeszcze możliwe? Jak zablokować giganta
W dyskusjach pod artykułem o (zdementowanej) demonetyzacji kontrowersyjnych i prawicowych portali przez Google pojawiały się przeróżne, czasem wręcz niezwykle libertariańskie poglądy. Da się je streścić w zaczepnej parafrazie brzmiącej "jak się nie podoba, to idźcie do konkurencji!". Praktyka często wydaje się jednak sugerować, że nie ma już "konkurencji", że Google przestał być zwykłą firmą IT, a stał się dostawcą usług użyteczności publicznej.
26.07.2020 17:45
To istotna różnica. W przypadku zostania "utensylium" obowiązuje nieco surowsza legislacja. Przedsiębiorstwa starają się unikać obrania roli "krajowego operatora", ponieważ są wtedy zobligowani do świadczenia usług w bardzo przystępny i uniwersalny sposób. W kapitalistycznej Polsce, z takim statusem startowały między innymi Telekomunikacja Polska i poczta.
Wyszukiwarka użyteczności publicznej
W USA z kolei, gdy władza federalna miała bardziej rzeczywisty wpływ na branżę telekomunikacyjną, zadecydowano niegdyś o podziale wszechwładnej firmy Bell. Choć dzisiaj jest to odległa przeszłość, a podobnego losu po drodze nie doświadczyły Microsoft, Amazon ani Facebook, nikt nie chce prowokować losu na tyle, żeby to sprawdzać.
Więc, Google. Czy znajdujemy się już na etapie, gdy ominięcie jego usług jest niemożliwe, czy też może firma ma rację mówiąc, że "można po prostu nie używać"? Cóż, sprawdźmy to. Przyjdzie nam w tym celu wyrzucić przez okno telefon z Androidem i odinstalować Google Chrome, ale przecież dziś najpopularniejszy system operacyjny dostarcza już pełnoprawną przeglądarkę internetową, zasilaną wyszukiwarką Bing. Powinno pójść łatwo.
Bardzo trudno w obiektywny sposób ocenić na ile obecność tylko w wyszukiwarkach Bing i DuckDuckGo wpływa na promocję. Można jedynie domyślać się, że wpływ jest olbrzymi. Telefony i przeglądarki stosują Google'a domyślnie, wiele osób nie ma nawet pojęcia, że da się inaczej. Bardzo trudno jest obronić pogląd, że "przecież są inne wyszukiwarki". Wie o tym każdy, kto nie żyje w świecie marzeń i myślenia życzeniowego i próbował choć raz prowadzić działania promocyjne. Dlatego skupmy się bardziej na stronie intrastrukturalnej naszego przedsięwzięcia.
Naiwne podejście
Ale od czego zacząć? To dobre pytanie, w dodatku wcale nie takie łatwe. Może wystarczy zablokować serwery Google w pliku hosts, tak jak robią to z serwerami Microsoftu różne narzędzia do usuwania telemetrii? Dodajmy zatem do pliku hosts wpisy dla serwerów Google, Google APIs, Google i YouTube CDN, Google Syndication, DoubleClick i Google Analytics. I zobaczmy co się stanie.
Zaczyna się nieźle. Duże portale same dbają o własne serwery treści, skryptów i reklam. Wirtualna Polska wygląda tak samo urokliwie jak zwykle, acz wbudowana wyszukiwarka nie działa. Nie działa, bo jej tak naprawdę nie ma: to widget Google, więc obecnie prowadzi donikąd.
Ciekawiej robi się na mniejszych portalach. Tam często nie działa np. logowanie (korzysta z konta Google, Microsoft lub Facebook, via OAuth2). Same strony także zaczynają wyglądać... nieco inaczej. W optymistycznym scenariuszu, zablokowanie serwerów Google robi za adblocka: nie ładują się boksy reklamowe, a strona działa szybciej. Jeżeli nie logujemy się przez konto Google, to można tego nawet nie zauważyć.
Gorzej, jeżeli strona wykorzystuje Google do czegoś więcej. Neowin stosuje na przykład czcionki Google, więc z zablokowanym ruchem wygląda gorzej i trochę krzywo. Portal obywatel.gov.pl spontanicznie przeładowuje się co kilka chwil, bowiem zależy od Google Analytics, które ładuje się nieprawidłowo, jest więc wciąż wołane na nowo.
API to nie tylko logowanie
Później robi się jeszcze zabawniej. Nie działają bowiem żadne serwisy korzystające z systemu reCaptcha. I jeżeli ktoś uważa, że używają go wyłącznie sklepy online, Pixabay i 4chan, to jest w błędzie. Sporo dużych graczy stosuje ten mechanizm zamiast implementowania własnego. Należy do nich między innymi PayPal. A więc bez Google można stracić dostęp do części swoich pieniędzy.
Internet z zablokowanym głównych ruchem Google "wydaje się działać": omijając ściśle zdefiniowany podzbiór funkcji, odwiedzane strony wydają się działać... ale czy na pewno udało się naprawdę zablokować ruch do Google? Szybkie spojrzenie na wykaz połączeń TCP pozwoli się przekonać, że nie bardzo. Dostawcy chmurowi zabezpieczają przed ewentualnością wadliwie/złośliwie działających serwerów DNS. Korzystając ze strefowości usługi DNS oraz API swojego zaplecza, kierują ruch bezpośrednio do Google Cloud po adresach IP.
Google User Content
W każdym innym przypadku byłoby to uznane za zabieg złośliwy. Tymczasem tutaj jest jedynie biznesową zaradnością. "Niezniszczalnym" dostawcą treści jest tutaj Google User Content Backbone, czyli centrum danych Google Cloud, stosujące ciągle zmieniający się zakres adresów IP. Aby zablokować ruch do takiego wynalazku, potrzebne jest więcej kreatywności. To oczywiście wykonalne: należy odpytać strefę _cloud-netblocks używając narzędzia nslookup. Taka kwerenda poda nam zbiór stref niższego rzędu. Odpytanie tych z kolei poda aktualne (na czas badania) zakresy IP. Trzeba usunąć trasy do nich lub zablokować do nich ruch na zaporze.
To dobre ćwiczenie na następny raz. Warto je połączyć z czymś innym: próbnym zablokowaniem ruchu do CloudFlare i Akamai. Ta szara eminencja dzisiejszego internetu odpowiada dziś za dostarczanie tak pokaźnego zbioru treści (a dzięki swojemu API, także tras), że ich awaria wywołuje pustynnienie stron. W razie zainteresowania, powrócimy do tematu właśnie w taki sposób.
Nawet, gdyby się udało...
Niepowstrzymanie Google User Content nie przeszkadza jednak w sformułowaniu pewnych wniosków. Wyjąwszy kwestie "odkrywalności" w mniejszych wyszukiwarkach, efekt wycięcia Google z naszego życia jest pomijalny, gdy nie zechcemy uniknąć jego API. Dopóki nie trafimy na usługę, która w całości opiera swoje logowania na koncie Google a weryfikację człowieczeństwa tylko na reCaptcha, siedząc w dodatku na serwerach Google Cloud, jesteśmy bezpieczni. O wiele groźniejszą rolę pełnią tutaj Amazon, Akamai i CloudFlare.
Nie znaczy to jednak przecież, że "stracone" elementy (logowanie, AdWords, DoubleClick, Analytics) znajdowały się na wyczyszczonych stronach bez powodu i były zbędne. Usuwając je sprzed naszych oczu, nie obserwujemy tak naprawdę "świata bez Google": aby móc go naprawdę ujrzeć, należałoby wziąć pod uwagę, z czego utrzymywaliby się właściciele stron, gdyby nie wycięte komponenty. Czy ich strona w ogóle mogłaby dziś istnieć bez reklam Google? Czy oferowaliby jakiekolwiek logowanie, gdyby nie zaplecze OAuth2? No i w jakim stopniu planują oni swoją działalność na Google Analytics?
Nie wiemy tego. Można jedynie spekulować. Taką sytuację trudno też zasymulować. Utrudnia to znalezienie odpowiedzi na pytanie, na ile da się żyć bez Google. Bez wątpienia cieszy to firmę, która nie musi martwić się scenariuszem firmy Bell tak długo, jak wydaje się, że jeszcze nie wszystko stracone.