Fala niewyjaśnionego ruchu botów z Chin paraliżuje strony internetowe na całym świecie

22
Fala niewyjaśnionego ruchu botów z Chin paraliżuje strony internetowe na całym świecie

Tajemnicza fala zautomatyzowanego ruchu sieciowego, pochodzącego głównie z Lanzhou w Chinach, przytłacza strony internetowe na całym świecie, wprawiając operatorów w dezorientację i szukanie rozwiązań. Począwszy od września właściciele witryn z różnych sektorów zgłaszali gwałtowny wzrost aktywności botów – od blogów o zjawiskach paranormalnych po domeny rządowe Stanów Zjednoczonych – co zakłóca analitykę, zwiększa koszty przepustowości i potencjalnie szkodzi przychodom z reklam.

Widmowi goście z Lanzhou

Alejandro Quintero, analityk danych prowadzący witrynę internetową dotyczącą zjawisk paranormalnych, po raz pierwszy zauważył tę anomalię w październiku. Jego witryna odnotowała gwałtowny wzrost ruchu z Chin i Singapuru, który obecnie odpowiada za ponad połowę wszystkich wizyt. Odwiedzający najwyraźniej zlokalizowani w Lanzhou wykazywali nienaturalne zachowanie: zerowy czas przebywania, brak przewijania, brak kliknięć. To potwierdziło jego podejrzenia – ruch nie był prowadzony przez ludzi.

Inni szybko potwierdzili doświadczenie Quintero. Indyjski magazyn lifestylowy, blog na kanadyjskiej wyspie, witryny z portfolio osobistym, platforma pogodowa z milionami stron, a nawet domeny rządu USA zaobserwowały ten sam schemat. Analytics.usa.gov pokazuje, że w ciągu ostatnich 90 dni Lanzhou i Singapur stały się dwoma miastami, które rzekomo czerpią najwięcej informacji od rządu USA, co stanowi odpowiednio 14,7% i 6,6% wizyt.

Kto stoi za powodzią?

Chociaż ruch pochodzi z chińskich i singapurskich adresów IP, identyfikacja atakujących pozostaje nieuchwytna. Boty nie są kojarzone z cyberatakami ani skanowaniem luk w zabezpieczeniach, ale sama ich liczba sieje spustoszenie. Najbardziej prawdopodobnym wyjaśnieniem jest eksploracja danych AI: firmy zbierają dane z Internetu w celu uczenia dużych modeli językowych.

Boty te różnią się jednak od typowych robotów AI. Jest ich znacznie więcej – stanowią 22% ruchu w niektórych witrynach w porównaniu z mniej niż 10% w przypadku wszystkich innych botów AI razem wziętych – i aktywnie się kamuflują, omijając powszechne mechanizmy wykrywania botów. W przeciwieństwie do dobrze znanych laboratoriów AI, które często identyfikują swoje boty, napastnicy wydają się zdeterminowani, aby uniknąć zablokowania.

Gavin King, założyciel Known Agents, prześledził ruch na serwerach należących do głównych chińskich dostawców usług w chmurze, w tym Tencent (ASN 132203), Alibaba i Huawei. Nie jest jasne, czy ruch pochodzi z operacji wewnętrznych, czy od klientów korzystających z tych serwerów.

Cena jest prawdziwa

Boty nie wydają się być złośliwe, ale ich wpływ jest znaczący. Właściciele witryn niepokoją się naruszeniami praw autorskich, zwiększonymi kosztami przepustowości i wypaczonymi wynikami analiz. W przypadku tych, którzy polegają na przychodach z reklam, ruch botów może negatywnie wpłynąć na ich zarobki, ponieważ platformy takie jak Google AdSense mogą dewaluować witryny przeciążone sztucznym zaangażowaniem.

„To zabija moje strategie AdSense” – mówi Quintero. „Mówią, że [Twoją witrynę] odwiedzają tylko boty, więc Twoje treści nie mają żadnej wartości dla widza”.

Improwizowane rozwiązania i niepewna przyszłość

Ze względu na brak natychmiastowego rozwiązania operatorzy stron internetowych uciekają się do środków tymczasowych. Blokowanie chińskich i singapurskich adresów IP, filtrowanie nieaktualnych wersji systemu Windows i identyfikowanie nietypowych rozdzielczości ekranu to tylko niektóre z improwizowanych strategii udostępnianych w Internecie. Niektórzy zablokowali całe numery ASN powiązane z dużymi dostawcami usług w chmurze.

Choć rozwiązania te są w pewnym stopniu skuteczne, mają one charakter tymczasowy. W miarę jak autonomiczne narzędzia AI stają się coraz bardziej powszechne, właściciele witryn internetowych prawdopodobnie staną przed coraz większymi wyzwaniami w zakresie rozróżnienia między legalnym ruchem a automatycznym gromadzeniem danych. Innymi słowy, koszt utrzymania obecności w Internecie rośnie, a granica między działalnością ludzi i maszyn zaciera się.

Rozwój gromadzenia danych w oparciu o sztuczną inteligencję podkreśla podstawową prawdę o współczesnym Internecie: otwartość ma swoją cenę. Sieć jest otwarta i jak mówi Brent Maynard z Akamai: „Jesteś otwarty i widoczny dla wszystkich”.