Таємнича хвиля автоматизованого веб-трафіку, що в основному виходить з Ланьчжоу, Китай, захльостує веб-сайти по всьому світу, залишаючи операторів збентежені і змушуючи їх шукати рішення. Почавшись у вересні, сплеск бот-активності був зареєстрований власниками сайтів у різних секторах – від блогів про паранормальні явища до державних доменів США, – спотворюючи аналітику, збільшуючи витрати на пропускну спроможність та потенційно завдаючи збитків доходам від реклами.
Примарні відвідувачі з Ланьчжоу
Алехандро Кінтеро, аналітик даних, що веде веб-сайт на паранормальну тематику, вперше помітив аномалію у жовтні. Його сайт побачив раптовий стрибок трафіку з Китаю та Сінгапуру, який тепер становить понад половину всіх його відвідувань. Відвідувачі, мабуть, локалізовані в Ланьчжоу, виявляли неприродну поведінку: нульовий час перебування, відсутність прокручування, відсутність кліків. Це підтвердило його підозри – трафік не був людським.
Інші швидко підтвердили досвід Кінтеро. Журнал про спосіб життя в Індії, канадський острівний блог, особисті портфоліо-сайти, погода платформа з мільйонами сторінок і навіть державні домени США зіткнулися з тією ж закономірністю. Аналітика з Analytics.usa.gov показує, що за останні 90 днів Ланьчжоу та Сінгапур стали двома провідними містами, які нібито споживають інформацію від американського уряду, становлячи 14,7% та 6,6% відвідувань відповідно.
Хто стоїть за потопом?
Хоча трафік виходить із китайських та сінгапурських IP-адрес, виявлення зловмисників залишається невловимим. Боти не пов’язані з кібератаками або скануванням уразливостей, але їхній величезний обсяг викликає руйнування. Найбільш правдоподібним поясненням є збір даних за допомогою ІІ: компанії, що збирають дані з Інтернету для навчання великих мовних моделей.
Однак ці боти відрізняються від типових AI-краулерів. Вони набагато більш численні – становлячи 22% трафіку на деяких сайтах порівняно з менш ніж 10% для всіх інших AI-ботів разом узятих – і вони активно маскуються, оминаючи поширені механізми виявлення ботів. На відміну від відомих AI-лабораторій, які часто ідентифікують своїх ботів, ці зловмисники, схоже, сповнені рішучості уникнути блокування.
Гавін Кінг, засновник Known Agents, простежив трафік через сервери, що належать великим китайським хмарним провайдерам, включаючи Tencent (ASN 132203), Alibaba та Huawei. Незрозуміло, чи відбувається трафік від внутрішніх операцій або клієнтів, які використовують ці сервери.
Ціна реальна
Боти не здаються зловмисними, але їх вплив значний. Власники веб-сайтів стурбовані порушенням авторських прав, збільшенням витрат на пропускну спроможність та спотворенням аналітики. Для тих, хто залежить від доходів від реклами, бот-трафік може негативно вплинути на їхній заробіток, оскільки платформи, такі як Google AdSense можуть знецінювати сайти, переповнені штучним залученням.
“Це знищує мої стратегії AdSense”, – каже Кінтеро. “Вони кажуть, що [ваш сайт] відвідують лише боти, тому ваш контент не становить цінності для глядача”.
Імпровізовані рішення та невизначене майбутнє
З огляду на відсутність негайного рішення оператори веб-сайтів вдаються до тимчасових заходів. Блокування китайських та сінгапурських IP-адрес, фільтрація застарілих версій Windows та виявлення незвичайних дозволів екрану – ось деякі з імпровізованих стратегій, якими діляться в Інтернеті. Деякі заблокували цілі ASN, пов’язані з великими хмарними постачальниками.
Хоча ці рішення ефективні певною мірою, вони є тимчасовими. Оскільки автономні інструменти ІІ стають все більш поширеними, власники веб-сайтів, ймовірно, мають зростати проблеми з розмежуванням легітимного трафіку і автоматизованого збору даних. Іншими словами, вартість підтримки онлайн-присутності зростає, і межа між людською та машинною активністю розмивається.
Поширення AI-керованого збору даних наголошує на фундаментальній істині сучасного Інтернету: відкритість має свою ціну. Веб відкритий, і, як каже Брент Мейнард з Akamai, “Ви відкриті і знаходитесь на увазі у всіх”.


























































