#Tech

Cosa sono i bot e come influenzano la rete

Edoardo Mazzon
Oct · 4 min. di lettura

Negli ultimi anni, se frequenti la rete, avrai sicuramente sentito parlare di bot. Su Telegram, sui social Network o giocando a qualche videogame. Ma cosa sono i bot? Il termine bot deriva dall’inglese robot e a livello informatico consiste in un programma o uno script eseguito automaticamente, programmato per svolgere varie azioni fino a infinite volte e molto più velocemente rispetto agli esseri umani. Per questo i bot sono molto diffusi in rete.

Le tipologie di bot

Attualmente i bot vengono raggruppati in due macrocategorie: i "buoni" (good bots), che agevolano la nostra esperienza nella rete e i "cattivi" (bad bots), in grado di rubare/hackerare dati o generare falso traffico.

Alcuni esempi di good bots sono:

  • I web crawler (o web spider), utilizzati dai motori di ricerca per analizzare e indicizzare i contenuti dei siti web facilitando così la ricerca da parte degli utenti;

  • i chatbot (tra i più diffusi), che imitano la conversazione umana rispondendo agli utenti con risposte pre-programmate.

Tra i bad bots, invece, troviamo:

  • Gli spambot che, oltre al più classico spam tramite mail, riescono a compilare autonomamente form e/o generare falso traffico;

  • i click/downloading-bot, capaci di cliccare su annunci pubblicitari o scaricare automaticamente software o app;

  • i ticketing-bot, che acquistano in modo automatico biglietti per eventi popolari con l’obiettivo di rivenderli per un profitto;

  • gli impersonators-bot, progettati per imitare il comportamento umano e aggirare la sicurezza di un sito web;

  • gli scrapers-bot, capaci di leggere dati dai siti web e conservarli offline consentendone così il riutilizzo.

I bot "cattivi" possono essere talvolta racchiusi in delle botnet, reti contenenti molteplici bot capaci di infettare il computer fino a renderlo inutilizzabile. Ci sono molte altre categorie di bot, come ad esempio i videogames bots, usati sia dai videogames stessi per dare la possibilità di simulare giocatori umani sia, in modo illegale, dai giocatori per ottenere dei vantaggi; i telegram bots, utilizzati per aiutare gli utenti ma anche per scopi illegali come la diffusione di materiali e documenti e, infine, i social media bots, usati per distribuire messaggi di propaganda politica o per diffondere virus o per spam.

Bot: alcuni dati

Le statistiche dicono che i maggiori navigatori del web sono proprio i bot con il 52% di traffico, di cui 23% sono good bots e ben 29% bad bots. Il rimanente 48% siamo noi umani. I settori più colpiti dai bad bots sono in primis quelli di ticketing, a seguire troviamo gli e-commerce e le agenzie di marketing. Con la maggior parte del traffico di bot dannosi originati dai data center, gli Stati Uniti rimangono la "superpotenza di bot nocivi" con oltre la metà del traffico di bad bots proveniente dal paese.

Come rilevare il traffico bot in Web Analytics?

Ci sono vari accorgimenti nel Web Analytics per rilevare il traffico dei bot: la tendenza del traffico, frequenza di rimbalzo, indirizzi IP sospetti, origine del traffico, lingua d’origine e prestazioni del server.

In che modo i robot sfuggono al rilevamento?

Con il passare del tempo i bot sono diventati più sofisticati, ma è stato l'uso di browser headless (ovvero senza interfaccia utente grafica) come PhantomJS a rivoluzionare i bot. Questi browser sono in grado di elaborare i contenuti del sito Web nella sua interezza, anche se non possono ancora eseguire tutte le azioni degli utenti reali. I tipi più avanzati di bot si basano sul browser Chrome e sono quasi indistinguibili dagli utenti reali. Questi robot simulano l'attività umana come fare clic sugli elementi della pagina o compilare moduli autonomamente.

Misure di base per fermare il traffico bot

Ci sono tre principali misure di base per fermare il traffico dei bot:

  • Robots.txt: un file di testo da posizionare nella radice del tuo sito web per definire le regole per tutti i bot che accedono ad esso;

  • CAPTCHA: strumento utilizzato per distinguere utenti reali dai bot offrendo sfide difficili per i bot ma relativamente facili per gli esseri umani;

  • JS Alert: ovvero uno script di avviso quando nota del traffico bot.

Tecniche avanzate di mitigazione dei bot

Esistono attualmente tre approcci tecnici per rilevare e mitigare i bot:

  • Approccio statico: gli strumenti di analisi statica sono in grado di identificare le richieste web e le informazioni di intestazione correlate a bot non validi, bloccandoli se necessario.

  • Approccio challenge-based: fornire al sito web la possibilità di verificare in modo proattivo se il traffico proviene da utenti o da bot.

  • Approccio comportamentale: un meccanismo di mitigazione dei comportamenti dei bot che esamina la firma comportamentale di ciascun visitatore per vedere se è ciò che afferma di essere.

Combinando i tre approcci, si possono superare bot evasivi di tutti i tipi e separarli con successo dal traffico umano. È possibile utilizzare questi approcci in modo indipendente oppure è possibile fare affidamento su più servizi di mitigazione dei bot per eseguire tecniche personalizzate.