Google Analytics Referral Spam

Come rimuovere lo spam dei Referral da Google Analytics

Lo Spam dai Referral avviene quando il vostro sito riceve traffico inusuale da Bot e Referral sospetti e questo traffico viene registrato da Google Analytics, inficiando una lettura precisa dei dati reali (per esempio: aumentando il numero delle visite complessive) . Questi dati vanno eliminati da Google Analytics. Ecco come fare.

I Bot sono programmi realizzati per eseguire automaticamente delle operazioni ripetitive. Esistono vari Bot programmati per visitare più e più volte i siti web. Queste visite vengono registrate da Google Analytics, modificando così i dati dei reali visitatori.

Esiste una lista interminabile di Bot di questo tipo (dopo vedremo dove trovarla e come utilizzarla). I motivi per cui questi software vengono lanciati alla ricerca di siti da visitare possono essere molteplici:

  1. gonfiare il numero di visite ad un sito
  2. cercare e memorizzare indirizzi di posta presenti sulle pagine
  3. memorizzare il contenuto del sito
  4. diffondere malware e virus

Esistono dunque Bot buoni e Bot cattivi. Tra i buoni c’è quello di Google (GoogleBot), che viene a trovarci per memorizzare e indicizzare il contenuto del nostro sito. Tra i Referral buoni che troverete nell’elenco potrebbe esserci quello di Google Translate. Niente di male. Di solito i Bot buoni visitano il sito raramente, mentre quelli cattivi insistono nelle loro operazioni automatiche mordi-e-fuggi, anche perché sono spesso realizzati senza troppi filtri e controlli sulla qualità.

Un buon modo per trovare i Bot cattivi:

  1. Accedere a Google Analytics, selezionare un periodo abbastanza lungo (un mese, un anno… dipende dalla quantità complessiva di visite al vostro sito) ed entrare nel Report con le visite dai Referral (Acquisizione > Tutto il traffico > Referral)
  2. Ordinare la tabelle per Frequenza di Rimbalzo decrescente (da 100% in giù), oppure creare un segmento di traffico con Frequenza di Rimbalzo uguale a 100%. Controllate però anche quelli con poche visite. Spesso sono gli stessi domini trovati tra le visite molteplici, ma con un dominio di primo livello diverso (es.: www.dominio.com, xyz.dominio.com, 234.dominio.com, ecc.)
  3. Cercare i Referral che hanno Frequenza di Rimbalzo pari a 100% ed un notevole numero di visite (es.: più di 10). Questo dovrebbe separare nell’elenco dei sospetti i referral da cui ricevete parecchie visite dagli esseri umani interessati ai vostri contenuti, ma state comunque attenti ai nomi dei referral che trovate. Esempio: se la pagina della vostra ricetta della Paella ha ricevuto 90 visite da Giallozafferano.it, non è un dato da buttare via!

Google Analytics Referral Spam

Nella tabella qui sopra, i quattro risultati sono sicuramente Bot cattivi, perché il sito analizzato non ha ragione di essere linkato e ricevere tante visite (con 100% di rimbalzo) da siti che nulla hanno a che fare con la pubblicazione spontanea di link alle vostre pagine. Non visitate quei siti! Il più delle volte contengono malware che possono infettare il vostro computer (e cercano di attirarvi sulle loro pagine proprio per questo).

Come eliminare questi dati da Google Analytics?

Un modo sembrerebbe essere quello di creare un filtro nello stesso Analytics che eviti di considerare questi dati nei report. Ma non elimina il problema delle visite. Semplicemente, dice ad Analytics di non contarle. Se vogliamo evitare il più possibile che i Bot entrino effettivamente nel nostro sito, occorre agire a livello di server. Il sistema che segue funziona per siti web residenti su server Linux, ma con le opportune modifiche (fatevi aiutare dal vostro webmaster) va bene anche per i server Windows.

Specifico inoltre che, con questo sistema, non vengono eliminate da analytics le visite dei Ghost Referral, cioè di quelli che non visitano fisicamente le pagine ma simulano solo la visita in modo che Analytics la conti.

Eliminare lo Spam dei Referral in Google Analytics

1. Scaricare via FTP e aprite il file .htaccess presente nella cartella principale del vostro spazio web (o createne uno)

2. Aggiungete questo codice

# BEGIN BLOCCO REFERRAL MALEVOLI
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^([^.]+.)*?semalt.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^([^.]+.)*?kambasoft.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^([^.]+.)*?buttons-for-website.com [NC]
RewriteRule ^.* – [F]
# END BLOCCO REFERRAL MALEVOLI

Oppure, più elegantemente ed efficientemente (dal punto di vista del codice):

# BEGIN BLOCCO REFERRAL MALEVOLI
RewriteCond %{HTTP_REFERER} (?:buttons-for-website|kambasoft|semalt)\.com [NC]
RewriteRule ^ – [F]
# END BLOCCO REFERRAL MALEVOLI

Questo codice bloccherà i referral http e https da semalt.com, kambasoft.com e buttons-for-website.com e da tutti i rispettivi sotto-domini. Potete aggiungere altri domini, naturalmente, per ciascun referral sospetto.

Qui trovate una corposa blacklist di Bot e Spam Referral sicuramente da eliminare. Non mi fiderei troppo del copia-incolla del codice già scritto per il file .htaccess (ma potete provare e – se dovesse dare errori – tornare immediatamente al file htaccess originale):  http://perishablepress.com/blacklist/ultimate-referrer-blacklist.txt

Per verificare i potenziali rischi derivati dalla presenza di questi Bot e altri modi per difendersi potete leggere l’ottimo articolo di Optimizesmart.com dal quale ho tratto ispirazione per questo post.

Hai anche tu molto Spam da Referral in Google Analytics? Racconta la tua esperienza.