¡Que vienen los rusos!
Si administras algún sitio web y tienes instalado en él el script de Google Analytics y sobre todo, si analizas las estadísticas que este te proporciona como buen webmaster, es posible que te hayas encontrado con un buen montón de visitas de sitios rusos últimamente (darodar, lovevitaly, etc. ), todos ellos propiedad de una única persona y que es la moda ahora, pero vendrán desde otros lados más adelante, por lo que explico en este post de forma genérica qué es eso, grosso modo, y cómo solucionarlo.
¿Esto qué es?
Lo primero que te suele producir cuando las visitas aumentan, es darte una alegría pero luego ves de donde vienen y te entra la sospecha y a veces hasta el miedo por no saber qué leches hace un ruso viendo tu web de la asociación de padres y madres del colegio de tu hijo, el pequeño comercio de la esquina o la web de tu equipo de fútbol de Carabanchel.
Si esas visitas no te interesan, lo primero que se debe hacer es bloquearlas por si no traen nada bueno, y esto es habitual hacerlo en el fichero .htaccess de tu sitio web pero para no desviarme, explicaré cómo se hace en otro post más adelante. El caso es que a veces aún bloqueando estas visitas desde la madre rusia, seguimos recibiéndolas en nuestra cuenta de Google Analytics y acabamos mosqueandonos mucho con la situación.
Estamos ante un caso de referral spam característico. En este caso, no existen tales visitas a nuestra página, son falsas (fake o spoof en inglés). Lo consiguen de alguna forma usando el script público de la cuenta de Google Analytics que se pone en la web, de esa forma sólo vemos las visitas en la cuenta de Google Analytics pero no en otros sistemas (el plugin de visitas del CMS que usemos, en las Webmaster Tools de Google, etc. ) por eso es totalmente inútil bloquearlas en el fichero .htaccess, ¡no puedes bloquear algo que no existe!
El objetivo del spammer es conseguir que los webmasters extrañados accedan a sus sitios y una vez allí algunos buscarán visitas convertibles (comprar en su e-commerce, pinchar en publicidad, etc.) o cualquier cosa dañina que se nos ocurra.
Hasta que Google encuentre la manera de bloquearlo en Google Analytics, la única solución que tenemos es hacer un filtro y dejar de considerarlas en nuestra cuenta. De esta forma, no nos molestarán en nuestras estadísticas y conseguiremos vistas más precisas y ajustadas a la realidad de nuestros sitios.
¿Cómo las excluyo de Google Analytics?
Hasta aquí la parte teórica del post, ahora la parte práctica. Para implementar un filtro, simplemente hay que seguir los siguientes pasos:
- Entrar en nuestra cuenta de Google Anaytics
- Acceder a la opción Admin en la parte superior.
- Ahora podemos acceder a los filtros, bien desde la parte izquierda (Account|All Filters) o bien desde la derecha (View | Filters). Lo recomendable en este caso es acceder a través de la cuenta entera (izquierda) ya que podremos aplicar los filtros a todas las vistas que tengamos en la cuenta.
- Crear un nuevo filtro (+ New Filter)
- Rellenar los siguientes campos:
- Filter Name: El nombre que queramos, por ejemplo «Referral Spam Block»
- Filter Type: Custom.
- Seleccionar Exclude (viene por defecto).
- Filter Field: Campaign Source
- Filter Pattern: Aquí escribiremos la expresión regular que aplique a todos los sitios que queremos excluir. Por ejemplo, si queremos excluir el dominio «malditospam.com» y todos sus subdominios, escribiremos (.*)malditospam.com. Podemos unir varios dominios usando el carácter |, por ejemplo: (.*)malditospam.com|(.*)otromalditospam.com. Por si necesitáis ayuda con las expresiones regulares, podemos acceder a la ayuda de Google Analytics: Sobre expresiones regulares.
- Apply Filter to Views: Finalmente, sólo debemos aplicar el filtro a todas las vistas que deseemos. Esta opción no aparece si previamente hemos accedido a la vista en concreto y luego a los filtros de la misma.
- Salvar el filtro. Se puede verificar que funciona antes de salvarlo, pero para ello debemos crearlo en una vista en concreto, no de forma general como se ha sugerido en el post.
Para empezar a ver los resultados, Google nos dice que pueden pasar hasta 24 horas por lo que no desesperéis si no veis un efecto inmediato. Ahora ya es cuestión de ir actualizando el filtro con todos aquellos dominios que nos molestan.
El manejar filtros en Google Analytics es útil porque podemos aplicarlo a otros usos, como por ejemplo, el bloqueo de nuestras propias visitas internas a la web, para poder diferenciar tráfico real del tráfico generado por nosotros mismos al hacer pruebas.