Translate

Mostrando entradas con la etiqueta trends. Mostrar todas las entradas
Mostrando entradas con la etiqueta trends. Mostrar todas las entradas

sábado, 21 de enero de 2017

Errores que pueden darse al analizar datos de forma visual

En el curso sobre Data Visualization and Communication with Tableau ya vamos por la semana tres y cada vez se pone más interesante sobre todo en lo que aplicación práctica se refiere. Sin duda, uno de los mejores cursos que me he encontrado últimamente ya que va más allá de Tableau y explica todo un framework a tener en cuenta para explicar los resultados obtenidos.

Esta semana además aparecen en los vídeos personal de AirBnB dando ejemplos reales de los problemas que pueden darse al analizar los datos.

Errores que se pueden dar al analizar datos de forma visual 

La generalizacion y el sesgo muestral (Overgeneralization ands sample bias)


Este error se refiere al problema que genera elegir un dataset que está demasiado lejos de la realizad por ser una muestra demasiada o pequeña y dar por real algo que no lo es. Igualmente podemos tener un dataset enorme pero que no se ajuste a la realidad. Por ejemplo The Guardian intentó analizar donde eran peores las consecuencias de los efectos del Huracán Sandy según el ruido que se formaba en twitter. En realidad como la población no está igualmente distribuida, habia más tweets desde las ciudades más pobladas. Así que si se hubieran quedado con ese dataset no hubiera servido para nada y los resultados no hubieran servido para nada.

Así que deberíamos tener más cuidado con la calidad de los datos.

Mala interpretación debido a la falta de controles


Cada vez que analizamos algo puede ser debido a diversas causas, no sólo a lo que nosotros pensamos que puede ser. Como ejemplo se da un análisis de una acción de email marketing que supuestamente hacer que aumente la compra de una bebida en una determinada fecha. Más allá de ello nos encontramos que en realidad el aumento de la compra de la bebida se dá, no sólo en nuestra empresa sino también en los mayores competidores. ¿Qué ha podido pasar? Justamente por esa fecha un actor sale en las revistas bebiendo ese tipo de bebida y todos los vendedores salen fortalecidos.

Por ello siempre debe hacerse un grupo de control para ver si el resultado de la acción se debe a alho intrínseco.


Correlación no implica causalidad


Esto siempre es debatido en el análisis. Dos variable que parecen que tienen correlación (por ejemplo cuando una aumenta la otra también) en realidad  pueden no tener relación. Por ejemplo google estuvo haciendo un estudio y dando los resultados sobre la gripe. Así podía predecir los brotes que se daban por zona geográfica. Aunque en un principio parecía correcto, llegó un momento en que dejo de serlo. Quizás había alguna variable que no se haya tenido en cuenta o que entra en juego a lo largo del tiempo, por ejemplo un cambio en Google suggest
A ese tipo de relación que gráficamente parece existir pero que no tiene lógica se le llama relación espurea. Y se pueden a modo de friki-chiste relaciones espureas en esta página web.

Recomendación para evitar estos errores en el análisis

¿Y qué podemos hacer para intentar cometer el mínimo de errores posible y que se vaya todo el trabajo al garete?

1. Podemos crear un grupo de control, al modo A/B testing.

2. Si no es posible, podemos estudiar otras variables relacionadas que podrían esta interfiriendo en el análisis.

3. Hay que tener en cuenta que cuanto más grande es un dataset, más probabilidad hay de que aparezca una variable durante un periodo de tiempo  que haga que la nuestra correlación no sea cierta.(por ejemplo para el caso de Google flu, un cambio en su algoritmo con Google suggest donde sugería a los usuarios términos a buscar ) Así que si queremos basarnos en las correlaciones primero debemos saber que estamos haciendo e investir tiempo y esfuerzo en ello.

Más allá de todo esto aquí dejo un artículo de Wired sobre lo que podemos aprender del fallo de Google Flu Trends (muy muy interesante)

domingo, 24 de julio de 2016

England,UK,Great Britain or United Kingdom?

Después de leer un artículo de broma sobre la dificultad de "ser británico" en 2014 con el típico humor britanico, he caído en la cuenta de que yo también me enfrento a algunas de las situaciones que describen.
Una de ella es cuándo hay que buscar por país en una empresa de aerolineas o cualquier tipo de transporte. Estará por UK, England, Reino Unido,...? Siempre me lleva unos segundos de más. Parecido a cuándo no sabes si buscar por Spain o por Espana.

Para ver cómo buscan los mismo británicos por su país y cómo lo buscan en otros países de habla ingresa me he ido a Google trends a ver si ha ido cambiando.

Google Trends

Cómo se escribe Reino Unido en el mundo inglés

Los resultados han sido los siguientes:
  Al final he decidido annadir London para ver si es más importante que el propio país. Y bueno, parece que tanto en USA como en Canadá, Londres como concepto de busqueda es tan importante como el país en sí. La verdad es que si una empresa decide hacer una página web internacional le puedes servir muy bien investigar en Google Trends sobre este aspecto, sobre todo y mmientras Google Hummingbird, el algoritmo de Google, sigue aprendiendo cómo buscan los usuarios en Internet. Yo aún me enfrento a ello cuando voy a Espanna de vacaciones y me preguntan "qué tal por Londres "(a 3-4 horas de Leeds, dónde me encuentro). Igualmente a un amigo le pasa lo mismo cuándo le preguntan por Inglaterra y él está viviendo en Gales. Y es que no sólo en Espanna existe esa diferencianción por la "comunidad" dónde vivimos o hemos nacido y el país en sí...

Keywords para SEO y SEM

Asi que si decides hacer una keyword research para otros países (tanto en SEO cómo en SEM), deberíás tener todas estas cosas en cuenta, pero todos estos detalles pueden que te permitan crear una entrada de tráfico para long keywords por ejemplo que tu competencia aún no haya minado. Así que todavía queda mucho trabajo por hacer :)

miércoles, 4 de febrero de 2015

Encontrar patterns estacionales o de temporada en Google Analytics : ya llegó la Navidad para los estudiantes

Ya ha pasado la Navidad y una de las cosas que me hace más gracia del análisis web es ese poder de ver patterns en los datos. Y no estudiantes, no me engañéis, la mayoría de vosotros cierra la mente por vacaciones a partir del 20 de Diciembre y no vuelve a retomar los libros hasta el 6 de Enero.

¿Qué no? Vamos a ver

Comparar datos Navidad 2013 y Navidad 2014



Vale, más o menos todo cuadra, sobre todo lo del 6 de Enero. Sin embargo, no estaría mal normalizar los datos según el día de la semana. Ya que como vimos en el post anterior el día de la semana influye en mis usuarios/visitantes

Datos normalizados según día de la semana

En este caso sólo había un día de diferencia Sabado 20-12-2014/ Viernes 20-12-2013 y Martes 06-01-2015/ Lunes 06-01-2014 pero nos ayuda a ver visualmente alguno de los días que siguen la tendencia de días de semana, en vez de días festivos.

Google Analytics sólo nos deja comparar dos fechas a la vez. Así que si queremos seguir comparando años, lo mejor es exportar datos y llevárnoslos a otra herramienta, por ejemplo el Excel nuestro de cada día.

Encontrar pattern mensuales en Google Analytics: visitantes por días de la semana

Hace tiempo que no escribía nada, mayormente por el tema mudanza y no tener acceso a Internet 24/7.  Me gustaría volver a un tema de principiante en análisis web.
Al principio de tener Google Analytics me frustraba un poco cómo se veía este gráfico tanto Google Webmaster Tools como en Google Analytics. Qué pasaba en esa cada toda las semanas? Pues muy fácil, que además de vida online, mis usuarios tienen vida offline y los fines de semana, pues se lo toman de relax.
Como muestra este gráfico del mes de septiembre que empezó en lunes.

¿No queda muy claro no? Bueno, ya le valdria al equipo de UX de Google Analytics currarse una vista para que no tuviera que hacer yo esto a mano. Pero mientras tanto y tras una mini sesión de Photoshop así queda más claro.


Se puede observar que el ánimo de los estudiantes va decayendo durante la semana,Y el Domingo nos entran los remordimientos de conciencia y decimos. Está semana me pongo...

Antes de nada si vuestro sitio tiene muchas visitas vía redes sociales o no tenéis el filtro en vuestras IP  y lo que queréis ver es cómo llega a la gente vuestro sitio via Google o Bing debéis mirar en tráfico orgánico.



Otra de las cosas que se nos puede escapar en este gráfico y que sabiamente Google añadió hace varios meses, es la posibilidad de poder ver las horas a las que accedieron a tu site.

Si nos vamos a la vista de horas tenemos que

Vaya, visualmente esto nos da algún Insights bastante interesante en el periodo entre el viernes a última hora, a partir de las 16.00 más o menos, y el domingo hasta las 18.00 es cuando la gente busca menos. Bueno, las visualizaciones nos hacen darnos cuentas de algunas pistas que podemos ver más a fondo por ejemplo bajando los datos en tablas a Excel o directamente cargando estos en SPSS o R para encontrar correlaciones.

Lo que siempre está bien es tener en cuenta que cuánto antes recopilemos estos datos para las webs, cuando tengamos algo de tiempo podremos empezar a analizarlos.