Translate

jueves, 12 de diciembre de 2013

Visualizar el not provider de mi cuenta de Google Analytics


El not-provider se ha convertido en el pan nuestro de cada día para los que somos webmaster y estamos acostumbrados a echarle un ojo al Google Analytics. Google ya anunció que est sería un cambio irreversible y este post va para aquellas que les pique la curiosidad sobre como se ha ido apoderando de su cuenta el not-provider aquí tenéis el mío. Y si quieres comparar... esta empresa lleva sus propios datos actualizados.


Ahora vamos al código
# Keep libraries
library(devtools)
library(rga)
library(RCurl)

options(RCurlOptions = list(cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl")))
ga$getRefClass()
rga.open(instance="ga")

#Not provided query
visits_notprovided.df <- ga$getData(39015127,
                                    start.date = "2011-01-01",
                                    end.date = "2014-02-10",
                                    metrics = "ga:visits",
                                    filters = "ga:keyword==(not provided);ga:source==google;ga:medium==organic",
                                    dimensions = "ga:date",
                                    max = 1500,
                                    sort = "ga:date")

names(visits_notprovided.df)<- c("hit_date", "np_visits")

# Get sum of all Google Organic Search results.  Replace XXXXXXXX with your profile ID from GA
visits_orgsearch.df <- ga$getData(XXXXXXXX,
                                  start.date = "2011-01-01",
                                  end.date = "2014-02-10",
                                  metrics = "ga:visits",
                                  filters = "ga:source==google;ga:medium==organic",
                                  dimensions = "ga:date",
                                  max = 1500,
                                  sort = "ga:date")

names(visits_orgsearch.df)<- c("hit_date", "total_visits")

# Merge files, create metrics, limit dataset to just days when tags firing
merged.df <- merge(visits_notprovided.df, visits_orgsearch.df, all=TRUE)
merged.df$search_term_provided <- merged.df$total_visits - merged.df$np_visits
merged.df$pct_np <- merged.df$np_visits / merged.df$total_visits
merged.df$yearmo <- year(merged.df$hit_date)*100 + month(merged.df$hit_date)

final_dataset = subset(merged.df, total_visits > 0)


# Visualization - boxplot by month
# Main plot, minus y axis tick labels
boxplot(pct_np~yearmo,data=final_dataset, main="Google (not provided)\nPercentage of Total Organic Searches",
        xlab="Year-Month", ylab="Percent (not provided)", col= "orange", ylim=c(0,.8), yaxt="n")

#Create tick sequence and format axis labels
ticks <- seq(0, .8, .2)
label_ticks <- sprintf("%1.f%%", 100*ticks)
axis(2, at=ticks, labels=label_ticks)

Para ver el código comentado paso a paso puedes estudiar este artículo. http://www.computerworld.com/article/2486018/business-intelligence-how-to-extract-custom-data-from-the-google-analytics-api.html 

martes, 12 de noviembre de 2013

Pasos para visualizar datos

Estaba viendo hoy una conferencia de la semana pasada  de Mario Tascon que ya me sonaba de oidas en el mundo, pero que al parecer es muy muy famoso entre las personas de comunicacion.
Me di cuenta de esto debido a que ya lo escuche en Comunica2 y todo el mundo lo esperaba con expectacion ... y una vez que dio la conferencia entendi el porque.

Pasos para visualizar datos

  1. Buscar un tema
  2. Conseguir los datos
  3. Separar el trigo de la paja
  4. Preparar un formato visualizable
  5. Buscar la representaci'on adecuada
  6. Preparar el grafico
  7. Publicarlo


sábado, 2 de noviembre de 2013

Qué es R



Definición de R


Al buscar en R en el navegador nos encontramos con la siguiente definicion en Google. La verdad es que suficiente informacion para empezar a saber de lo estamos hablando.



Una cosa que me queda claro es que es un lenguaje de programacion para análisis estadistico y qué es gratis, digo libre.

Al ser proyecto GNU, si queremos podemos contribuir en el proyecto y entre otras cosas más y más personas han creado paquetes para el proyecto de forma gratuita. Lo que se traduce en que ahora R dispone de cientos de paquetes para, por ejemplo, utilizar la libreria de Google Analytics o poder hacer mapas con R

Más información sobre R

Definición de R de la Wikipedia en español ( ingles)
Página oficial del proyecto
Página con las listas de email para estar a la ultima en cuanto a información oficial

domingo, 27 de octubre de 2013

DataMinning con TwitteR (II) y R

Que es R

R es un lenguaje de programacion heredado de S. Resumiendo en una herramienta con su propio lenguaje y entorno de programacion especifico para manipular estadisticas y datos. Para todo lo demas la wikipedia.

Donde me descargo R. 

 R es codigo abierto con licencia GNU , asi que es gratuito para uso personal.
R no carga todos los paquetes que tiene, sino que conforme los vas a ir utilizando los tienes que llamar. De igual forma si no tienes algun paquete debes instalarlo (lo descargar de la web en zip, desde la pesta';a, o bien desde la misma consola.

Donde me descargo R

Una vez que lo tenemos

> searchTwitter('#jobs')
Error: could not find function "searchTwitter"

> require(twitteR)
Loading required package: twitteR
Loading required package: ROAuth
Loading required package: RCurl
Loading required package: bitops
Loading required package: digest
Loading required package: rjson

Y una vez que lo tenemos nos ponemos manos a la obra.
Pero .... WTF otra vez el mensaje? Si tenemos ya los token !. Eh, si,pero aun no se lo hemos dicho a R. Asi que vamos all'a
A;adimos las siguientes linea que estan en rojo
 Copiamos y pegamos esta direccion en azul en nuestro navegador.
Y llegamos otra vez a Twitter Developer
Y obtenemos un PIN que teclearemos en la linea de comandos

Como que he descubierto por el camino

https://github.com/mjhea0/twitter-sentiment-analysis


DataMinning con TwitteR (I)




R y yo

He estado  probando R estos ultimos dias para ver todo el potencial que tiene y WOW, desde que lo use por primera vez a ahora … ha llovido muchisimo y han creado miles de paquetes nuevos. Debido al FP de programacion que estudie y a un profe muy linuxero que nos hizo aprender a manejar linux con comandos , enfrentarme a este entorno no es una cosa que me de mucho miedo... como mucho respeto.

Asi que con la idea de motivarme un poco en este a veces arido (un 90% de la veces) terreno he decido empezar por algo muy visual, y cercano y que mejor que Twitter?

R tiene una biblioteca para twitter que se llama twitteR (bien elegido el nombre...) que hace uso de las API v1.1 de Twitter.

En los ejemplos todo parecia muy bonito y rapido, pero me encontre con el siguiente mensaje cada vez que intentaba hacer algo.

OAuth authentication is required with Twitter's API v1.1

Pero esto que eeeeeeeehhhhssss??? exclamaba mientras golpeaba mi cabeza en el teclado.

Asi que googleando llegue a la solucion del problema. El a;o pasado Twitter saco una nueva version de la  API y ahora es necesitario tener acceso con un Token y todas estas cosas en pro de la seguridad ciudadana.

Asi que antes de ponerse manos a lo obra, lo mejor seria acceder a tener nuestro token.

Que es un Token?

Donde consigo la OAuth authentication?

Asi que vamonos a la pagina de Twitter Developer
Logueamos con nuestra cuenta de Twitter de toda la vida







 Una vez que hacemos log in podemos acceder a nuestros token

Ahora corramos un tupido velo y volvamos a R con nuestros flamantes consumer key y consumer secret pero manten esta pagina abierta.