Translate

domingo, 27 de octubre de 2013

DataMinning con TwitteR (II) y R

Que es R

R es un lenguaje de programacion heredado de S. Resumiendo en una herramienta con su propio lenguaje y entorno de programacion especifico para manipular estadisticas y datos. Para todo lo demas la wikipedia.

Donde me descargo R. 

 R es codigo abierto con licencia GNU , asi que es gratuito para uso personal.
R no carga todos los paquetes que tiene, sino que conforme los vas a ir utilizando los tienes que llamar. De igual forma si no tienes algun paquete debes instalarlo (lo descargar de la web en zip, desde la pesta';a, o bien desde la misma consola.

Donde me descargo R

Una vez que lo tenemos

> searchTwitter('#jobs')
Error: could not find function "searchTwitter"

> require(twitteR)
Loading required package: twitteR
Loading required package: ROAuth
Loading required package: RCurl
Loading required package: bitops
Loading required package: digest
Loading required package: rjson

Y una vez que lo tenemos nos ponemos manos a la obra.
Pero .... WTF otra vez el mensaje? Si tenemos ya los token !. Eh, si,pero aun no se lo hemos dicho a R. Asi que vamos all'a
A;adimos las siguientes linea que estan en rojo
 Copiamos y pegamos esta direccion en azul en nuestro navegador.
Y llegamos otra vez a Twitter Developer
Y obtenemos un PIN que teclearemos en la linea de comandos

Como que he descubierto por el camino

https://github.com/mjhea0/twitter-sentiment-analysis


DataMinning con TwitteR (I)




R y yo

He estado  probando R estos ultimos dias para ver todo el potencial que tiene y WOW, desde que lo use por primera vez a ahora … ha llovido muchisimo y han creado miles de paquetes nuevos. Debido al FP de programacion que estudie y a un profe muy linuxero que nos hizo aprender a manejar linux con comandos , enfrentarme a este entorno no es una cosa que me de mucho miedo... como mucho respeto.

Asi que con la idea de motivarme un poco en este a veces arido (un 90% de la veces) terreno he decido empezar por algo muy visual, y cercano y que mejor que Twitter?

R tiene una biblioteca para twitter que se llama twitteR (bien elegido el nombre...) que hace uso de las API v1.1 de Twitter.

En los ejemplos todo parecia muy bonito y rapido, pero me encontre con el siguiente mensaje cada vez que intentaba hacer algo.

OAuth authentication is required with Twitter's API v1.1

Pero esto que eeeeeeeehhhhssss??? exclamaba mientras golpeaba mi cabeza en el teclado.

Asi que googleando llegue a la solucion del problema. El a;o pasado Twitter saco una nueva version de la  API y ahora es necesitario tener acceso con un Token y todas estas cosas en pro de la seguridad ciudadana.

Asi que antes de ponerse manos a lo obra, lo mejor seria acceder a tener nuestro token.

Que es un Token?

Donde consigo la OAuth authentication?

Asi que vamonos a la pagina de Twitter Developer
Logueamos con nuestra cuenta de Twitter de toda la vida







 Una vez que hacemos log in podemos acceder a nuestros token

Ahora corramos un tupido velo y volvamos a R con nuestros flamantes consumer key y consumer secret pero manten esta pagina abierta.