Ayer publiqué una larga limonada sobre cómo descargar y depurar el #TwitterArchive. Concluía preguntándome para qué rayos me tomé tal molestia. Obviamente, yo me sabía la respuesta y si usted tiene un poquito de imaginación seguramente también sabe para qué. Esta limonada de hoy sirve de ejemplo de todo lo que se puede descubrir analizando el #TwitterArchive con un poquito de curiosidad y el viejo y eficiente Microsoft Excel 2010. Ok, ¡vamo’aceile!
A continuación explico las subsiguientes mejoras que le hice a mi #TwitterArchive. Esta parte está llena de tecnicismos y fórmulas de Excel que son profundamente aburridas, así que si quieres volarte esta parte que sólo le importa a los locos como yo, haz clic aquí.
Otros retoques y depuraciones
Antes de empezar a analizar, debo aclarar que hice un montón de ajustes más al #TwitterArchive. Aquí desgloso los principales, sin entrar en demasiados detalles, pues en el fondo esto no es un curso de Excel. Si usted desea que yo le prepare un análisis de todos sus tuits, lo podemos conversar.
Día de la semana
Hice una columna (DiaSemana) para determinar el día de la semana usando =weekday([adjusted]). Esa fórmula devuelve un número de 1 a 7 para identificar los días de la semana desde el domingo (1) al sábado (7). Luego, en otra parte de la hoja, hice un rango con los números y los nombres de los días y utilicé VLOOKUP para convertir cada número en el nombre del día correspondiente.
=VLOOKUP(WEEKDAY([@Adjusted]),RangoDeDias,2,FALSE)
Hora del día
En otra columna que llamé HoraDia, construí una simple fórmula para saber la hora del día (sin minutos ni segundos) en que tuitié.
=TIME(HOUR([@Adjusted]),0,0)
Cliente utilizado
Cuando vi la columna de source me di cuenta de que Twitter entrega el nombre de la aplicación usada para tuitear, pero lo rodea de códigos HTML que hacen complicada la lectura. Por ejemplo, los tuits que salen con Twitter for Blackberry aparecen como <a href=”http://blackberry.com/twitter” rel=”nofollow”>Twitter for BlackBerry</a>. Para extraer solamente el nombre de la aplicación tuve que hacer un poco de maromas.
Hice dos columnas adicionales, una la llamé FinAbre y la otra InicioCierra (soy un genio, lo sé). En ellas puse fórmulas para ubicar la posición donde se encontraban los símbolos de “>” (el fin del tag que abre el URL) y luego el de “<” (el inicio del tag que cierra el URL). Si no encontraba estos caracteres, daba 0, usando =IFERROR.
La fórmula de FinAbre es:
=IFERROR(SEARCH(“>”,[@source],1),0)
La fórmula de InicioCierra es:
=IFERROR(SEARCH(“<“,[@source],[@FinAbre]),0)
Si se dieron cuenta, el parámetro de inicio de búsqueda en la segunda fórmula es el valor encontrado en la primera. Esto así para que encuentre el valor a partir del “>”, pues si no, siempre encontraría el primer “<” al inicio de la cadena.
Ya con estos dos valores, extraer el nombre del cliente fue “un cachú en spray” (Profesor Luis del Rey Álvarez, donde quiera que estés, te saludo). En la columna cliente puse:
=IF([@FinAbre]>0,MID([@source],[@FinAbre]+1,([@InicioCierra]-[@FinAbre]-1)),”Web”)
Determinar el tipo de tuit
Otra fórmula muy útil es la de clasificar los tuits de acuerdo a ciertos parámetros de contenido. Por ejemplo, es sano asumir que si un tuit empieza con “RT ” se trata de un retuit natural. En cambio, si empieza con “@”, entonces es una respuesta. Si no empieza con ninguna de estas dos condiciones pero tiene “@” en el resto del tuit, entonces es una mención. Si no tiene ninguna de las tres, se trata de un tuit regular. La fórmula más simple para determinar el tipo de tuit de un zarpazo es anidar tres sentencias IF en una columna nueva que llamé Tipo.
=IF(LEFT([@text],3)=”RT ” ,”Retuit”,IF(LEFT([@text],1)=”@”,”Respuesta”, IF(IFERROR(SEARCH(“@”,[@text],3),0)>1,”Mención”,”Regular”)))
¿Se perdieron? Espero que no, porque todavía faltan cosas…
Uso de URLs y #Hashtags
Esta es fácil, ¿verdad? Todos los tuits con enlace tienen “http://” en el texto. Todos los tuits con hashtags incluyen el símbolo “#” en alguna parte. Dos fórmulas resuelven esa disyuntiva más rápido que lo que tarda el Congreso en aprobar la venta de otra área protegida.
Creé una columna (ConURL) para los de URL:
=IFERROR(IF(SEARCH(“http://”,[@text],1)>0,”Con URL”,”Sin URL”),”Sin URL”)
Y otra (ConHashtag) para los que incluyen hashtags:
=IFERROR(IF(SEARCH(“#”,[@text],1)>0,”Con hashtag”,”Sin hashtag”),”Sin hashtag”)
La columna “expanded_urls”
Es importante notar que el #TwitterArchive incluye una columna llamada expanded_urls en donde pone los URL que fueron tuiteados acortados con el acortador integrado de Twitter (t.co). Sin embargo, si un URL no fue acortado con t.co antes de su implementación, no sale en la columna de expanded_urls, y eso es un problema. Por eso, la columna de ConURL que yo creé es más fiel a la realidad. En mi #TwitterArchive, tenía sólo 2,450 tuits con expanded_urls pero con mi fórmula encontré más de 4,000.
Peor aún, en expanded_urls sólo sale la primera iteracción de acortamiento. Esto significa que si yo tuitié un URL ya acortado con bit.ly, en expanded_urls sale en enlace corto de bit.ly, no el destino final.
Para facilitar el análisis, copié todos los tuits que salían en expanded_urls en una hoja nueva y cerré mi #TwitterArchive. Luego identifiqué todos los URLs que seguían siendo acortados y los puse aparte. Para expandirlos en grupo, me valí de un servicio llamado URL Expander al que le pude copiar todos los tuits acortados y al cabo de un tiempo (y varios errores 500) me entregó la lista de todos los enlaces finales.Eso fue una pela, pero después que empecé no quise dejarlo incompleto.
Ya con todos los URLs expandidos hice varios intentos por crear una fórmula que extrajera los dominios usando MID y ubicando los puntos y las barras, pero la verdad es que siempre encontré dificultades. Terminé poniéndole la mano a los URLs que no se comportaban bien en la fórmula y manualmente los ajusté. Esto no es un tratamiento puro, pero no encontré una manera de extraer los TLD fácilmente. Las gráficas que contemplan los URLs se basan en este archivo aparte.
A quienes di retuit o respuestas
Finalmente, construí dos columnas para determinar las cuentas a las que di retuit o respuestas. Para ello evalué si el tipo de tuit era RT o respuesta y capturé el usuario a partir del inicio y hasta encontrar un espacio, una coma, dos puntos o guión, que son los caracteres que suelen separar las cuentas del texto.
Si bien es cierto que en el #TwitterArchive hay columnas que indican el Twitter ID de quien se dio respuesta o retuit, preferí no usar esas columnas porque no me estaba entregando fácilmente el nombre del usuario y además porque esto no aspira a ser algo taaaaan riguroso que deba cuadrar al chele.
Y bueno… básicamente esas fueron las mejoras que le hice al #TwitterArchive y con ellas lo siguiente fue simplemente ponerme a hacer tablas pivote y gráficas dinámicas. My bread and butter.
Las gráficas de mi #TwitterArchive
Ahora sí, veamos algunas gráficas de mi #TwitterArchive
Esta gráfica es simple. Mi primer año en Twitter fue el más pobre, mientras que en el 2011 sufrí una extraña apatía que me mantuvo algo alejado de mi cuenta en Twitter. El 2013, con 1,852 tuits con apenas 41 días transcurridos, se proyecta ser el año en el que más pluma de burro hablaré, con 16,487 tuits.
En los cuatro años que llevo tuiteando, solamente en cinco días he sobrepasado 100 tuits. Tres de esos días ocurrieron el año pasado: El 27 de abril (mi record hasta el momento) me puse a relajar los movimientos políticos que surgían apoyando las distintas candidaturas para las elecciones del 20 de mayo. Creé el hashtag #ApoyoCrucial para eso.
Hipólito ya ganó gracias al #ApoyoCrucial de los Campeones del Torneo de Jugar al Burro con Papá (that was nasty, I know).
— Darío MartínezBatlle (@dariomartinezb) April 27, 2012
La Asociación de Ex-Clientes del Rancho La Campana da su #ApoyoCrucial a Guillermo!!! — Darío MartínezBatlle (@dariomartinezb) April 27, 2012
La Asociación de Maestros de Hacer Zumbido de Abejas en Clase ofrece su #ApoyoCrucial a Max Puig… — Darío MartínezBatlle (@dariomartinezb) April 27, 2012
Esa ‘tá buena pero… Uffff… No debería darle RT! @accelito: @dariomartinezb #apoyocrucial asociación de masajistas con mama
— Darío MartínezBatlle (@dariomartinezb) April 27, 2012
La Junta de Reparadores de Máquinas de Escribir de Manigueta decidió dar su #ApoyoCrucial a Abinader
— Darío MartínezBatlle (@dariomartinezb) April 27, 2012
Rellenadores de Pastelitos “de verano” con Danilo: #ApoyoCrucial
— Darío MartínezBatlle (@dariomartinezb) April 27, 2012
#ApoyoCrucial del Colegio de Vendedores de Batata Asada (presidente Sadam Hussein) con Serrulle
— Darío MartínezBatlle (@dariomartinezb) April 27, 2012
Los días 23 y 24 de mayo fueron prolíficos porque me puse a responder tuits de cumpleaños. El 12 de septiembre de 2011 fue muy activo para mí pues estuve debatiendo con las personas que no podían creer que el Miss Universo lo hubiera ganado una negra, la chica de Angola. Escribí una de las limonadas más intensas del año por ese tema: La ignorancia a flor de piel.
Finalmente, el último día con más de 100 tuits hasta la fecha fue el 19 de enero pasado. Ese día fui comentando el segundo partido entre Leones y Águilas, el cual presencié en el Estadio Quisqueya. Fue el día en que conocí a Claudia Pimentel, un evento que debí haber dejado para el mes de jotiembre…
@cpjaadfv Lamento haberte ido a saludar, eso me azaró. Pero ni modo, fue un placer conocerte, finalmente. Una chulería! 40limon.es/2013/01/vielka…
— Darío MartínezBatlle (@dariomartinezb) January 20, 2013
Otro día bastante prolífico este año fue el 22 de enero, en cuya noche los mismos jodidos Leones completaron la barrida ante mis Águilas. De ese evento escribí una limonada. #LaÚltimaCabala.
Ok, sigamos con más gráficas.
Esta gráfica muestra los clientes que más utilizo para tuitear. Cerca de la mitad de mis tuits han salido desde Twitter for Blackberry, algo que probablemente con el tiempo será reemplazado por “Twitter for Blackberry10”. 23.7% de mis tuits los he enviado a través del portal de Twitter y eso es normal pues en la computadora hace tiempo que dejé de usar clientes externos. Me asombró ver que Mixero quedó en tercer lugar. Realmente ese cliente me gustaba, lo mismo que DestroyTwitter. Luego de estos, sale Buffer, y más abajo Foursquare, que son servicios que “tuitean” por mí, los cuales aún utilizo.
Aquí veo la distribución de los tuits de acuerdo al día de la semana. De lunes a viernes se concentra la mayor parte de mis tuits, algo que es absolutamente normal. Viernes y miércoles son los días en que más he tuiteado, seguidos por minúsculo margen por los martes y los jueves. Me resulta curioso que los lunes queden con casi 600 tuits menos que los viernes. ¿O no?
En esta gráfica queda el testimonio de mi comportamiento tuiteando por cada hora del día. La madrugada es mi período más árido, algo que no asombra mucho. Supongo que la cofradía de los #TwitterDesvelados aquí tendría su punto álgido, pero yo (que alguna vez fui miembro de eso) ya me he puesto viejo y tradicional. Mi hora pico son las 9 de la mañana con un repico a las 2 de la tarde, que es cuando suelo almorzar. Entre las 9 de la mañana (2,235 tuits) y las 6 de la tarde (1,354 tuits) hay una diferencia de casi 900 piezas.
AVISO IMPORTANTE
Si usted es Claudia Chez, haga clic aquí urgentemente.
Esta gráfica muestra la distribución de mis tuits considerando el horario laboral. Poco más de un tercio de todos mis tuits (10,922 para ser exactos) han sido hechos entre las 9 de la mañana y las 6 de la tarde de lunes a viernes, lo que considero “horario laboral”. El restante 65% (20,062) ha sido tuiteado entre 6:00pm y 9:00am de lunes a viernes, o durante cualquier hora de sábados o domingos. Por supuesto, esto no contempla días de vacaciones ni feriados, y tampoco los tuits que programo usando herramientas como Buffer o SproutSocial, los cuales casi siempre son publicados en la franja de horario laboral. De todas maneras, si usted es Claudia Chez, no debió haber leído esto. Desobediente.
Aquí queda evidenciada la curva de tuiteos que he hecho en horario laboral y coincide con la curva general de arriba, aunque el pico de las 9 de la mañana proporcionalmente es más pronunciado en esta gráfica. Claudia, ¿qué voy a hacer contigo leyendo esto? *sigh*
El contenido
Una de las principales premisas que se pueden asumir cuando alguien se une a Twitter es que deberá conversar. Si bien es perfectamente posible crear una cuenta de “solo consumo”, siguiendo decenas de cuentas sin nunca interactuar con nadie, esa no es la naturaleza de Twitter. ¿Cuántos de mis tuits son de contenido regular, cuántos son retuits, cuantas respuestas he dado, cuántas menciones? ¿Con quienes interactúo más? ¿A quiénes he dado más retuits? ¿Cuál es el porcentaje de tuits que tienen enlaces? ¿Cuántos tienen #hashtags? ¿Cuántos tienen ambas cosas? ¿Cuáles son los sitios de donde más comparto enlaces?
Veamos:
Esta gráfica desglosa mis 30,864 tuits de acuerdo al tipo de contenido. Se percibe claramente que tengo un alto nivel de interacción con la tuitósfera, pues más del 72% de mis tuits incluyen alguna interacción con otras cuentas. Me encontré el dato tan alto que revisé los cálculos nuevamente, pero es así. Hay que considerar que antes de la existencia de los retuits naturales, solamente se podía hacer retuit “a la antigua”, lo que hoy se conoce como “classic retweet” o “quote retweet”, y esos retuits editados hoy día son consideradas menciones.
Al considerar cuántos tuits con enlace o con hashtags yo he compartido, la situación es abrumadoramente hacia el “no-no”. Estos valores consideran todos los tipos de tuits, pero aunque filtrara seleccionando solamente los tuits regulares, el promedio sería apenas de 26% con enlaces y 23% con hashtags entre los tuits de tipo regular. ¿Cuál es el nivel de solapamiento entre tuits con enlaces y tuits con URLs? Eso se responde con la siguiente gráfica.
La cantidad de tuits que tienen tanto enlace como hashtag es bastante baja, a decir verdad. Solamente un 14% (576 en total) de mis tuits que tienen URL o hashtags, tienen ambas cosas a la vez. Quizás el dato sea irrelevante, pero me llama la atención que me he acostumbrado a usar o una cosa o la otra.
Los sitios que enlazo con mis tuits no son de mucha sorpresa. Este blog es fácilmente el líder de los tuits con enlace, con un sólido 28.6% de market share. Le siguen Foursquare (casi el 100% son check-ins en diversos venues); Twitter (cuando enlazo alguna foto o tuit de otra persona, o le envío algún dato a alguien). El cuarto mayor sitio enlazado es YouTube, otra sorpresa para mí.
Veamos ahora mi relación con otras cuentas…
En esta gráfica me llevé varias sorpresas. La primera fue ver a mi exquisita amiga Gitti Hernández como la persona a quién más menciones o respuestas he escrito en mis cuatro años de vida tuitera. En segundo lugar queda Lisselot Díaz, una de las personas que más quiero y admiro en el mundo, una amiga que conocí hace como quince años y que desde entonces siempre ha estado a una llamada o un clic de distancia. Bajando en la lista hay dos amigos que a la vez son amigos entre sí, Alexander Rodríguez y Gibrán Abréu, ambos inmensamente agudos y geniales de leer e interactuar. El quinto puesto es de Amandysha y eso me asombró muchísimo, pues desde hace varios años, ella cortó contacto conmigo (don’t ask) y desde entonces las menciones han sido muy escasas.
Quise comprobarlo con una gráfica y aquí vemos el comportamiento de mis interacciones con las cinco personas que más he compartido. En el 2009, Amandysha fue la tuitera con que más conversé y en el 2010 iba por buen camino hasta que ella decidió mandarme a freír tusas digitales, algo que ocurrió en agosto (probablemente si no hubiera habido corte, habría estado también en el primer o segundo puesto). Lisselot conquistó fácilmente la mayor parte de mi atención en el 2010, pero desde entonces nos hemos apagado cantidad. Lo mismo ocurre con Gibrán, que luego de intercambiar una pila de mensajes, nos dejamos de escribir y hoy, aunque estamos siempre dispuestos a conversar y hacer coro, la verdad es que no hay tanto diálogo.
Con Gitti también se evidencia un fuerte declive desde el 2010 a la fecha. Esta es otra muestra más de que en el 2011 yo me alejé bastante de Twitter por mil razones que no vienen al caso. Sin embargo, Gitti se mantiene como una persona de permanente referencia en mi timeline.
Alexander es el único de los cinco tuiteros que ha venido de menos a más en mi top-5. Con apenas unos 60 tuits en el 2010, he duplicado esa cantidad en el 2012 y lleva ya dos años seguidos siendo la persona con la que más he interactuado en Twitter.
La constante de estas cinco cuentas es que son personas que aportan valor a cualquier diálogo. Les recomiendo que si no siguen alguna de ellas, ahora mismo lo hagan. Vayan, yo los espero aquí sentado tomando café.
¿Por qué pasó este fenómeno de que cuentas como la de Amandysha y Lisselot, que han visto reducir su interacción conmigo, todavía estén en el tope de las cuentas con más interacciones? La respuesta es sencilla: En mis primeros dos años en Twitter apenas tenía un puñado de seguidores y era mucho más fácil seguirle el paso a cada uno. A partir de que fui aumentando consistentemente mi cantidad de seguidores, “caerle atrás” a estas cuentas preferidas se fue tornando cada vez más difícil. Por eso, al día de hoy, aunque interactúo con muchísimas más cuentas, ninguna todavía ha superado a los cinco líderes. De todas formas, es probable que este cuadro cambie pronto en este año, pues las personas del 6to lugar hacia abajo siguen subiendo.
Vamos a los retuits.
Finalmente, las 20 cuentas a las que más retuits les he dado están encabezadas por mi principal hijo digital, Aguiluchos.com. Justo en la mitad, la aguda Madamesaga (LAL, y no digo su nombre porque no le gusta, aunque todo el mundo ya lo sabe) ocupa el segundo puesto. Claudia Chez (esto sí puedes leerlo) queda en el tercer lugar seguido de cerca por Manuel Betances (PulsarBeta). Maya Oviedo, Vielka Guzmán, Abel Acosta, Juan Isidro Acevedo, José Luis Mendoza… la lista completa es de muchísimo valor (incluyendo la de Peter Griffin que es un bufeo). Síganlos también, que ya colé más café.
Aprendizajes
Estas dos limonadas ha sido demasiado extensas, pero a la vez creo que hay muchas cosas interesantes que valía la pena compartir con ustedes, los valientes que se fajan a consumir lo que publico. Me gustaría que se lleven algunos puntos de interés sobre el #TwitterArchive.
Twitter es una herramienta imposible de valorar para muchos de nosotros. Sin embargo, la rapidez con la que avanzan las cosas hace muy complicado darle seguimiento a todo. El #TwitterArchive es una herramienta muy valiosa para poder mantener un ojo en lo que hemos compartido en este medio social. Todo el que tenga cuenta de Twitter, debería procurar su archivo.
Analizar su propio #TwitterArchive debería ser algo de alto interés para todos también. Más allá de la simple curiosidad de saber a qué hora más tuiteamos, estos análisis proveen una visión personalizada de cómo somos y qué hacemos en Internet.
Si tuviera tiempo, crearía un servicio en el que las personas enviaran una parte de su #TwitterArchive para realizar data mining sobre el comportamiento de la gente. Esta sería una empresa muy interesante y podría hacerse con voluntarios, tal como la gente participa en grupos focales y encuestas. Ahí tienen, una #ideamillonaria.
¿Y ustedes, qué piensan de esto?
Excelente Darío. Te voy a mandar mi archivo para que hagas todo eso por mi. Luego me mandas factura. 😉
Genial lo de Claudia Chez.
Eres tan bello y me amas tanto, que con lo poco que tuiteo de hace año y medio para acá, aun estoy de numero 11. Si lo sé soy indispensable en tu vida. Te quiero y te mando un abrazo cacato!