El tema de

¿Cuándo apareció la expresión "el tema de"? "El tema de la seguridad", "el tema de la paz", "el tema de la mobivilidad", "el tema de las chuzadas", "el tema de ...", y "el tema de ...". ¿Soy acaso el único que ha notado cómo esta expresión, muchas veces innecesaria, aparece cada vez más frecuentemente en la prensa y, mucho más, en la radio o en la televisión?. Yo recuerdo que hace unos 10 o 15 años no era tan común, pero no podía identificar a partir de qué momento se había vuelto tan popular. Eso traté de averiguar y estos son los resultados.

/labs/el-tema-de/sample.png

Fragmento de la gráfica de la frecuencia de la expresión "el tema de" en los artículos de la revista Semana.

Para saber si la expresión se había vuelto más frecuente en los últimos años analicé el archivo de la revista Semana, que incluye las ediciones de la revista desde 1982 y los artículos que han publicado en su sitio web. Esta fue la colección de documentos digitalizados que me pareció más fácil de analizar y que se extiende durante un periodo de tiempo más largo. También creo que es adecuado utilizar estos artículos pues tienen diferentes estilos e incluyen varios formatos, como columnas, reportajes y entrevistas. La muestra que tomé tiene 95.998 artículos, publicados desde junio de 1982 hasta julio de 2010.

El análisis de los documentos lo hice de la siguiente forma. Primero separé el contenido del artículo del resto de la página web, removiendo los menús, la publicidad y otros elementos no relevantes; al final de este proceso extraje las partes de los documentos que utilizaría en el análisis (título, fecha de publicación, sección, antetítulo, nombre del autor y el texto del artículo). Luego, busqué dentro de ellos las secuencias de palabras "el tema de", "el tema del", "el tema de la", "el tema de las" y "el tema de los", teniendo en cuenta que se encontraran dentro de la misma frase e ignorando diferencias en mayúsculas o minúsculas. En cada secuencia incluí la palabra siguiente a la expresión buscada, por ejemplo "el tema de la paz" o "el tema del despeje". Por último, conté los resultados agrupándolos por secuencia de palabras y mes de publicación del artículo.

En los resultados están todas las secuencias de palabras que comienzan por "el tema de", incluyendo tanto la muletilla ("el tema de las chuzadas"), como el uso normal de la expresión ("el tema del libro" o "el tema de su presentación"). Esto permite comparar cuál de los dos tipos de uso es más frecuente, como se verá más adelante.

Para comparar el uso de la expresión calculé la frecuencia de aparición por número de artículos publicados en un mes. Esto es necesario porque la cantidad de artículos publicados ha variado a lo largo del tiempo, la revista pasó de tener cerca de 100 artículos mensuales en la década de los 80 a más de 400 mensuales desde los últimos 5 años. La siguiente gráfica muestra la frecuencia de aparición por mes de la expresión "el tema de" en los documentos analizados.

/labs/el-tema-de/freq-relative-month.png

No hay un momento en el que la expresión comenzó a ser mucho más popular, como yo pensaba inicialmente. Tampoco hay una tendencia sostenida, sino que hay variaciones más o menos destacadas en años como en 1999 y 2005, aunque desde 1996 sí ha incrementado. El promedio anual permite ver esto más claramente:

/labs/el-tema-de/freq-relative-year.png

No puedo concluir que la expresión se hizo más popular en los últimos años, sino que ha sido utilizada regularmente y con más frecuencia casos especiales. Para afirmar esto con más certeza haría falta analizar otras colecciones de documentos, si es posible incluyendo transcripciones de programas de televisión o de radio. También sería interesante comparar los resultados con datos de diferentes regiones de Colombia o de otros países.

Por otro lado, analizar las expresiones más frecuentes fue más interesante, pues estas dan cuenta de los eventos más importantes en el país, como la paz, la seguridad y los derechos humanos. La siguiente tabla muestra las 10 expresiones más frecuentes. En ella se ve que 8 corresponden a la muletilla cuyo origen estaba tratando de encontrar y sólo 2 ("el tema de su" y "el tema de fondo") son casos del uso normal.

Expresión Cantidad
el tema de la paz 141
el tema de la seguridad 97
el tema de los derechos 78
el tema de la extradición 75
el tema de la reelección 55
el tema del narcotráfico 52
el tema de su 42
el tema de fondo 41
el tema de la violencia 41
el tema del intercambio 40

Para divertirme un poco hice varias gráficas en donde se pueden ver los temas más frecuentes durante los años, como esta:

/labs/el-tema-de/wave-top15.small.png

Hay tres versiones diferentes para descargar:

  • Temas más frecuentes por año (PNG: 517 kB, PDF: 32 kB)
  • Temas más frecuentes por mes (PNG: 1.3 MB, PDF: 156 kB)
  • Temas más frecuentes por artículos publicados cada mes (PNG: 1.4 MB, PDF : 145 kB)

El código del programa para anlizar los resultados y los datos, están disponibles en mi repositorio de bitbucket.org. Las gráficas fueron creadas usando ggplot2 y graphication.

Los documentos de la Embajada de EE.UU. en Bogotá publicados por Wikileaks

Wikileaks comenzó a publicar documentos de las embajadas de Estados Unidos en todo el mundo. Se trata de más de 250.000 cables provenientes de embajadas y misiones diplomáticas en diversos países; dentro de los cuales 2416 documentos fueron enviados desde la Embajada de EE.UU. en Bogotá.

El contenido de todos los documentos no ha sido revelado hasta ahora, pero The Guardian ya publicó un listado que incluye la fecha y el lugar de publicación y los temas a los que se refieren, pero omitiendo el texto completo del documento.

Yo descargué ese listado y comencé a analizarlo. Estos son los primeros resultados.

/labs/cablegate/cablegate-bogota.png

De los 2416 documentos de la Embajada de EE.UU. en Bogotá, 2373 (98%) se publicaron entre el 2004 y el 2010. Esta proporción es similar a la de todos los documentos publicados dentro de ese periodo; en esos seis años está el 95% de la filtración.

Los documentos se refieren a 272 temas diferentes. Los 10 temas más frecuentes son asuntos internos, externos, terrorismo y derechos humanos. La siguiente tabla muestra estos 10 temas, incluyendo para cada uno la abreviatura usada dentro del listado, su descripción de acuerdo al glosario elaborado por The Guardian y la cantidad de documentos que lo mencionan.

Tema Descripción Cantidad
CO Colombia 2314
PGOV Asuntos internos gubernamentales 1574
PREL Relaciones políticas externas 1327
PTER Terroristas y terrorismo 1164
PHUM Derechos humanos 848
KJUS (Por identificar) 564
ECON Condiciones económicas 498
SNAR (Por identificar) 437
PINR Inteligencia 315
ETRD Comercio exterior 283

Hay otros temas que no son tan frecuentes pero que son más interesantes porque se trata de asuntos internos de Colombia. El primero de ellos es Demobilization (Desmovilización), que aparece en 51 documentos entre febrero de 2004 y noviembre de 2005. Los temas AUC, FARC y ELN están en 44, 39 y 14 documentos, respectivamente. El tema Massacre (Masacre) se menciona en 11 documentos, todos del año 2005, mientras que Hostages (Rehenes) está en 10 documentos de 2004 y 2005. Sólo 4 documentos se refieren al tema InternallyDisplacedPeople (Población desplazada dentro del país). Finalmente, hay dos temas relacionados con las elecciones (Elections y 2006Elections) que son referidos por 12 documentos en total.

En cuanto a los países señalados como temas de los documentos, los más mencionados son Venezuela, Ecuador, Francia, España y Suiza, con 64, 51, 39, 25 y 22 documentos que se refieren a ellos, respectivamente. Las menciones de Venezuela pueden ser más, pues hay 59 documentos que se refieren al tema VZ, que no aparece en el glosario de países pero que puede ser una abreviatura adicional a VE, que se usa tradicionalmente para ese país.

Voy a continuar trabajando en el análisis y la presentación de los datos, mientras espero que publiquen todos documentos completos, incluyendo sus textos. Los datos de este primer análisis se pueden descargar como una hoja de cálculo en formato HTML y CSV.


- Ramírez: Es el periodismo. Es el periodismo, que inventa escándalos para difamarnos.
- Murena: Así es, doctor. Y lo que es peor, aliados con campañas de desprestigio fomentadas en el exterior.
- Maestro Mangiacaprini: ¡En Noruega!
La Comisión (Himnovaciones), Les Luthiers

Visualizando Les Luthiers

Visualizando Les Luthiers es un proyecto que inicié a comienzos de este año para mostrar con infografías las obras de Les Luthiers. Hice el prototipo de esta gráfica para mostrar las obras que han interpretado en sus espectáculos, señalando las obras nuevas y las que ya se habían estrenado antes en otro espectáculo:

/labs/vis/ferrocaliope/sample.png

La idea surgió a partir de Charting the Beatles, un proyecto colaborativo para estudiar la carrera de Los Beatles a través de diagramas e infografías. Quise tratar de hacer algo similar analizando las letras, por ejemplo mencionando las palabras o temas frecuentes, los géneros musicales de las obras y los personajes. Para esto utilicé los datos que han recopilado los autores de lesluthiers.org, convirtiéndolos a un formato que pudiera utilizar desde el programa que crea la gráfica. Inicialmente quería también publicarlos en Freebase, pero tuve problemas importándolos y no terminé de hacerlo.

El prototipo está lejos de ser algo terminado, pero lo publico aquí pues por ahora no creo que vaya a continuar trabajando en él.

― Es inútil.
― Sí, pero es el capitán.
Las Majas del Bergantín (Zarzuela náutica), estrenada en 1981.

Recuente USTED los votos

En la primera vuelta de las elecciones presidenciales de Colombia de 2010 hubo rumores de fraude. A los pocos días se conocerse los resultados, varias personas publicaron casos en donde los resultados del preconteo de la Registraduría no coincidían con los formularios diligenciados por los jurados en cada mesa de votación. Por ejemplo, en algunos se le habían agregado o quitado votos a un candidato, otros formularios tenían tachones, casillas en blanco o no habían sido firmado por los jurados [1]. En ese momento era difícil saber si estas inconsistencias podrían haber afectado los resultados de las elecciones.

Por eso, una semana después, hice garcete.cavorite.com, en donde los visitantes revisaron más de 15 mil formularios durante los primeros 30 días de funcionamiento. Estos son los resultados de esa revisión.

Mi Emperador

"El era mi Emperador" me dijo una señora señalando la portada del libro que yo estaba leyendo en el tranvía. El libro era El Emperador y en la portada aparecía Haile Selassie I, el último emperador de Etiopía.

Yo estaba a unas diez páginas de terminar el libro. Había comenzado a leer la descripción de la corte desde adentro y ya había llegado hasta la caída del imperio, en donde se contaba cómo habían sido los últimos días del emperador, cuando estaba en el palacio sólo con uno de sus súbditos.

Hasta ese momento mi imagen de H. S. era la de una persona autoritaria, que se mantenía en el poder mediante la corrupción y vivía aislado de lo que pasaba en el país. El pasaje del libro en el que esto quedaba más claro para mí era aquel en el que el emperador alimentaba con carne los leones que tenía en el jardín del palacio, mientras que en las calles de Abbis Adda las personas se estaban muriendo de hambre y al norte del país había una de las hambrunas más severas de los últimos años.

Seguí leyendo lo que quedaba de la página y cuando llegamos a la siguiente parada del tranvía no pude aguantarme la curiosidad y me apresuré a preguntarle a la señora cuál era su opinión del emperador. Desde su asiento ella me dijo con admiración que H.S. había estado adelantado a su tiempo y que había sido un gran gobernante.

El tranvía se estaba llenando y adelante había un grupo de personas se subieron hablando muy fuerte. En medio del ruido, yo no salía de mi sorpresa y no podía pensar bien qué decir.

"Pero él estuvo rodeado de personas corruptas", continuó. "La educación. Eso era muy importante para el", dijo mientras tomaba el libro y lo hojeaba. "Es un gran libro", concluyó y me lo devolvió.

Quedé más confundido que antes y no supe que decir. No podía confrontarla viendo que hablaba de su emperador de esa forma. No entendía cómo ella podía sentir tanta admiración y respeto por la misma persona que en el libro era descrita como alguien supremamente cruel y corrupto. Peor aún, no podía creer que a ella le gustara el mismo libro.

El tranvía alcanzó a recorrer unas tres paradas mientras yo trataba de pensar qué decirle. Ella seguía sentada leyendo, pero yo ya estaba cerca de la parada en la que tenía que bajar. No se me ocurría nada. No recuerdo si me despedí, pero me bajé con la frustración de haber conocido a un personaje real de una historia que unos minutos atrás me parecía de ficción y no haber sido capaz de preguntarle nada más.