Acabo de liberar datarisas, el portal de datos del humor chileno que construí en conjunto con mi amigo Alfonso.
Se alimenta de una base de datos con 3.509 chistes contados sobre el escenario del Festival de Viña del Mar desde 1960 hasta la fecha, extraídos de transcripciones de 128 rutinas disponibles en YouTube.
La transcripción y extracción de los chistes fueron automatizadas 100% usando IA. Ningún humano ha editado una sola coma, pero espero mejorar los datos pronto. Si te interesa conocer cómo se realiza el proceso, puedes revisar el código y los datos acá.
Si te interesa entender bien como funciona, te recomiendo leer este hilo que publiqué en Twitter.
Algunos resultados de analizar los datos
Acá una nube con las palabras más frecuentes entre las más de 230.000 que se han usado para contar chistes sobre el escenario del Festival de Viña.
Aquí un gráfico que muestra la edad que tenía cada comediante al momento de presentarse en el escenario del Festival de Viña. Se puede apreciar una tendencia hacia comediantes más jóvenes comenzando en la década de 2010, ¿quizás esto se deba al efecto del stand-up comedy?
Y acá un conteo acumulativo de cuántas veces un hombre o una mujer se han subido a hacer humor en el escenario del Festival. Pone en evidencia lo importante que fue Natalia Valdebenito quien terminó con más de una década de ausencia del humor femenino en la Quinta Vergara.
Por supuesto puedes usar http://datarisas.cl para realizar la búsqueda que quieras y revivir los momentos más relevantes de la historia del humor en nuestro país. Te invito a bucear en los datos y espero te entregue más de alguna carcajada.