Después de mis primeras experiencias en e¡la minería de textos de la mano de U2 y de Bruce Springsteen, he estado dándole una vuelta de tuerca a los resultados obtenidos. Emilio Cajete sugirió en Facebook que podríamos componer una canción con las palabras más usadas… Debo admitir que componer una canción es algo muy pretencioso para mí. Me conformo con encontrar, en base al análisis de las letras de las canciones, la canción más U2-era. La canción de U2 más representativa desde el punto de vista de la frecuencia de aparición de las palabras. He realizado 5 análisis:
- Para el primero, he tenido en cuenta las 3.496 palabras utilizadas en las letras de las canciones de U2. Las palabras vacías (stopwords) se han excluido del análisis. La primera clasificación está realizada en base a la suma de apariciones de cada una de estas palabras en la letra de cada canción. La segunda clasificación está realizada en base a la cuenta de apariciones de cada una de estas palabras en la letra de cada canción. Si “love” aparece 5 veces en la letra de una canción, en la primera clasificación contará como “5” y en la segunda clasificación como “1”. Aquí los top10:
- Para el segundo, he tenido en cuenta las 100 palabras utilizadas en las letras de las canciones de U2. Las palabras vacías (stopwords) se han excluido del análisis. La primera clasificación está realizada en base a la suma de apariciones de cada una de estas palabras en la letra de cada canción. La segunda clasificación está realizada en base a la cuenta de apariciones de cada una de estas palabras en la letra de cada canción. Si “love” aparece 5 veces en la letra de una canción, en la primera clasificación contará como “5” y en la segunda clasificación como “1”. Aquí los top10:
- Para el tercero, he tenido en cuenta las 40 palabras utilizadas en las letras de las canciones de U2. Las palabras vacías (stopwords) se han excluido del análisis. La primera clasificación está realizada en base a la suma de apariciones de cada una de estas palabras en la letra de cada canción. La segunda clasificación está realizada en base a la cuenta de apariciones de cada una de estas palabras en la letra de cada canción. Si “love” aparece 5 veces en la letra de una canción, en la primera clasificación contará como “5” y en la segunda clasificación como “1”. Aquí los top10:
- Para el cuarto, he tenido en cuenta las 10 palabras utilizadas en las letras de las canciones de U2. Las palabras vacías (stopwords) se han excluido del análisis. La primera clasificación está realizada en base a la suma de apariciones de cada una de estas palabras en la letra de cada canción. La segunda clasificación está realizada en base a la cuenta de apariciones de cada una de estas palabras en la letra de cada canción. Si “love” aparece 5 veces en la letra de una canción, en la primera clasificación contará como “5” y en la segunda clasificación como “1”. Aquí los top10:
- Para el quinto y último, he tenido en cuenta la palabra más utilizada [love] en las letras de las canciones de U2. Las palabras vacías (stopwords) se han excluido del análisis. La primera clasificación está realizada en base a la suma de apariciones de la palabra “love” en la letra de cada canción. La segunda clasificación no tiene sentido para el análisis de una única palabra. Lo que sí he obtenido es el número de canciones que contienen la palabra “love”: 95 de las 211 totales (un 45%). Aquí el top10:
Ninguna canción repite en el primer puesto pero si hay unas que aparecen en más clasificaciones que en otras. El podio se lo llevan:
- Elvis Presley And America: 7 apariciones.
- A Room At The Heartbreak Hotel: 5 apariciones.
- Hallelujah (Here She Comes), The Little Things That Give You Away y The Showman (Little More Better): 4 apariciones.
Me queda pendiente hacerlo con el BOSS.