Gramática

La ruleta de la ¿suerte? (II). English grammar. The Wheel of ¿fortune?

Continuando con el análisis de la ortografía española hace unos días, he realizado un estudio similar sobre el idioma Inglés. Así pues, volvemos a las letras, a las letras y a las palabras. La ortografía del inglés consta de 26 letras: a, b, c, d, e, f, g, h, i, j k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. Con este artículo vamos a descubrir algunas pistas (tips) para triunfar en las versioens inglesas de “La Ruleta de la Suerte” (The Wheel of Fortune) y la más casera de el “Ahorcado” (The Hangman).
Tanto en “La Ruleta” como en el “ahorcado” tenemos que adivinar las letras que forman parte de las palabras para, finalmente, adivinar la palabra o frase escondida. Podemos lanzarnos a lo loco o podemos tirar de datos para mejorar nuestra “suerte”. Para este estudio me he descargado un lemario de infochimps.
El lemario tiene 370.076 palabras y, si las agrupamos por el número de caracteres que tiene cada una, obtenemos este gráfico:

Sin demasiado análisis, ya vemos que hay algunas letras con más posibilidades que otras:

Aquí nos encontramos la primera gran diferencia entre el español y el inglés. En la lengua de Cervantes, la “a” era la gran dominadora mientras que en la de Shakespeare, es la “e” la que ocupa la primera posición.
La “e” es una apuesta segura para el ahorcado. En la Ruleta de la Suerte, como las vocales se compran, las apuestas más segura sería la “n” o la “s“. en el Castellano este papel lo jugaba la “r”. Las 5 vocales se llevan el 39% del pastel (en el español era el 46%). Las vocales tienen menos peso en el inglés que en el español.
En las últimas posiciones también vemos cambios. Mientras que en el español, el farolillo rojo se lo llevaba la “w“, en el inglés se lo lleva la “j
Podemos afinar un poco más. En ambos juegos, contamos con una variable muy importante, el número de caracteres de la(s) palabra(s) a adivinar. Haciendo un análisis un poco más detallado, podemos mejorar nuestras posibilidades de éxito.

En términos relativos:

Como veis, si conocemos a priori el tamaño de la palabra a adivinar, podemos aumentar nuestras posibilidades de éxito.

Las vocales se cuelan en muchos podios. Si prescindimos de las vocales (muy útil para La Ruleta de la Suerte), estas son las consonantes que deberemos elegir para maximizar nuestras ganancias.

La Ruleta de la ¿Suerte? Algo de suerte está claro que hay pero podemos hacer que esa componente se minimice estudiando un poco el vocabulario español. Así limitaremos la suerte a no caer en “quiebra” y/o en “pierde turno”.
La “s“, la “r” y la “n” son las apuestas más seguras. ¿Podríamos afinar un poco más? Ya lo creo que sí, pero eso lo dejo para otro artículo.
English version of the article.
#data #datascience #datascientist #textmining #mineriadetextos #rstudio #bigdata #letras #palabras #words #ruletadelasuerte #thewheeloffortune #hangman #ahorcado #dataanalytics

One Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *