Boggle

Introduction 

Si vous être un peu âgé vous connaissez peut-être le Boggle, un jeu qui a eu un certain succès dans les années 90. Il s'agit d'un jeu de lettres, composé de 16 dés à 6 faces. Sur chacune des faces se trouve une lettre et le but est, après avoir mélangé les lettres aléatoirement, de trouver un maximum de mots de trois lettres ou plus en respectant 2 règles : le mot doit être constitué de lettres contiguës les unes des autres (il faut donc se "déplacer" dans la grille de lettre en lettre, dans n'importe quel sens) et chaque lettre ne peut être utilisée qu'une seule fois dans le mot.

Une fois le temps écoulé, chaque joueur compte ses points en fonction des mots trouvés et de leur longueur. Les mots de 3 ou 4 lettres rapportent 1 point, les mots de 5 lettres rapportent 2 points, ceux de 6 lettres rapportent 3 points, ceux de 7 lettres rapportent 5 points et les mots de 8 lettres ou plus rapportent 11 points. Évidemment il existe des variantes dans les règles et dans la manière de compter les points.

 

Notre étude a pour but de lister les faits intéressants concernant les résultats qu'il est possible d'obtenir. Pour ce faire, j'ai crée du code permettant de "simuler" des tirages et de lister tous les mots possibles (en accord avec un dictionnaire de référence - ici l'officiel du Scrabble dans sa version 5) et de compter le nombre de points qu'il est possible d'obtenir pour chaque grille. Les résultats qui sont présentés par la suite sont donc issus de la simulation aléatoire d'un million de grilles. Cela peut sembler énorme mais ne représente en fait qu'une petite partie du nombre total de configurations possibles. En effet il en existe 16! x 6^16 combinaisons possibles (même si certaines configurations sont redondantes et réduisent le nombre "réel" de grilles différentes). 

A titre de comparaison (débile) : Il y a deux fois moins de gouttes d'eau dans les océans que de combinaisons possibles (à raison de 20 000 gouttes d'eau par litre et d'une estimation de 1.37 milliards de km3 d'eau dans les océans). C'est fou non?

 Bref, revenons à nos moutons.

Exemple 

Voici un exemple de grille que l'on peut obtenir.

Il existe de nombreux mots que l'on peux trouver, par exemple : "SALIE", ce qui vous rapporte 2 points.

Distribution des scores

Une fois les simulations réalisées il est intéressant de voir comment se répartit le nombre de points que l'on peut obtenir.

Il existe une grande variabilité dans les scores obtenus en fonction des grilles mais la majorité du temps vous pouvez espérer obtenir entre 100 et 270 points. Cependant on constate une queue de distribution qui s'étend trèèès loin et il existe ainsi des grilles (très rares certes) à plus de 2000 points. Dans les simulations réalisées, le maximum obtenu fut de 2525 points mais certaines personnes ont trouvé des grilles à 3000 points. Je rappelle que nous n'avons testé qu'un minuscule échantillon de toutes les grilles existantes. Pour reprendre l'analogie des gouttes d'eau dans l’océan qui représenteraient l'ensemble des combinaisons de grilles possibles, notre million de grille simulées représente un échantillon de 250 litres d'eau.

Le mot le plus long

D'une manière similaire, nous pouvons regarder quel est la longueur maximale des mots que l'on peut trouver. Sachant qu'il y a 16 dés dans la grille et qu'il n'y a pas le droit d'utiliser deux fois le même dé, la longueur maximale théorique est donc limitée à 16. De plus comme les mots de moins de 3 lettres ne rapportent pas de points la longueur minimale est de 3.

Dans environ 2/3 des cas, le mot le plus long que vous pourrez trouver sera composé de 7 ou 8 lettres et dans 94% des cas il fera entre 6 et 9 lettres. Dans certains cas très rares il a été possible de trouver des mots allant jusqu’à 13 lettres ! Mais en réalité il est même possible de trouver des mots de 16 lettres.

Il est a noter aussi, que dans 87 grilles (sur 1 million) il a été impossible de trouver de mots de 3 lettres ou plus. Ce sont donc des grilles qui rapportent 0 point. Après vérification, ces grilles à 0 point sont toujours composées uniquement de consonnes (et donc forcément c'est plus compliqué)

L'importance du nombre de E 

Connaissant la langue française et la répartition des lettres, on peut avoir l'intuition qu'une grille contenant des E permettra surement de trouver plus de mots (car le E est une lettre très souvent utilisée). Pour cela, il suffit de compter le nombre de E dans chacune de nos 1 million de grilles et de voir la répartition des scores obtenus.


Les constats :

Dans le cas le plus fréquent, 29% des cas, votre grille contiendra 2 E et vous pouvez obtenir, dans 80% des parties, des scores entre 80 et 420 points.

Dans 24% des cas, la grille ne contiendra qu'un E et vos scores s’étendront plutôt entre 60 et 340 points (c'est donc un peu plus dur avec un seul E).

Dans 21% des cas, vous aurez 3 E et comme c'est le cas le plus favorable, les scores s'étendront la moitié du temps dans une fourchette allant de 80 à 450 points. 

On constate après que dans des cas plus rares (par exemple 5 E), les scores diminuent (moins de 360 points la plupart du temps) et dans le cas à 0 E, il sera assez dur de marquer plus de 240 points mais il est possible de se débrouiller avec les autres voyelles quand même.

Il existe des grilles contenant encore plus de E (le maximum théorique est une grille avec 12 E mais je n'en ai pas rencontré dans mes simulations). Dans les simulations réalisées, il y a eu 2 grilles avec 10 E et à chaque fois le score maximal était inférieur à 40 points. Dans la trentaine de grille avec 9 E, le meilleur score obtenu fut 102 points mais la moyenne des scores de ces grilles était plutôt de 40 points.

Les mots les plus fréquents

A partir de nos résultats il est possible de voir quels mots apparaissent le plus régulièrement dans les grilles. 

Les mots de 7 lettres les plus fréquents sont les suivant :

RangMotNombre d'occurences
1RELATEE2588
2RESALEE2507
3REALESE2233
4ALIENEE2125
5ENRENAI2067
6ALESIEN2019
7REALESA2018
8SATANEE2013
9RATELEE2003
10ETALEES1992

 Les mots de 8 lettres les plus fréquents sont :

RangMotNombre d'occurences
1REALESEE672
2REALESAI575
3ALTERNEE478
4ETALERAI455
5ANEANTIE454
6RETENTEE450
7RELATEES449
8RONERAIE448
9ALIENEES442
10ENCESAI440

Les meilleurs plateaux

Parmi le million de grilles simulées, 6 grilles contiennent des mots de 13 lettres. En voici un exemple avec le mot BICENTENAIRES, dans une grille qui rapporte (seulement) 610 points.

Il existe des grilles qui rapportent bien plus de points, non pas parce qu'il y a beaucoup de mots longs, mais plutôt parce qu'il y a énormément de mots différents. La grille suivante a rapporté 2525 points. C'est le meilleur total obtenu dans nos simulations et elle est composée de 691 mots dont le plus long fait 11 lettres : RABOUTERAIS

Je rappelle que la règle du Boggle stipule que chaque joueur dispose de 3 minutes pour trouver un maximum de mots. Ne le vivez donc pas mal si vous n'arrivez pas à trouver les 691 mots en 3 minutes (ça fait a peu près 4 mots à trouver chaque secondes)

La meilleure grille actuelle que j'ai trouvé sur internet rapporte 3086 points selon mon dictionnaire (les résultats varient toujours un peu selon les dictionnaires utilisés) et comporte 680 mots dont 4 de 12 lettres : INTERESSASSE, PETASSERIONS (du verbe occitan "petasser" qui signifie raccommoder),  SINTERISASSE (imparfait du subjonctif du verbe  sinteriser qui signifie "Agglomérer des poudres en chauffant pour produire un objet solide") et ASSISTERIONS (là ça va je connais)

Il est évidemment possible de trouver des grilles permettant de faire des mots encore plus longs (jusqu’à 16 lettres) il est en revanche plus compliqué de trouver quelle grille permettrait de marquer le maximum de points.