Pour décoder un message chiffré par permutation monoalphabétique (c'est‑à‑dire que chaque lettre de l'alphabet est remplacée par une autre selon une table de correspondance), on peut procéder par analyse des fréquences d'apparition des lettres. Dans la langue française, la lettre E apparaît avec une fréquence de 15 % en moyenne. En analysant les 100 premières lettres d'un message codé, on est amené à supposer que le E est codé par la lettre S. Cependant, il n'y a aucun S dans les 25 lettres suivantes du message ! Cela remet‑il en cause l'hypothèse précédente ?
1.
Justifier que l'expérience aléatoire qui consiste à choisir 25 lettres et à regarder si c'est un E définit un schéma de Bernoulli. Préciser ses paramètres.
2.
Calculer la probabilité qu'il n'y ait aucun E dans un texte de 25 lettres.
3.
On admet que la fréquence de E dans un texte de n lettres appartient à l'intervalle \left[0,15-\frac{1}{\sqrt{n}} \: ; 0,15+\frac{1}{\sqrt{n}}\right] avec 95 % de chances. Que peut‑on en déduire sur la fréquence de E dans un texte de 25 lettres ?
4.
En déduire les inconvénients de cette méthode.
Pour expérimenter une nouvelle forme de littérature s'appuyant sur la contrainte, Georges Perec a écrit un livre de 300 pages sans la lettre E, intitulé La Disparition. Dans son livre sur les codes secrets, Hervé Lehning montre que si ce texte était codé à l'aide d'une substitution monoalphabétique, on pourrait malgré tout le décoder en utilisant l'analyse fréquentielle.