Analyse fréquentielle à l’aide du tableur
Activité produite dans le cadre des travaux académiques mutualisés 2016-2017.
Auteur : Francois Delannoy
Présentation de l’activité
Des informations cryptées transitent tous les jours par le biais des ordinateurs (cartes bancaire, messages électroniques, codes de confidentialité …)
L’histoire de ces méthodes de cryptage découlent d’une longue évolution, qui a débuté par le décryptage de messages codés.
Cette activité vise à comprendre comment décoder un message par le biais de l’analyse des fréquences.
Cette activité se déroule sur deux séances : l’une ou les élèves sont seuls et ont à disposition un ordinateur et l’autre au cours de laquelle ils sont regroupés en binômes.
Public
Cycle 4
Séance préalable
Chapitre Statistiques : moyenne et fréquences
Objectifs
Cette activité a pour but de faire découvrir les techniques de décryptage d’un texte par le biais de l’analyse fréquentielle.
Déroulement
-
format PDF - 766.2 kio
première séance :
PARTIE I : étude d’un exemple.
- Les élèves dénombrent les apparitions d’une lettre de l’alphabet dans un paragraphe du règlement intérieur de leur carnet de liaison.
- Puis ils ont à déterminer une estimation du nombre total de lettres de ce paragraphe afin de déduire la fréquence d’apparition de leur lettre.
- Traitement de texte :
-
format OpenDocument Spreadsheet - 15 kio
Grâce au fichier tableur fourni, les élèves ont à recopier le paragraphe en question dans une cellule qui leur permettra d’obtenir automatiquement le nombre d’apparitions de chaque lettre.
Les élèves notent leurs observations.
- Les élèves ont ensuite à compléter leur fichier afin d’obtenir le nombre total de lettres du paragraphe ainsi que les fréquences de chaque lettre.
PARTIE II : étude d’ouvrages de référence. Du statut de la lettre « e ».
- Après avoir observé que la lettre « e » était la plus fréquemment utilisée, les élèves ont a comparer cette fréquence sur plusieurs ouvrages de référence.
Ceci afin d’observer que cette fréquence est stable.
Deuxième séance :
Les élèves sont alors réunis en petits groupes (en binômes par exemple)
PARTIE III : Fréquences de référence des lettres de l’alphabet.
1) L’ouvrage de référence est ici l’encyclopédie en ligne Wikipedia.
Les élèves ont à déterminer sur tableur la fréquence d’apparition de chaque lettre dans l’encyclopédie Wikipedia.
PARTIE IV : Décryptage d’un message codé.
Les élèves par groupe ont à déterminer des stratégies pour décrypter le message qui leur est proposé.
L’enseignant peut donner certaines pistes de réflexion :
- Quelles sont les fréquences d’apparition de chaque lettre du message crypté ?
- On pourra utiliser l’outil d’analyse des fréquences disponible sur le fichier tableur (voir PARTIE I).
- Quels sont les mots de deux ou trois lettres les plus fréquents de la langue française ?
- Quelles sont les lettres de la langue française qui peuvent être doublées ?
- Quelles lettres peuvent être suivies ou précédées d’une apostrophe ?
- Comment peut-on identifier les pluriels ?
Analyse du texte la disparition de Georges Perec pour les élèves ayant de l’avance.
Prolongement
- Découverte d’autres techniques de codage, comme le chiffrement de César :
Exercice :
Le codage d’un texte selon le chiffre de César correspond au remplacement de chaque lettre d’un texte par une autre située n places plus loin dans l’alphabet.
Par exemple, pour le chiffre de César n=4, le A est remplacé par E, le B par le F, le C par le G etc.
1) Code ton prénom avec le chiffre de César n=2.
2) Décode le texte situé dans les bulles. Il est codé avec le chiffre de césar n=10.
Documents utiles :
-
format PDF - 766.2 kio
-
format OpenDocument Spreadsheet - 15 kio
-
format PDF - 262.3 kio