Consignes

Le rendu de TP se fera uniquement à travers l'interface web TPLab. Vous devrez fournir un unique fichier prenom-nom.c contenant votre programme.

Attention, le seul fait que votre programme fonctionne ne suffit pas pour avoir une bonne note. Les points suivants seront pris en compte :

  1. l'architecture de votre programme (code découpé en fonctions etc.),

  2. la lisibilité de votre programme (choix pertinent pour les noms de variables etc.),

  3. la présence de commentaires aux endroits appropriés,

  4. la présence de documentation pour vos fonctions.

Attention, les points suivants ne rapportent rien, mais ne pas les respecter pourra retrancher jusqu'à 10 points sur la note finale :

demander a n'utiliser que DEBUG pour les messages de debug

demander a afficher la progression: no d'octet de la clé, symbole pour chaque vecteur faible, (no de l'essai)

ajouter des arguments pour tester :

Liens utiles

1. Chiffrement avec RC4

« RC4 » peut-être vu comme un générateur pseudo-aléatoire qui permet de chiffrer un flot de données sur le modèle du « bloc-notes à usage unique » : chaque octet du flot de données est combiné (avec un XOR) avec l'octet correspondant de RC4. On ne connait pas, à ce jours, d'attaque générale pour RC4. (Voir [https://en.wikipedia.org/wiki/RC4#Security] pour des détails sur d'autres attaques.)

RC4 comporte deux phases :

  1. initialisation à partir d'une clé de taille 0 ≤ t ≤ 256 octets (le "key scheduling algorithm"),

  2. génération d'octets aléatoires (le "pseudo random generator algorithm").

En pseudo C, si on note cle la clé, et t sa taille :

/* KSA: Key Scheduling Algorithm */
/* L'état est constitué des variables P (tableau de 256 octets), index_i et index_j (entiers). */
  for(i = 0; i < 256; i++)
    P[i] = i;

  j = 0;
  for(i = 0; i < 256; i++) {
    j = (j + P[i] + cle[i % t])  %  256;
    P[i]  <->  P[j];    /* échange */
  }
  index_i = 0;
  index_j = 0;

et

/* PRGA: Pseudo Random Generator Algorithm */
  index_i = (index_i + 1)  %  256;
  index_j = (index_j + P[index_i])  %  256;
  P[index_i]  <->  P[index_j];  /* échange */
  octet_aleatoire = P[ (P[index_i] + P[index_j])  %  256];

Le PRGA est exécuté autant de fois qu'il faut d'octets aléatoire...

Programmez une fonction

void code_RC4_drop(byte *cle, int taille_cle, char *message, int n)

qui affiche les octets, en hexadécimal (format %02X pour printf) et sur la sortie standard, du chiffrement de la chaine message avec la clé cle.

L'argument n sera le nombre d'octets initiaux non utilisés lors de la génération. (Autrement dit, on attend n octets générés avant de commencer à chiffrer.) On appelle parfois ce générateur RC4-drop[n].

estimation du temps : 30 minutes

  1. Le type byte est défini par

    typedef unsigned char byte;
    

    pour définir un type pour les octets. Pour convertir explicitement une valeur c de type char en valeur de type byte, il faut faire un "cast" : (byte) c.

  2. message et cle sont des chaines de caractères. Pour obtenir leur taille, vous devez utiliser la fonction strlen (après un #include <string.h>).

  3. Ma fonction principale est

    int main(int argc, char *argv[]) {
      if (argc != 4) {
        printf("RC4-drop[n], utilisation : %s cle message n\n", argv[0]);
        exit(-1);
      }
      code_RC4_drop(argv[1], strlen(argv[1]), argv[2], atoi(argv[3]));
      return 0;
    }
    

    Elle permet d'appeler la fonction code_RC4_drop directement à partir de la ligne de commande :

    $ ./rc4_drop-n cle message 17
    La clé est "cle" et le message clair est "message"
    Les 17 premières étapes seront ignorées.
    Le code obtenu est :
      484EB4A859834E
  4. Pour tester : vous pouvez utiliser le tableau suivant. L'argument K correspond à la colonne "clé", l'argument M à la colonne "texte clair" et l'argument n prend la valeur 0. Le résultat codé doit être égal à la colonne "texte chiffré".

    clé octets générés texte clair texte chiffré
    Key EB9F7781B734CA72A719... Plaintext BBF316E8D940AF0AD3
    Wiki 6044DB6D41B7... pedia 1021BF0420
    Secret 04D46B053CA87B59... Attack at dawn 45A01F645FC35B383552544B9BF5

2. WEP et RC4

Pour récupérer l'archive contenant les fichiers pour la suite du TP, remplacez tp3.html dans l'url du TP par TP-WEP/tp3-XXXXXXXXXXXXXX.tar, où XXXXXXXXXXXXXX est le codage RC4 de "info607" en utilisant la clé "WEP" et en jetant les 1234 premiers octets du générateur pseudo-aléatoire. (Argument n à 1234 donc.) Attention, les chiffres hexadécimaux sont en majuscules (printf("%02X",o)).

L'archive du TP contient un répertoire info607-TP3 qui contient les fichiers :

Introduction

Le WEP ("Wired Equivalent Privacy") chiffre chaque paquet en utilisant deux clés :

  1. la clé WEP, sur 40 ou 104 bits, càd sur 5 ou 13 octets,

  2. une "clé" temporaire, ou vecteur d'initialisation sur 24 bits, càd sur 3 octets.

Chaque paquet est codé avec RC4 en utilisant la concaténation "vecteur d'initialisation @ clé WEP" (sur 8 ou 16 octets donc) comme clé. Le vecteur d'initialisation est envoyé en clair avec le paquet chiffré.

Pour décoder, on récupère le vecteur d'initialisation, concatène la clé WEP derrière et décode avec RC4.

De cette manière, on ne peut décoder que si on possède la clé WEP, et on utilise quand même des clés (en général) différentes pour chaque paquet. (C'est important, car sinon, il suffirait d'un paquet décodé pour retrouver le début de la suite pseudo-aléatoire, et donc de pouvoir décoder tous les paquets de taille inférieure.)

2.1. Générateur de paquets WEP

Pour éviter d'avoir à récupérer des paquets réseaux, nous allons générer l'information nécessaire pour l'attaque (et seulement cette information) avec un programme spécifique (fourni). Ce programme génèrera des suites constituées du premier octets RC4 ainsi que le vecteur d'initialisation utilisé. Ces informations sont disponibles dans chaque WEP. (Voir plus haut.) Notez que l'attaque n'a besoin que du premier octet généré par RC4, et jamais des octets suivants.

La clé WEP utilisée pourra être choisie au lancement du générateur, ou bien être tirée aléatoirement.

Ce code est contenu dans le fichier generate_WEP.c, qui est compilé automatiquement par le fichier Makefile fourni.

$ make
gcc -Wall -Wextra -pedantic -std=gnu99  -O3 -Wno-unused-variable generate_WEP.c -o generate
...

Pour l'utiliser, les options sont les suivantes :

$ ./generate -h

Usage : ./generate [options]

  --key_size=..., -l ...
      taille en octets de la clé WEP aléatoire (défaut : 13)
  --IV_size=..., -i ...
      taille en octets des vecteurs d'initialisation (défaut : 3)
  --key="...", -K "..."
      utilise la clé donnée en argument sous la forme
      ".. .. .. .." (en hexadécimal)
  --easy
      utilise les vecteurs d'initialisation (n+3, 255, ...)
      (implique une taille d'IV de 3)
  --tube=...
      spécifie le nom du tube à utiliser (défaut: data_WEP)
  --increment, -I
      les vecteurs d'initialisations sont simplement incrémentés
  --help, -h
      affiche ce message

Lorsque le générateur est lancé, il est possible de lui demander d'afficher la clé WEP qu'il utilise en lui envoyant le signal SIGUSR1. La ligne de commande correspondante est affiché par le générateur au lancement.

Format des données générées

Le programme generate crée un "tube" (fichier spécial) appelé data_WEP et le remplit avec des paquets d'octets. Chaque paquet est constitué de plusieurs parties :

  1. les octets du vecteur d'initialisation (il y en a IV_size),

  2. le premier octet généré par RC4 avec ce vecteur d'initialisation et la clé WEP cherchée (il y en a seulement un),

  3. un octet 0x00 pour marquer la fin du paquet. Votre programme devra essayer de retrouver la clé en récupérant des paquets d'octets dans ce tube.

La fonction principale du fichier lucien_tartempion.c ouvre ce tube avec l'appel système open et stocke le descripteur de fichier correspondant dans une variable globale tube_fd. Vous pouvez donc y lire des données avec l'appel système read. Vous pouvez consulter la page de manuel (man 2 read) pour l'utilisation de cet appel système.

Pour pouvoir utiliser les paquets générés et stockés dans le tube il est impératif que le générateur soit en cours d'exécution. Le plus simple est de le lancer depuis un autre terminal.

Vous pouvez stopper le générateur avec "Control-c" (dans le shell qui a permis de le lancer), ou bien avec

$ killall generate

depuis n'importe quel autre shell.

Attention, il ne faut avoir qu'un seul générateur en exécution à un instant donné.

Écrivez la fonction

int get_data(byte *IV, byte *b_rc4);

Cette fonction devra

estimation du temps : 15 minutes

Vous pouvez tester la fonction get_data en ajoutant des instructions dans la fonction perform_tests de votre fichier. Cette fonction est automatiquement appelée lorsque vous donnez l'option --test sur la ligne de commande. Par exemple :

$ killall generate
$ ./generate --increment --key="01 02 03 04 05 06 07 08 09 0a 0b 0c 0d"
Pour afficher la clé, vous pouvez utiliser la commande
   $ kill -s SIGUSR1 32508

et dans un autre shell

  $ ./crack --test

  QUELQUES TESTS
  ==============

  fonction get_data
  -----------------
  affichage des 10 premiers paquets :

  paquet  1 : 00 00 01  =>  6d
  paquet  2 : 00 00 02  =>  05
  paquet  3 : 00 00 03  =>  df
  paquet  4 : 00 00 04  =>  5c
  paquet  5 : 00 00 05  =>  45
  paquet  6 : 00 00 06  =>  88
  paquet  7 : 00 00 07  =>  15
  paquet  8 : 00 00 08  =>  04
  paquet  9 : 00 00 09  =>  c2
  paquet 10 : 00 00 0a  =>  50

Les options du générateurs permettent de choisir la clé (01 02 03 04 05 06 07 08 09 0a 0b 0c 0d) et imposent que les vecteurs d'initialisation soient choisis dans l'ordre 00 00 01, 00 00 02, 00 00 03, etc.

La fonction de test fournie affiche simplement les 10 premiers paquets contenus dans le tube.

Comme rien n'est choisi aléatoirement, vous devriez obtenir le même résultat...

2.2. Attaque de Fluhrer, Mantin et Shamir

En 2001, Fluhrer, Mantin et Shamir ont montré que l'utilisation de RC4 pour WEP rendait la clé facilement craquable. Il suffit de récupérer un nombre raisonnable de paquets chiffrés.

Le principe général (vu en cours) est le suivant.

  1. On récupère des paquets chiffrés avec leurs vecteur d'initialisation (envoyé en clair).

  2. Le premier octet de chaque paquet est le "SNAP header" (subnetwork access protocol) qui vaut 0xaa pour le WEP. On peut donc en déduire le premier octet généré par RC4 avec la clé constituée du vecteur d'initialisation (connu) et la clé WEP (inconnue).

  3. Lorsque certaines conditions sont vérifiées, on fait une prédiction sur le premier octet de la clé secrète en utilisant le vecteur d'initialisation et le premier octet généré.

Lorsque suffisamment de prédictions ont été faites, on observera un biais : une valeur est prédite plus souvent que les autres. Ça sera le premier octet de la clé secrète.

On peut recommencer, avec un octet connu supplémentaire : les 3 octets des vecteurs d'initialisation et un octet de la clé secrète.

Détails de l'attaque :

Si on connait :

on peut essayer de faire une prédiction sur l'octet n de la clé :

  1. on connait l'octet généré par RC4 : b_rc4,

  2. on effectue les 3+n premières étapes du KSA,

  3. on vérifie si les 2 conditions suivantes sont vraies :

    • P[1] < 3+n

    • P[1] + P[P[1]] == 3+n -

  4. Si oui, on dit que le vecteur d'initialisation est faible et on prédit le nouvel octet (numéro n) avec prediction = pos(P, b_rc4) - index_j - P[3+n], où pos(P, b_rc4) est la position de b_rc4 (premier octet généré par le PRGA) dans la permutation P. (Attention, il ne faut pas oublier de faire un modulo 256 et de garantir que la prédiction est positive.)

    Si non, on abandonne la prédiction courante.

La fonction crack-WEP (définie dans la suite) gardera la prédiction qui apparait le plus souvent. Elle cherchera ensuite l'octet n+1 de la même manière, jusqu'à avoir deviné tous les octets de la clé WEP.

Dans votre fonction, il faut utiliser IV_size+n à la place de 3+n pour que votre code fonctionne pour des tailles de vecteurs d'initialisation différentes.

Le code fournit (fichier lucien-tartempion.c) utilise des variables globales que vous ne devrez pas modifier. Leurs valeurs sont choisies en donnant des options sur la ligne de commande. Les plus importantes sont :

Vecteurs faibles

Écrivez la fonction suivante (voir détails de l'attaque)

int weak(int n, byte *key, byte b_rc4, byte *prediction);

qui teste si le vecteur d'initialisation (contenu dans les premiers octets de key) est faible.

La fonction devra renvoyer 1 lorsque le vecteur d'initialisation est faible et 0 lorsqu'il n'est pas faible.

Vous pouvez commencer par tester votre fonction en regardant uniquement si le vecteur est faible, sans faire la prédiction. Si cela fonctionne, vous pourrez alors passer au calcul de la prédiction.

estimation du temps : 30 minutes

Voici quelques exemples de tests :

n key b_rc4 faible prediction
0 {0x53, 0x7a, 0xad} 0x2b non -
1 {0x5a, 0xa4, 0xcb, 0x01} 0xd7 non -
3 {0xd8, 0x77, 0x9e, 0x01, 0x02, 0x03} 0xfa non -
4 {0x78, 0x89, 0xec, 0x01, 0x02, 0x03, 0x04} 0x21 oui 0x0f
5 {0x82, 0x7f, 0xe2, 0x01, 0x02, 0x03, 0x04, 0x05} 0x83 oui 0x6e
7 {0xf8, 0x0b, 0xe2, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07} 0x2e oui 0xf9
9 {0x22, 0xe0, 0xba, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09} 0x29 oui 0xd6
11 {0xf7, 0x3b, 0xe1, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0x0a, 0x0b} 0x03 non -

Les octets en italiques correspondent au vecteur d'initialisation contenu dans les premiers octets de la clé.

Attaque sur la clé complète

Écrivez la fonction suivante (voir détails de l'attaque)

int crack_WEP(byte* cle_WEP);

qui permet de deviner tous les octets d'une clé WEP en cherchant des vecteurs d'initialisation faibles.

Vous devrez pour ceci faire plusieurs prédictions pour chaque octet de la clé, et ne garder que la plus fréquente.

Le nombre de prédictions à faire pour chaque octet de la clé dépend des deux variables expected_weak_IV et expected_IV :

La valeur de retour devra être le nombre d'octets de la clé.

Attention, cle_WEP ne contient que la partie fixe de la clé alors que la fonction weak prend en argument la clé complète (partie variable + partie fixe). Il faut donc déclarer une nouvelle variable pour contenir la clé complète.

estimation du temps : 45 minutes

Pour vos tests, vous pouvez utiliser l'option --easy du générateur qui permet d'augmenter la proportion de vecteurs faibles générés et accélérer la recherche des clés.

Vérification

Écrivez la fonction

int check_byte(byte* cle_WEP);

qui récupère un vecteur d'initialisation et un octet généré (avec la fonction get_data), et vérifie si la clé donnée en argument génère bien le même octet. La fonction devra renvoyer 1 lorsque c'est le cas, et 0 sinon.

Vous pouvez réutilisez des morceaux de code que vous avez écrit pour la question 1. (Attention, la taille de la clé est maintenant égale à key_size + IV_size.)

Pour tester, vous pouvez choisir la clé utilisée par le générateur avec l'option --key et définir explicitement la clé dans votre fonction votre fonction perform_tests:

  byte K[] = {0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0x0a, 0x0b, 0x0c, 0x0d};
  if (check_byte(K) == 1) {
      ...
  }

estimation du temps : 20 minutes

Ajoutez un test à la fin de la fonction crack_WEP qui vérifie si la clé trouvée génère les même octets que le générateur.

Vous utiliserez pour ceci la fonction check_byte écrite précédemment et vous testerez nb_tests octets (variable globale définie par l'option --nb_tests).

estimation du temps : 10 minutes

Amélioration

Utilisez la valeur de la variable globale nb_retries pour, en cas d'échec (question précédente), essayer de deviner la clé avec des nouveaux paquets. Attention, la valeur par défaut de nb_retries est 0, ce qui signifie qu'il ne faut faire qu'une seule prédiction.

Par exemple, avec les valeurs

la fonction crack_WEP devra

  1. faire une prédiction avec 100 vecteurs faibles par octet de la clé,

  2. vérifier la clé trouvée sur 10 octets,

  3. en cas d'échec, continuer avec 100 nouveaux vecteurs faible par octet. La fonction arrête lorsqu'elle a trouvé une clé valide, ou lorsque l'étape 3 a été faite 5 foix (nb_retries).

Vous ne devez pas sauvegarder toute les données, mais seulement les prédictions faites pour chaque octet. Au final, vous aurez donc potentiellement une clé devinée en utilisant 500 vecteurs faibles par octet.

estimation du temps : 20 minutes