Construction d'un test de Khi-2

La construction d'un test de Khi-2 se fait en 3 étapes:

  1. obtention du tableau croisé des 2 variables choisies
  2. construction du tableau théorique correspondant à l'indépendance
  3. Calcul de la probabilité d'obtenir le tableau observé

Sur le plan méthode de travail, il est conseillé de laisser les données seules sur une feuille et de travailler sur les autres feuilles du classeur. A la fin du TD, enregistrez votre travail et envoyez le moi par mél.

Commençons donc par télécharger le tableau croisé (choisissez votre format préféré):

Commencez par faire, étape par étape, l'exemple qui est sur la première feuille du classeur. Cet exemple sera traité à l'écran. Faites ensuite les autres exemples selon le même scénario.

Calcul des marges

Le calcul des marges consiste à calculer le total des lignes et des colonnes. Faites le à l'aide de formules simples.

Calcul du tableau théorique

Le tableau théorique est le tableau qui correspond à l'hypothèse d'indépendance. Comme nous l'avons vu lors du TD précédent, une propriété de ce tableau est que toutes les lignes sont proportionnelles, ainsi que toutes les colonnes.

Ce tableau est donc simple à calculer: il suffit, pour chaque case, de multiplier le total de la ligne par celui de la colonne, et de diviser par le total général. Faites le à l'aide d'une formule recopiée dans chaque case (l'exercice vous rappellera celui de la table de multiplication fait lors de la première séance).

C'est sur ce tableau théorique que l'on va vérifier que les conditions d'application du test du Khi-2 sont bien remplies. Il faut en effet que tous les effectifs théoriques apparaissant dans le tableau soient au moins égaux à 5. Si trop de cases sont inférieures à 5, il faut envisager de regrouper des lignes ou des colonnes.

Calcul de la probabilité d'indépendance

La probabilité d'indépendance est donnée par la fonction TEST.KHIDEUX en Open Office et CHISQ.TEST (ou TEST.KHIDEUX dans la dernière version) en Excel. Dans les deux cas, ces fonctions ont 2 arguments:

  • la plage de cellules correspondant au tableau observé (le tableau croisé du début, ou une copie)
  • la plage de cellule correspondant au tableau théorique (calculé au paragraphe précédent)

Cette probabilité est une valeur entre 0 et 1, comme toute probabilité. Une valeur proche de 1 conduit à accepter l'hypothèse d'indépendance, c'est à dire que les 2 variables choisies sont indépendantes l'une de l'autre.

Par contre, une valeur proche de 0 conduit à rejeter l'hypothèse d'indépendance, c'est à dire à supposer que les 2 variables choisies sont liées.

Si l'on rejette l'hypothèse d'indépendance, il est possible de donner une interprétation de la dépendance.

Interprétation

L'interprétation consiste à rechercher les cases du tableau qui on le plus contribué au Khi-2. Pour cela, on va calculer la contribution de chaque case.

Dans une case donnée, soit nO l'effectif observé et nT l'effectif théorique. La contribution de cette case au Khi-2 sera: (nO-nT)2/nT. Calculez le tableau des contributions à l'aide d'une formule simple.

L'interprétation nécessite de repérer les cases de ce dernier tableau ayant une valeur élevée.

Pour cela, une possibilité est de "colorier" ce tableau. Sélectionnez le tableau des contributions et utilisez le Formatage conditionnel, en choisissant une échelle de couleurs, par exemple de rouge à vert.

Il suffit alors de repérer les 2 ou 3 cellules qui sont les plus 'vertes'. Pour chacune d'elles, il faut comparer nO l'effectif observé et nT l'effectif théorique:

  • si nO>nT, c'est que les valeurs correspondantes se produisent souvent ensemble.
  • si nO<nT, c'est que les valeurs correspondantes se produisent rarement ensemble.

La suite

Retour au sommaire. Pour toute question écrivez moi .