I. Tableaux croisés d'effectifs
Exemple
On a relevé à un moment donné le taux de cholestérol (exprimé en grammes par litre de sang) et l’âge (en années) d’un échantillon de la population d’une région.
Les résultats sont consignés dans le tableau d’effectifs à double entrée suivant.
On peut lire, par exemple, que dans l’échantillon considéré il y a 8 individus entre 50 et 60 ans qui ont un taux de cholestérol compris entre 2,0 et 2,2.
Notons A l’ensemble des personnes de la tranche d’âge [40, 50[.
Notons B l’ensemble des personnes dont le taux de cholestérol est dans l’intervalle [2,0 ; 2,2[.
La sous-population A ∩ B est l’ensemble des personnes qui possèdent conjointement les deux propriétés suivantes :
- leur âge appartient à l’intervalle [40, 50[ ;
- leur taux de cholestérol appartient à l’intervalle [2,0 ; 2,2[.
II. Calculs de fréquence
1) Fréquence d’une sous-population
Définition
La fréquence d’une sous-population A dans une population E est le rapport des effectifs : f=nAnE.
Exemple
On reprend l’exemple du paragraphe ➀.
La fréquence fA de la sous-population A dans l’ensemble E des 220 personnes est fA=38220≈0,17. De même la fréquence fB de la sous-population B dans l’ensemble E est fB=45220≈0,20.
La fréquence de A ∩ B est appelée fréquence conjointe de A et B, fA∩B=7220≈0,03.
2) Fréquence marginale
Dans les tableaux croisés d’effectifs, en plus des résultats proprement dits, une colonne à droite et une ligne en bas donnent les totaux correspondant à chaque ligne et à chaque colonne de données : ce sont les marges du tableau, la case en bas à droite donnant l’effectif total.
Définition
Dans un tableau croisé d’effectifs, une sous-population dont l’effectif figure dans une marge ne dépend que d’une seule variable et sa fréquence est qualifiée de fréquence marginale.
Exemple
Dans l’exemple du ➁ A, fA et fB sont des fréquences marginales.
3) Fréquence conditionnelle
Définition
Pour toutes sous-populations A et B d’effectifs non nuls d’une population E,
la fréquence de B sachant A est fA(B)=nA∩BnA.
Exemple
On reprend l’exemple précédent.
nA∩B=7 et nA=38, d’où fA(B)=738≈0,18.
Propriété
La fréquence de B sachant A est fA(B)=fA∩BfA.
III. Algorithmique et croisement de variables catégorielles
1) Sous-ensemble de données selon un critère
Avec un tableur
Des données figurent dans une feuille de tableur avec les variables en colonne.
Après sélection des données, la commande « Filtrer » du tableur permet de sélectionner les lignes correspondant à certains critères sur les variables.
Exemple
Un tableau comprend les trois notes des élèves Alice, Bob et Ève. Après sélection des données, un clic sur l’icône « Filtrer » crée une petite flèche à droite du nom de chaque variable (colonne). En cliquant sur cette flèche, il est possible de choisir un filtre numérique personnalisé par exemple pour n’afficher que les lignes pour lesquelles la note 1 est supérieure à 10.
2) Tableau croisé de variables catégorielles
Avec un tableur
Le tableur permet de créer des tableaux croisés dynamiques regroupant les données selon certaines catégories et effectuant les calculs demandés correspondants (sommes, moyennes, effectifs…).
Exemple
On considère les deux variables « Nom » et « Ville » ayant chacune 6 valeurs. On souhaite regrouper les données par « Ville » et compter le nombre de noms pour chaque ville.
Avec Excel, cliquer dans le tableau de données et faire
Insertion / Tableau croisé dynamique. Choisir les champs (c’est-à-dire les variables) à inclure dans le rapport, en « glisser » le cas échéant en colonne ou en ligne pour améliorer la lisibilité du tableau.
Avec OpenOffice ou LibreOffice, faire Données / Tableau croisé / Créer…