Statistique

icône de pdf
Signaler

Tableaux croisés d'effectifs

EXEMPLE

On a relevé à un moment donné le taux de cholestérol (exprimé en grammes par litre de sang) et l’âge (en années) d’un échantillon de la population d’une région.

Les résultats sont consignés dans le tableau d’effectifs à double entrée suivant.

On peut lire, par exemple, que dans l’échantillon considéré il y a 8 individus entre 50 et 60 ans qui ont un taux de cholestérol compris entre 2,0 et 2,2.

0110187c-8655-4d22-b3df-fde15e601a63

Notons A l’ensemble des personnes de la tranche d’âge [40, 50[.

Notons B l’ensemble des personnes dont le taux de cholestérol est dans l’intervalle [2,0 ; 2,2[.

La sous-population AB est l’ensemble des personnes qui possèdent conjointement les deux propriétés suivantes :

leur âge appartient à l’intervalle [40, 50[ ;

leur taux de cholestérol appartient à l’intervalle [2,0 ; 2,2[.

Calculs de fréquence

A Fréquence d’une sous-population

DÉFINITION

La fréquence d’une sous-population A dans une population E est le rapport des effectifs : f=nAnE.

EXEMPLE

On reprend l’exemple du paragraphe ➀.

La fréquence fA de la sous-population A dans l’ensemble E des 220 personnes est fA=382200,17. De même la fréquence fB de la sous-population B dans l’ensemble E est fB=452200,20.

La fréquence de A ∩ B est appelée fréquence conjointe de A et B, fAB=72200,03.

B) Fréquence marginale

Dans les tableaux croisés d’effectifs, en plus des résultats proprement dits, une colonne à droite et une ligne en bas donnent les totaux correspondant à chaque ligne et à chaque colonne de données : ce sont les marges du tableau, la case en bas à droite donnant l’effectif total.

DÉFINITION

Dans un tableau croisé d’effectifs, une sous-population dont l’effectif figure dans une marge ne dépend que d’une seule variable et sa fréquence est qualifiée de fréquence marginale.

EXEMPLE

Dans l’exemple du ➁ A, fA et fB sont des fréquences marginales.

C) Fréquence conditionnelle

DÉFINITION

Pour toutes sous-populations A et B d’effectifs non nuls d’une population E,
la fréquence de B sachant A est fA(B)=nABnA.

EXEMPLE

On reprend l’exemple précédent.

nAB=7 et nA=38, d’où fA(B)=7380,18.

Propriété

La fréquence de B sachant A est fA(B)=fABfA.

Algorithmique et croisement de variables catégorielles

A) Sous-ensemble de données selon un critère

Avec un tableur

Des données figurent dans une feuille de tableur avec les variables en colonne.
Après sélection des données, la commande « Filtrer » du tableur permet de sélectionner les lignes correspondant à certains critères sur les variables.

EXEMPLE

Un tableau comprend les trois notes des élèves Alice, Bob et Ève. Après sélection des données, un clic sur l’icône « Filtrer » crée une petite flèche à droite du nom de chaque variable (colonne). En cliquant sur cette flèche, il est possible de choisir un filtre numérique personnalisé par exemple pour n’afficher que les lignes pour lesquelles la note 1 est supérieure à 10.

5223bff3-70bb-46cf-95a4-29a4eadfa10d

B) Tableau croisé de variables catégorielles

Avec un tableur

Le tableur permet de créer des tableaux croisés dynamiques regroupant les données selon certaines catégories et effectuant les calculs demandés correspondants (sommes, moyennes, effectifs…).

EXEMPLE

On considère les deux variables « Nom » et « Ville » ayant chacune 6 valeurs. On souhaite regrouper les données par « Ville » et compter le nombre de noms pour chaque ville.

3ef0d6e9-4380-4bcc-8410-023c31f5fbf4

Avec Excel, cliquer dans le tableau de données et faire
Insertion / Tableau croisé dynamique. Choisir les champs (c’est-à-dire les variables) à inclure dans le rapport, en « glisser » le cas échéant en colonne ou en ligne pour améliorer la lisibilité du tableau.

Avec OpenOffice ou LibreOffice, faire Données / Tableau croisé / Créer…