| Statistiques descriptives
En pratique, on utilise généralement une des règles suivantes :
- Règle de Sturges :
- Rège de Yule :
Dans les deux cas, on arrondit à l’entier le plus proche, car un nombre de classes doit être
un entier
Le choix
définitif du nombre de classes est dicté par un souci de clarté dans la
présentation.
En utilisant
les formules de Sturges ou de Yule, on peut aboutir au tableau :
Nombre
d’observations : n
|
Le
nombre de classes : k
|
10 10 < n ≤
22 22 < n ≤
44 44 < n ≤ 90 90 < n ≤ 180 180 < n
≤ 360 360 < n ≤ 720 720 < n
≤ 1 000
|
4 5 6 7 8 9 10 11
|
Exemple 14
Longueur totale du
crâne (mm) pour un sous-échantillon de 60 souris sylvestres adultes (I, II et
III), tiré d’un échantillon de 122 souris de Landry (2000)1
22,28 | 23,18 | 23,47 | 23,72 | 24,09 | 24,56 | 22,56 | 23,23 | 23,48 | 23,48 | 24,13 | 24,63 | 22,57 | 23,29 | 23,48 | 23,48 | 24,32 | 24,83 | 22,60 | 23,30 | 23,49 | 23,49 | 24,35 | 24,94 | 22,69 | 23,34 | 23,51 | 23,51 | 24,36 | 24,95 | 22,73 | 23,35 | 23,56 | 23,56 | 24,37 | 25,00 | 22,78 | 23,35 | 23,57 | 23,57 | 24,41 | 25,07 | 22,91 | 23,37 | 23,60 | 23,60 | 24,43 | 25,16 | 23,05 | 23,39 | 23,61 | 23,61 | 24,43 | 25,48 | 23,14 | 23,47 | 23,71 | 23,71 | 24,52 | 25,74 |
Combien de
classes sont-elles nécessaires dans ce cas?
Solution
Effectif de
l’échantillon est n = 60 Selon la règle
de Sturge: le nombre de classe K = 1
+ (3,3 × log(60)) = 6,92 ≈ 7 classes Selon la règle
de Yule: le nombre de classes K=
2.5 × (60)1/4 = 2.5 × 2.78 = 6.95 ≈ 7 classes
7. Règles générales de formation des distributions d'effectifs
On suit les
étapes suivantes :
- On détermine
la plus grande et la plus petite des données brutes qui donnent immédiatement
l’étendue (différence entre ces deux valeurs).
- On partage
l’étendue en classe suffisamment nombreuses de même amplitude. Lorsque cela est
impossible, on considère des classes de dimensions différentes ou des classes
ouvertes. Le nombre de classe est généralement compris entre 5 et 20 et calculé
selon la règle de Sturges ou de Yule. Les classes sont choisit de manière que
leurs centres coïncident avec des données réellement observées et cela, afin de
diminuer l’erreur de groupement. Mais les bornes de classes ne doivent pas
coïncider avec des données réellement observées.
- Dans chaque
classe on détermine le nombre d’observations donc la fréquence ou l’effectif de
chaque classe.
http://www.cours-univ.fr/documents/cours020212.pdf
|