Statistiques, cours, classe de 2nde
Cliquer sur la loupe pour tout révéler ou masquer :
Cliquer sur les ____ pour révéler ou masquer élément par élément.
I - Vocabulaire et notations
Définitions et notations :
On considère une série statistique.
- On suppose que la série comporte p valeurs distinctes (ou données) avec p entier naturel. Les valeurs du caractère étudiées sont notées $x_i$ pour i entier naturel allant de 1 à p. Le nombre d'individus pour la valeur $x_i$, c'est à dire l'effectif pour la valeur $x_i$ est noté $n_i$ où les nombres $n_i$ sont des entiers naturels.
- On regroupe dans certains cas la série en p classes $[a_i ; a_{i+1}[$ pour i allant de 1 à p où les $a_i$ sont des réels tels que $a_i\leq a_{i+1}$. On prend alors pour valeurs ____ les centres des classes $c_i=\frac{a_i+a_{i+1}}{2}$ pour i allant de 1 à p.
- Le nombre total de données, c'est à dire L'effectif total noté N, est alors égal à ____ $N=n_1+n_2+....+n_p$ ce que l'on note aussi $\sum_{i=1}^{i=p}n_i=N$.
valeurs | $x_1$ | $x_2$ | ... | $x_p$ |
effectifs | $n_1$ | $n_2$ | ... | $n_p$ |
Exemple :
On étudie la hauteur de jeunes plants de riz lors d'une expérience sur une nouvelle variété. La population est alors l'ensemble des plants de riz. Un individu est donc un plant de riz. Le caractère étudié est la hauteur des plants. C'est un caractère quantitatif, c'est à dire un nombre réel.
Les valeurs distinctes du caractère $x_i$ sont les différentes hauteurs relevées. Il peut, par exemple y avoir une hauteur $x_1=8$ cm pour un effectif de $n_1=2$ plants qui ont cette hauteur. L'effectif total N est le nombre total de plants de riz.
On peut regrouper les valeurs en classes, par exemple, la classe des plants qui ont une hauteur dans l'intervalle $[20 ; 25[$ en cm. Le centre de l'intervalle est alors ____ $c_1=\frac{20+25}{2}=22,5$.
II - Fréquences, séries cumulées
Définition : fréquences
On appelle fréquence $f_i$ de la série statistique pour la valeur $x_i$, le nombre réel défini par :
____ $f_i=\frac{n_i}{N}=\frac{\mathtt{effectif pour la valeur}}{\mathtt{effectif total}}$
qui s'exprime aussi en pourcentage en multipliant par 100.
Exemple :
Dans l'exemple des plants de riz, s'il y a 3 plants de taille 18 cm parmi un effectif total de 28 plants, la fréquence pour la valeur $x_i=18$ est ____ $f_i=\frac{3}{28}\approx 0,107$ soit environ 10,3% de plants de hauteur 18 cm.
Définition : séries cumulées
On appelle :
- Effectif cumulé croissant pour la valeur $x_i$,____ la somme des effectifs des valeurs inférieures ou égales à $x_i$ ;
- fréquence cumulée croissante pour la valeur $x_i$, ____ la somme des fréquences des valeurs inférieures ou égales à $x_i$.
Exemple :
On a relevé la hauteur de plants de riz d'une nouvelle variété lors d'une expérimentation :
Hauteur en cm ($x_i$) | 8 | 12 | 14 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |
Nombre de plans ($n_i$) | 2 | 2 | 4 | 2 | 2 | 3 | 3 | 4 | 4 | 2 |
____
Fréquences ($f_i$) | $\frac{2}{28}\approx 0,0714$ | 0,0714 | 0,1429 | 0,0714 | 0,0714 | 0,1071 | 0,1071 | 0,1429 | 0,1429 | 0,071 |
____
Effectifs cumulés croissants | 2 | 4 | 8 | 10 | 12 | 15 | 18 | 22 | 26 | 28 |
Programmation :
Calcul des fréquences d'une série statistique avec effectifs :
III - Caractéristiques statistiques
1 - Moyenne
Définition : moyenne
- Soit $x_i$ les p valeurs distinctes d'une série statistique et $n_i$ les effectifs pour chaque valeur. La moyenne pondérée notée $\bar{x}$ est donnée par :
____ $\bar{x}=\frac{n_1x_1+n_2x_2+...+n_px_p}{n_1+n_2+...+n_p}$
- Dans le cas d'une série où les effectifs des p valeurs distinctes $x_i$ sont tous égaux à 1 (on parlera alors par abus de langage de série "sans effectif"), la moyenne non pondérée est donc :
____ $\bar{x}=\frac{x_1+x_2+...+x_p}{p}$
Exemple :
Dans l'exemple des hauteurs de plants de riz, la moyenne est :
____ $\bar{x}=\frac{2\times 8+2 \times 12+...4 \times 21+2\times 22}{2+2+...+4+4+2}\approx 17,2$ cm
Algorithmique : Algorithme de calcul d'une moyenne pondérée
Variables : p, k, m, x, n, N : nombres
Début traitement :
Saisir p ;
Affecter à m la valeur 0 ;
Affecter à N la valeur 0 ;
Pour k allant de 1 à p :
| Saisir x ;
| Saisir n ;
| m = m + n x ;
| N=N+n
Fin Pour
Affecter à m la valeur $\frac{m}{N}$ ;
Afficher m
Programmation :
Calcul de moyenne non pondérée :
Calcul de moyenne pondérée :
Propriété : lien entre moyenne et fréquences
On considère l'ensemble des fréquences $f_i$ d'une série statistique de valeurs $x_i$ avec i allant de 1 à p. Alors la moyenne est donnée par :
____ $\bar{x}=f_1x_1+f_2x_2+...f_px_p$
Preuve :
____
On a $\bar{x}=\frac{n_1x_1}{N}+\frac{n_2x_2}{N}+....+\frac{n_px_p}{N}$
Donc $\bar{x}=\frac{n_1}{N}{x_1}+\frac{n_2}{N}x_2+....+\frac{n_p}{N}{x_p}$
D'où le résultat en tenant compte de $f_i=\frac{n_i}{N}$.
Exemple
Dans l'exemple précédent, on a :
____ $\bar{x}=f_1x_1+f_2x_2+...+f_px_p\approx 17,2$.
2 - Etendue
Définition : étendue
L'étendue d'une série statistique est ____ la différence entre la plus grande et la plus petite valeur de la série.
Exemple :
Dans l'exemple précédent l'étendue est ____ 22 - 8 = 14 cm.
3 - Médiane
Définition : médiane
La médiane est une valeur du caractère qui ____ sépare la série statistique ordonnée en deux sous séries de même effectif.
Méthode de détermination :
- Dans le cas d'un caractère discret d'effectif total N impair, on choisit pour médiane la valeur de la donnée de rang ____ $\frac{N+1}{2}$ ;
- dans le cas d'un caractère discret d'effectif total N pair, on choisit pour médiane ____ la demi-somme des valeurs des données de rang $\frac{N}{2}$ et de rang $\frac{N}{2}+1$.
Exemples :
- Série avec effectifs égaux à 1 et effectif pair :
Soit la série statistique dont les données sont : 2 ; 2 ; 3 ; 5 ; 7 ; 7 ; 8 ; 9.
____ L'effectif total est N = 8.
Il est pair donc la médiane est la demi-somme entre les données de rang 4 et 5.
La médiane est donc $\frac{5+7}{2}=6$.
- Série avec effectifs non tous égaux à 1 : on reprend l'étude sur les hauteurs de plants de riz :
Hauteur en cm ($x_i$) | 8 | 12 | 14 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |
Nombre de plans ($n_i$) | 2 | 2 | 4 | 2 | 2 | 3 | 3 | 4 | 4 | 2 |
Effectifs cumulés croissants | 2 | 4 | 8 | 10 | 12 | 15 | 18 | 22 | 26 | 28 |
____
Il y a 9 valeurs distinctes mais 28 données au total. L'effectif total est donc N = 28.
N est pair. La médiane est donc la demi-somme entre les valeurs de rang 14 et 15.
D'après le tableau des effectifs cumulés, les valeurs de rang 14 et 15 sont 18 et 18 donc la médiane est $\frac{18+18}{2}=18$ cm.
Programmation :
Calcul de médiane pour une série sans effectif :
Calcul de médiane pour une série avec effectifs :
4 - Quartiles
Définition : quartiles
- Le premier quartile noté $Q_1$ de la série statistique est ____ la plus petite valeur telle qu'au moins 25% des données de la série lui soient inférieures ou égales ;
- le troisième quartile noté $Q_3$ de la série statistique est ____ la plus petite valeur telle qu'au moins 75% des valeurs de la série lui soient inférieures ou égales.
Détermination pratique :
On suppose la série ordonnée dans l'ordre croissant des valeurs du caractère. Soit N l'effectif total.
- Si $\frac{N}{4}$ est un entier alors $Q_1$ est ____ la valeur de rang $\frac{N}{4}$ et $Q_3$ est la valeur ____ de rang $\frac{3N}{4}$ ;
- si $\frac{N}{4}$ n'est pas un entier alors $Q_1$ est ____ la valeur dont le rang suit le rang $\frac{N}{4}$ et $Q_3$ est ____ la valeur dont le rang suit le rang $\frac{3N}{4}$.
Exemple :
Hauteur en cm ($x_i$) | 8 | 12 | 14 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |
Nombre de plans ($n_i$) | 2 | 2 | 4 | 2 | 2 | 3 | 3 | 4 | 4 | 2 |
Effectifs cumulés croissants | 2 | 4 | 8 | 10 | 12 | 15 | 18 | 22 | 26 | 28 |
____ L'effectif total N est 28.
$\frac{N}{4}$ = 7 donc le premier quartile est la valeur de rang 7 c'est à dire $Q_1$ = 14 cm.
$\frac{3N}{4}$ = 21 donc le troisième quartile est la valeur de rang 21 c'est à dire $Q_3$ = 20 cm.
Programmation :
Calcul des quartiles pour une série sans effectifs :
Calcul des quartiles pour une série avec effectifs :
Définition :
On appelle :
- écart inter-quartiles ____ la différence $Q_3-Q_1$.
- intervalle inter-quartiles ____ l'intervalle $[Q_1;Q_3]$. Il contient environ 50 % des données.
Exemple :
On peut visualiser la répartition des valeurs en pourcentages de la série sur les plants de riz à l'aide d'une droite graduée :
On note ici que 50% des valeurs sont entre 18 cm et 22 cm donc dans un intervalle de 4 cm seulement d'amplitude.
IV - Représentations graphiques
Diagramme en bâtons ou en barres et nuage de points
Il permet de représenter les valeurs et les effectifs d'une série statistique avec effectifs :

Polygone des effectifs cumulés croissants
Il permet de représenter les effectifs cumulés et donc de déterminer graphiquement la médiane et les quartiles :
|