Statistiques - cours - 2nde

F.Gaudon

16 août 2005

Table des matières

1 Vocabulaire des statistiques
2 Représentations graphiques
 2.1 Caractères qualitatifs ou quantitatifs discrets
 2.2 Caractères qualitatifs continus
3 Caractéristiques d’une série statistique
 3.1 Caractéristiques de position
 3.2 étendue
4 Echantillonnage et simulations
 4.1 Distribution de fréquences
 4.2 Expérience aléatoire et simulation

1 Vocabulaire des statistiques

Définitions :


  • Population : ensemble étudié ;
  • individu : élément de la population ;
  • caractère : propriété étudiée.

    Un caractère peut être :

    • qualitatif : les valeurs du caractère ne sont pas numériques (ex. : ville d’origine) ;
    • quantitatif : les valeurs du caractère sont numériques (ex. taille).

      Un caractère quantitatif peut être :

      • discret : valeurs peu nombreuses (ex. : nombre d’enfants) ;
      • continue : valeurs infinies ou très nombreuses (ex. : taille).

    Les valeurs d’un caractère sont notées ni.

  • classe : partie de la population de valeurs de caractères proches ;
  • effectif : nombre d’individus d’une classe (noté ni) ou d’une population (effectif total noté N).
  • fréquence : fi = ni
N ou en pourcentage fi = ni
N × 100.

Remarques :

2 Représentations graphiques

2.1 Caractères qualitatifs ou quantitatifs discrets

On utilise un diagramme en bâtons ou en barres ou circulaire.

Exemple :

Ventes de voitures neuves en août 1996 :




Renault PSA étrangères



26,4% 25,9 % 47,7%



PICPIC

2.2 Caractères qualitatifs continus

On utilise un histogramme.

Propriété :


Dans un histogramme l’effectif d’une classe est proportionnel à l’aire des rectangles et pas à hauteur.


PIC

Exemple :







prix [0 ; 500[[500 ; 1000[[1000 ; 1500[[1500 ; 2000[[2000 ; 2500[






nombre d’articles 4 8 6 5 2






3 Caractéristiques d’une série statistique

3.1 Caractéristiques de position

Définition :


Le mode (ou classe modale) est la classe ou la valeur du caractère de plus grand effectif.


Remarque :

Le mode ou la classe modale ne sont pas nécessairement unique pour une série statistique donnée.

Définition :


La médiane est la valeur du caractère qui sépare la série statistique en deux groupes de même effectif.


Méthode de détermination :

Définition :


La moyenne est donnée par :

n1x1-+-n2x2-+-...+--nkxk-
           N
ou encore
 sum 
---nixi
  N
On dit que la moyenne d’une série statistique est élaguée d’une ou de plusieurs valeurs lorsque la moyenne est calculée sans tenir compte de ces valeurs.

Remarque :

Dans le cas d’un caractère continue (donc de valeurs regroupées en classes), on prend pour xi le centre ai+2bi- des classes [ai; bi[.

Propriétés :


Soit x la moyenne d’une série d’effectif total N, de valeurs xi et d’effectifs correspondants ni pour i allant de 1 à k.

  • Si x1 et x2 sont les moyennes de deux sous groupes de la série d’effectifs respectifs N1 et N2, alors :
        N1x1--+-N2x2-
x =      N
  • La moyenne de la série de valeurs axi + b a et b sont des nombres réels est égale à axi + b.

3.2 étendue

Définition :


L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite.


4 Echantillonnage et simulations

4.1 Distribution de fréquences

Définition :


  • On appelle échantillon toute partie de la population.
  • L’effectif d’un échantillon est appelé sa taille.
  • Réaliser un sondage dans une population, c’est réaliser une enquête statistique sur un échantillon de cette population.

Définition :


  • On appelle distribution de fréquences liées à un échantillon, la donnée des différentes valeurs du caractère et des fréquences associées.
  • On appelle fluctuation d’échantillonnage la variation des distributions de fréquences en fonction de l’échantillon choisi.

4.2 Expérience aléatoire et simulation

Définition :


  • On appelle expérience aléatoire une expérience dont le résultat, soumis au hasard, est impossible à prévoir.
  • Réaliser une simulation d’une expérience aléatoire, c’est la remplacer par une autre expérience aléatoire plus facile à réaliser mais dont on peut estimer que les distributions de fréquences qu’elle donnerait seraient proches pour un grand nombre de répétitions.