Statistiques à une ou deux variables - cours - T STG

F.Gaudon

3 mai 2008

Table des matières

1 - Statistiques à une variable (rappels)
2 - Statistiques à deux variables
 2.1 - Vocabulaire
 2.2 - Ajustement d’un nuage de points
 2.3 - Détermination d’une équation de droite d’ajustement affine

1 - Statistiques à une variable (rappels)

Propriété :

Soient xi pour i allant de 1 à p p est un entier les valeurs distinctes d’une série statistique et ni pour i allant de 1 à p les effectifs correspondants. On note N l’effectif total, somme des ni pour i allant de 1 à p.

2 - Statistiques à deux variables

2.1 - Vocabulaire

Définition :


  • Soient x et y deux caractères quantitatifs d’une même population. A chaque individu de la population on associe un couple (xi; yi) xi et yi pour i ∈ {1; ; n} avec n entier naturel sont les valeurs prises respectivement par x et y. L’ensemble de ces couples constitue une série statistique à deux variables x et y.
  • Dans un repère (O; ⃗i ;  ⃗j), l’ensemble des points Mi de coordonnées (xi; yi) est appelé le nuage de points associé à la série statistique.

Définition :


Soit une série statistique à deux variables x et y de moyennes ¯x et ¯y . Le point G de coordonnées (¯x; y¯ ) avec ¯x = 1n i=1nx i et ¯y = i=1ny i est appelé le point moyen du nuage de points associé à la série statistique.


2.2 Ajustement d’un nuage de points

Définition :


Toute droite passant par le point moyen du nuage et "résumant approximativement" le nuage est appelée droite d’ajustement affine du nuage de points.


La droite ci-dessous réalise un ajustement affine du nuage. Selon la position du point K, on obtient donc différentes droites d'ajustement affine résumant "plus ou moins bien" le nuage de points.

Sorry, the GeoGebra Applet could not be started. Please make sure that Java 1.4.2 (or later) is installed and active in your browser (Click here to install Java now)

Remarque :

Il existe d’autres types d’ajustement : dans certains cas, on peut observer que visiblement une droite ne convient pas mais que le nuage de points semble être approché par un autre type de courbe, parabole par exemple. En outre, certains nuages peuvent ne pas sembler être approchables par une quelconque courbe auquel cas les deux variables ne sont pas reliées entre elles.

2.3 - Détermination d’une équation de droite d’ajustement affine

Méthode (Méthode graphique au jugé) :


On trace « au jugé » une droite passant par le point moyen du nuage qui « semble résumer » le nuage de points. C’est une méthode simple mais qui dépend de la droite tracée.


Méthode de MAYER :


On sépare le nuage en deux sous nuages et on calcule les coordonnées des points moyens des deux sous nuages obtenus. La droite de MAYER est la droite passant par ces deux points. Elle passe aussi par le point moyen du nuage.


La droite de Mayer du nuage de point ci-dessous a été obtenue à partir des points moyens des sous nuages constitués des 4 premiers points d'une part et des 3 derniers d'autre part.

Sorry, the GeoGebra Applet could not be started. Please make sure that Java 1.4.2 (or later) is installed and active in your browser (Click here to install Java now)

Méthode (Méthode des moindres carrés) :


Avec les notations de la figure ci-dessous, étant donné un nuage de n points Ai, il existe une droite passant par le point moyen G et telle que la somme des carrés des écarts (ou résidus) P1A12+P 2A22++P nAn2 soit minimale. Cette droite est appelée droite de régression de y en x. En pratique, on utilisera la calculatrice pour l’obtenir.


La droite ci-dessous réalise un ajustement affine du nuage de points. Suivant la position du point K qui donne sa direction à la droite, la somme des carrés des résidus est plus ou moins élevée. La droite de régression linéaire de y en x est la droite obtenue lorsque cette somme est la plus basse possible.

Sorry, the GeoGebra Applet could not be started. Please make sure that Java 1.4.2 (or later) is installed and active in your browser (Click here to install Java now)