Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Statistiques et Probabilités : Exercices et Applications en Psychologie, Study notes of Statistics

Ce document présente des exercices et des exemples d’applications de statistiques et de probabilités en psychologie. Il couvre des concepts clés tels que la moyenne, l’écart type, la corrélation linéaire et la loi binomiale. Les exemples illustrent l’utilisation de ces concepts pour analyser des données et tirer des conclusions significatives en psychologie.

Typology: Study notes

2022/2023

Uploaded on 09/20/2024

axel-bacq
axel-bacq 🇬🇧

1 document

1 / 51

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
Statistiques en L1 de psychologie
Sébastien Leurent
Année 2023-2024
Notes de cours sous licence CC BY-SA 3.0
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33

Partial preview of the text

Download Statistiques et Probabilités : Exercices et Applications en Psychologie and more Study notes Statistics in PDF only on Docsity!

Statistiques en L1 de psychologie

Sébastien Leurent

Année 2023-

Notes de cours sous licence CC BY-SA 3.

Introduction

La psychologie est une discipline scientifique, dont la légitimité s’appuie notamment sur le recours à l’expérience pour confronter des hypothèses théoriques à une réalité expérimentale. L’expérimentation pouvant être un processus long, coûteux et difficile, on est souvent contraint de travailler sur un nombre limité de sujets, considérés comme formant un échantillon d’une plus grande population. Dès lors, une question qui survient rapidement est de savoir avec quelle précision et quel degré de certitude il est possible de tirer des conclusions à partir de tels échantillons. Ce semestre de cours aboutira notamment à introduire quelques outils d’estimation permettant de déterminer un intervalle de confiance, c’est-à-dire de connaître (en fonction de la confiance souhaitée) la marge d’erreur dont on doit tenir compte lorsqu’on tire des conclusions à partir d’un petit échantillon. Afin de suivre une progression logique aboutissant à ces outils, le cours s’articulera en chapitres :

Rappels et compléments de mathématiques

Chapitre 1 : Statistique descriptive univariée

Chapitre 2 : Statistique descriptive bivariée

Chapitre 3 : Introduction aux probabilités

Chapitre 4 : Loi normale

Chapitre 5 : Estimation

Calcul : Outil fondamental

 



Statistique descriptive : Résumer des données expérimentales

Probabilité : Outil de prédiction du résultat d’une expérience, sous certaines hypothèse ) Statistique inférentielle : déductions à partir de mesures sur un échantillon

Comme indiqué ci-dessus, ils s’inscrivent dans des branches des mathématiques appelées respectivement « statistique descriptive », « probabilité » et « statistique inférentielle ».

Déroulement du semestre et contrôle des connaissances

Les présentes notes de cours 1 , ainsi que les documents pédagogiques (formulaire, feuilles d’exercices, examens d’années antérieures, etc) sont disponibles sur la page plubel du cours, à l’adresse https:// plubel-prod.u-bourgogne.fr/course/view.php?id=889. À chaque séance, il vous est demandé d’avoir le formulaire distribué en début de semestre, ainsi qu’une calculatrice scientifique (par exemple, la calculatrice libre NumWorks est parfaitement adaptée, de même que les modèles «Graph 35+ USB» de Casio et «TI-83» de Texas Instruments). La calculatrice (réinitialisé ou en mode examen) et le formulaire (vierge de toute annotation) sont autorisés aux contrôles et examens.

Contrôle des connaissances

  • Un contrôle terminal (CT) a lieu en fin de semestre et donne la moitié de la note de l’UE
  • Une note de contrôle continue (CC) est obtenue au cours du semestre, et constitue l’autre moitié de la note de l’UE. Elle n’est pas rattrapable en deuxième session et est constituée - pour deux tiers d’un contrôle commun à tous les groupes de TD, la semaine après les vacances d’hiver (semaine du 4 au 8 mars 2024).
  1. Ces notes de cours sont largement inspirées de notes de cours écrites par A. Jebrane, et ont été relues et modifiées par G. Massuyeau ; il convient de les remercier tous les deux ici.
  • pour un tiers d’une note attribuée au sein de chaque groupe de TD, à partir d’au moins deux petits controles et éventuellement d’autres notes (exemple : participation). La calculatrice (réinitialisée ou en « mode examen ») et le formulaire (vierge de toute annotation) sont autorisés aux différents contrôles et examens.

Rappels et compléments de

mathématiques

Ce chapitre introductif contient d’une part des « rappels » (première partie du chapitre) et d’autre part des compléments. Les rappels s’adressent uniquement aux étudiants les moins à l’aise avec les mathématiques de collège et de lycée, tandis que la partie « compléments » est indispensable pour l’ensemble des étudiants.

Rappels

Règles de calcul

On rappelle ici les principales règles de calcul concernant les opérations usuelles : à titre d’exemple on pourra considérer l’expression suivante :

−x +

Notations

  • Le symbole « x » désigne un nombre arbitraire, avec lequel on peut faire des calculs « formels » même si on ne connaît pas sa valeur.
  • Le symbole « + » désigne l’addition.
  • Le symbole « - » peut soit désigner une soustraction, soit « l’opposé » d’un nombre :
    • par exemple le nombre négatif -4 est l’opposé de 4
    • de même −x désigne l’opposé de « x »
  • La multiplication est notée par le symbole « × », ou parfois « · », et par le symbole « ∗ » sur les calculatrices. Parfois, on n’écrit pas du tout la multiplication et le lecteur doit « deviner » sa présence, afin de donner un sens à une formule mathématique. Par exemple l’expression « 3(−4 + 7) » n’aurait aucun sens si on n’y insère pas un symbole de multiplication, de sorte qu’elle signifie en fait « 3 × (−4 + 7) ».
  • Les divisions sont notées indifféremment par le symbole « ÷ » (souvent utilisé par les calculatrices Casio), le symbole « / » (souvent utilisé par les calculatrices TI) ou un trait de fraction. Le trait de fraction présente l’avantage d’une plus grande lisibilité en évitant d’avoir à écrire explicitement certaines parenthèses. Ainsi, l’expression (^) 8+3^55 signifie 55 ÷ (8 + 3) (ou 55 /(8 + 3) ce qui est la même chose). Ce qui est « en haut » d’un trait de fraction s’appelle le numérateur, et ce qui est « en bas » s’appelle le dénominateur.
  • 62 désigne le carré de 6 , c’est-à-dire 6 × 6. Sur certaines calculatrices, ce carré est noté 6 ˆ 2.
  • Lorsqu’on écrit des nombres qui ont beaucoup de chiffres, il est fréquent d’ajouter des espaces pour plus de lisibilité. Par exemple, on écrira 12 345,678 9 pour désigner le nombre 12345 , 6789.

Priorités de calcul

Pour calculer une expression comme −x + (^) 8+3^55 + 3(−4 + 7) − 62 , on effectue les étapes suivantes dans cet ordre :

  1. On calcule tout d’abord ce qui est dans des parenthèses, ou au numérateur ou dénominateur d’une fraction. Pour l’expression −x + (^) 8+3^55 + 3(−4 + 7) − 62 , on calcule donc 8 + 3 = 11 et −4 + 7 = 3. On obtient donc −x +
  • 3(−4 + 7) − 62 = −x +

+ 3 × 3 − 62

  1. On calcule ensuite les puissances (ici le carré). On calcule donc 62 = 36 et on obtient

−x +

  • 3 × 3 − 62 = −x +

+ 3 × 3 − 36

  1. On effectue ensuite les multiplications et les divisions : on calcule donc 5511 = 5 et 3 × 3 = 9. On obtient donc −x +
  • 3 × 3 − 36 = −x + 5 + 9 − 36
  1. Enfin, on termine par les additions/soustractions :

−x + 5 + 9 − 36 = −x − 22

Pour cet exemple on obtient donc, à l’issue des calculs, que −x + (^) 8+3^55 + 3(−4 + 7) − 62 = −x − 22. Ces étapes s’effectuent toujours dans cet ordre (parenthèses, puissances, multiplications/divisions et enfin additions/soustractions). On peut en pratique s’en remettre aux calculatrices ou ordinateurs, qui connaissent cet ordre, mais lorsqu’on veut manipuler soi-même ce type d’expressions sans erreurs de parenthèses, il est indispensable de connaître ces règles de priorité. Par exemple, il faut savoir que 8 × 2 + 9 est égal à (8 × 2) + 9 et non pas à 8 × (2 + 9).

Autres règles de calcul

  • Lorsqu’on multiplie quelque chose par une somme (c’est-à-dire une addition ou une soustraction) on peut « développer ». Par exemple cela signifie que

9 × (7 − 3) = 9 × 7 − 9 × 3

  • On peut changer l’ordre des termes dans une addition ou une soustraction (mais dans une soustraction, il faut faire attention aux signes). De même on peut changer l’ordre des facteurs dans une multiplication ou une division. Par exemple, cela signifie que 5 − 9 + 8 = 5 + 8 − 9 , et que 53 × 7 = 7 × 3 5.
  • Lorsqu’on multiplie une fraction par une expression, on multiplie simplement le numérateur par cette expression. Lorsqu’on divise une fraction par une expression, on multiplie simplement le dénominateur par cette expression.
  • On peut simultanément ajouter et soustraire la même quantité sans modifier la valeur d’une expression. On peut de même, sans changer la valeur d’une expression, la multiplier et la diviser simultanément par la même quantité. Ainsi, on a par exemple 9 + x − 9 = x, et 9 × 9 6 = 6.

Calculatrice

Si vous n’êtes pas habitués à utiliser la calculatrice, vous êtes vivement encouragés à faire les Exercices 1 à 4 de la liste d’exercices de TD. (Ces exercices font partie de ceux qui ne seront pas traités en séances, et dont un corrigé est disponible sur la page plubel du cours.)

Chapitre 1

Statistique descriptive univariée

1.1 Introduction : types de variables

1.1.1 Introduction

Les données statistiques que l’on est amené à analyser peuvent être de nature très différente. Cela se traduit par le fait qu’on ne peut pas effectuer les même analyses sur des données de nature trop différente : par exemple, on peut calculer l’âge moyen au sein d’un groupe d’étudiants, alors que la moyenne de la couleur des yeux ne fait aucun sens. On peut considérer un groupe d’étudiants, que l’on interroge sur leur nombre de frères et soeurs, leur taille, la couleur de leurs yeux, et leur humeur (on leur demande d’indiquer s’ils se sentent “de très bonne humeur”, “de bonne humeur”, “de relativement bonne humeur” ou “de mauvaise humeur”). On se rend alors compte que

  • Cela ne fait pas tellement de sens de calculer la proportion d’étudiants qui mesurent 1m72 (par exemple), parce qu’il n’y absolument aucune raison qu’un étudiant mesure 1,72m et pas 1, m. D’un point de vue mathématique, on considère que la valeur 1m72 n’a aucune chance de tomber (on tombe sur des valeurs avec beaucoup plus de chiffres après la virgule), donc « la proportion d’étudiants qui mesurent 1m72 » n’a pas tellement de sens (et il serait de même pour n’importe quelle autre taille que 1m72).
  • Pour l’humeur des individus, on peut parler d’intervalles (par exemple « se sentir au moins “de bonne humeur” »), et on verra qu’on peut grâce à cela parler de médiane. Par contre, on ne peut pas parler de moyenne (nul se sait définir la moyenne entre “relativement bonne humeur” et “bonne humeur”).
  • Pour la couleur des yeux, on ne peut parler ni de moyenne, ni de médiane et d’intervalle (car il n’y pas de notion que certaines couleurs se situent entre d’autres couleurs.

Le tableau ci-dessous résume alors quels calculs feront sens pour chacun de ces types de données (ces calculs seront définis dans la suite du chapitre) :

Proportion d’une valeur

intervalle de valeurs

médiane

moyenne et écart type Nb de frères/sœurs

Taille ○ ✓ ✓ ✓ Humeur ✓ ✓ ✓ ○ Couleur des yeux

Variable quantitative discrète : Variable quantitative dont les modalités sont séparées par de nombreuses valeurs “interdites” Exemple Le nombre de frère et soeur peut être égal à 1 ou 2 , mais pas 1 , 5 ni 1 , 0356. C’est donc une variable quantitative discrète.

Variable quantitative continue : Variable dont les modalités ne sont séparées par aucune valeur interdite (elles forment un intervalle). Exemple La taille.

Variable qualitative : Variable qui n’est pas quantitative Exemples • La couleur des yeux

  • Un numéro de téléphone Au sein de variables qualitatives, on distingue deux types :

Variable qualitative ordinale : Variable qualitative dont les modalités sont ordonnées de manière claire et consensuelle. Exemples • L’humeur d’une personne : Si on demande à des personnes d’indiquer s’ils sont “de très bonne humeur”, “de bonne humeur”, “de relativement bonne humeur” ou “de mauvaise humeur”, alors cela forme une variable qualitative ordinale.

  • Au contraire, la nationalité n’est pas une variable ordinale, car il n’y a pas d’ordre bien défini, pas de consensus pour savoir si « français » se situe entre « suisse » et « italien » ou si c’est au contraire « suisse » qui se situe entre « français » et « italien ». Variable qualitative nominale : Variable qualitative qui n’est pas ordinale. Exemples La nationalité, la couleur des yeux, etc.

1.2 Regroupement de données

Considérons par exemple, que l’on demande à un groupe d’étudiants leur nombre de frères et soeurs, leur humeur, et leur taille. On peut obtenir les données suivantes :

Laetitia de bonne humeur 3 frères/soeurs 1m

Isabelle de relativement bonne humeur 2 frères/soeurs 1m

Aurélien de très bonne humeur 1 frère/soeur 1m

Jocelyne de mauvaise humeur 2 frères/soeurs 1m

Sylvain de bonne humeur 0 frère/soeur 1m

David de bonne humeur 1 frère/soeur 1m

Chantal de bonne humeur 2 frères/soeurs 1m

Théo de bonne humeur 3 frères/soeurs 1m

Pascale de mauvaise humeur 1 frère/soeur 1m

Une fois obtenues ces données, on va chercher à les mettre sous une forme plus synthétique et permettant de mieux les analyser. Dans ce chapitre, dédié aux statistiques descriptives univariées, on n’étudiera qu’une variable à la fois (sans considérer le lien entre les variables).

1.2.1 Regroupement par modalités

Pour une variable fixée, on calcule l’effectif de chaque modalité : c’est le nombre d’individus chez qui la variable prend cette valeur précise. On présente les effectifs sous forme de tableau : par exemple, pour l’humeur et le nombre de frères et soeurs on obtient les tableaux suivants

Modalité de mauvaise humeurde relativement bonne humeurde bonne humeurde très bonne humeur Effectif 2 1 5 1 (a) Humeur

Modalité 0 1 2 3 Effectif 1 3 3 2 (b) Nombre de frères et soeurs

Table 1.1 – Tableau présentant les effectifs des différentes modalités, pour l’humeur et le nombre de frères et soeurs d’un échantillon d’étudiants

Remarque : Nous n’utiliserons pas cette terminologie mais il est utile de savoir que certaines personnes (et certaines calculatrices) utilisent le terme « fréquence absolue » pour désigner les effectifs.

Notation

On désigne par x 1 la modalité de la première colonne, par x 2 la modalité de la deuxième colonne,

... par xi la modalité de la ième^ colonne. De même on désigne par n 1 l’effectif de la première colonne, par n 2 l’effectif de la deuxième colonne, ... par ni l’effectif de la ième^ colonne.

Exemple Dans la table 1.1b (indiquant le nombre de frères et soeurs), on a x 1 = 0, x 2 = 1, x 3 = 2 , x 4 = 3 ; n 1 = 1, n 2 = 3, n 3 = 3 , et n 4 = 2. Il y a 4 colonnes, d’où r = 4. L’effectif total est n = 1 + 3 + 3 + 2 = 9

Enfin on désigne par r le nombre total de colonnes, et par n l’effectif total, c’est à dire la “taille de l’échantillon”. On a donc

n = n 1 + n 2 + · · · + nr. (1.1)

On prendra l’habitude d’écrire la formule (1.1) de manière plus compacte, sous la forme

n =

X^ r

i=

ni , (1.2)

qui signifie exactement la même chose.

1.2.2 Regroupement en classes

Il est parfois pertinent, en particulier pour des variables quantitatives continues, de regrouper les modalités au sein d’intervalles. Ces intervalles s’appellent des classes, et on calcule les effectifs comme précédemment :

Classe [1,55 ; 1,60[ [1,60 ; 1,65[ [1,65 ; 1,70[ [1,70 ; 1,75[ [1,75 ; 1,80[ [1,80 ; 1,85[ [1,85 ; 1,90[ Effectif 1 1 3 0 2 1 1

Table 1.2 – Regroupement en classes de la taille des étudiants interrogés

Humeur mauvaiserelativement bonnebonne très bonne Effectif 2 1 5 1 Fréquence 0,222 0,111 0,556 0, Fréquence cumulée

(a) Humeur

Nombre de frères/soeurs

Effectif 1 3 3 2 Fréquence 0,111 0,333 0,333 0, Fréquence cumulée

(b) Nombre de frères et soeurs

Taille [1,55 ; 1,60[ [1,60 ; 1,65[ [1,65 ; 1,70[ [1,70 ; 1,75[ [1,75 ; 1,80[ [1,80 ; 1,85[ [1,85 ; 1,90[ Effectif 1 1 3 0 2 1 1 Fréquence 0 , 111 0 , 111 0 , 333 0 , 000 0 , 222 0 , 111 0 , 111 Fréquence cumulée 0 ,^111 0 ,^222 0 ,^555 0 ,^555 0 ,^777 0 ,^888 0 ,^999 (c) Taille

Table 1.3 – Humeur, taille et nombre de frères et soeurs : calcul des fréquences et des fréquences cumulées

Remarque La dernière fréquence cumulée est toujours égale à 1. Toutefois, quand on la calcule on commet souvent des erreurs d’arrondis qui peuvent aboutir à trouver par exemple 0 , 999 ou 1 , 001 au lieu de 1. Il est possible de l’éviter en gardant (sur la calculatrice) plus de chiffres après la virgule, à default de quoi il vaut mieux garder 0 , 999 ou 1 , 001 plutôt que de « tricher » pour obtenir exactement 1.

1.3 Représentations graphiques

1.3.1 Représentation des fréquences

Un premier type de graphique consiste à représenter les fréquences. Il y a principalement trois situation :

  • Pour des variables qualitatives on utilise fréquemment un diagramme en camembert comme celui de la figure 1.1. Les surfaces des différents quartiers sont proportionnels aux fréquences. Pour obtenir celà, il suffit de donner à chaque quartier l’angle f × 360 ◦, où f est la fréquence.
  • Pour des variables numériques discrètes, on peut utiliser un diagramme en bâton, où la hauteur de chaque bâton donne la fréquence d’une modalité. La figure 1.2 montre un diagramme de ce type pour illustrer le nombre de frères et soeurs de l’échantillon d’étudiants considéré.

mauvaise

11 , 1 %

relativement bonne

bonne

très bonne

Figure 1.1 – Humeur des étudiants : représentation en diagramme circulaire ("camembert")

Nombre de frères/soeurs

Fréquence

Figure 1.2 – Nombre de frères et soeurs : représentation en bâtons

Taille Y 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,

FY

Figure 1.4 – Polygone des fréquences cumulées, pour la taille des étudiants de l’échantillon

1.4 Calcul d’indicateurs

1.4.1 Médiane

Définition La médiane est définie si X est une variable numérique ou ordinale. C’est une modalité notée Med telle que Pr [X ⩾ Med] ⩾ 0 , 5 et que Pr [X ⩽ Med] ⩾ 0 , 5. C’est à dire qu’il y a une moitié des individus chez qui la variable est inférieure (ou égale) à la médiane, et l’autre moitié des individus chez qui la variable est supérieure (ou égale) à la médiane.

Mode de calcul et convention Pour la calculer on ordonne les valeurs, et on choisit la

(^) n+ 2

ème valeur.

Si n+1 2 n’est pas entier, on choisit le milieu entre la

(^) n 2

ème et la

(^) n 2 + 1

ème . Exemple Pour l’humeur des étudiants : on a n = 9 donc n+1 2 = 5. Si on note "M" pour « Mauvaise humeur », "R" pour « relativement bonne », "B" pour « bonne » et "T" pour « Très Bonne », alors en ordonnant les valeurs on a : M M R B B B B B T, et la 5 ème^ valeur est "B". La médiane est donc de bonne humeur.

Cas de données regroupées en classes Pour des données regroupées en classe on résout de manière approchée l’équation Pr [x ⩽ Med] = 0, 5 , c’est à dire FX (Med) = 0, 5. Cela peut soit se résoudre par lecture graphique (plus intuitif mais moins précis), soit en utilisant une formule du formulaire.

  1. Lecture graphique On cherche à déterminer la taille médiane des étudiants de l’échantillon. On doit résoudre FY (Med) = 50%, c’est à dire qu’on lit l’abscisse du point où le polygone des fréquences cumulées croise la droite d’ordonnée 50%. Comme indiqué en figure 1.5, on lit que la taille médiane est environ 1 , 692 m.
  2. Formule du formulaire On peut démontrer (en utilisant le théorème de Thalès), la formule suivante pour calculer la valeur approchée de la médiane : - on appelle ai et ai+1 le minimum et le maximum de la première classe dont la fréquence cumulée est supérieure à 0,5.

Taille Y 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,

FY

Figure 1.5 – Lecture graphique de la taille médiane des étudiants de l’échantillon

  • la médiane est alors donnée par la formule Med ≃ ai +

ai+1 − ai FX (ai+1) − FX (ai)

0 , 5 − FX (ai)

Exemple Dans le cas présent (taille médiane des étudiants de l’échantillon), la première classe à avoir une fréquence cumulée supérieure à 0 , 5 est [ 1,65 ; 1,7 [. On note donc ai = 1, 65 et ai+1 = 1, 7. On a donc FY (ai) = 0, 222 et FY (ai+1) = 0, 555 , d’où Med ≃ 1 ,65 +

Quartiles On a vu que la médiane consiste à séparer les données en deux moitiés égales de part et d’autre de la médiane, de sorte que la médiane est « la valeur du milieu ». On aurait aussi pu par exemple les séparer en "trois quart" d’un côté, "un quart de l’autre". Dans ce cas on parle non pas de médiane mais de quartile. Dans ce cours, on ne calculera de quartile que pour des données regroupées en classes, et il faut alors résoudre FX (Q 1 ) = 25% pour définir le premier quartile (Q 1 ) ou FX (Q 3 ) = 75% pour définir le troisième quartile (Q 3 ). On peut soit faire une résolution graphique, soit utiliser la même formule que pour la médiane en remplaçant 0 , 5 par 0 , 25 pour le premier quartile (Q 1 ) et par 0 , 75 pour le troisième (Q 3 ). Attention la classe [ai,ai+1[ à considérer change aussi.

1.4.2 Moyenne

Définition Si X est une variable quantitative, et si sur un échantillon de taille n elle prends les valeurs x 1 , x 2 ,.. ., xn, alors sa moyenne sur l’échantillon est

m(X) =

n

X^ n

i=

xi.

C’est à dire que l’on additionne les valeurs obtenues pour chaque individu et on divise par le nombre d’inidividus. La valeur que l’on obtient indique une valeur typique de X sur cet échantillon.