











































Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
Ce document présente des exercices et des exemples d’applications de statistiques et de probabilités en psychologie. Il couvre des concepts clés tels que la moyenne, l’écart type, la corrélation linéaire et la loi binomiale. Les exemples illustrent l’utilisation de ces concepts pour analyser des données et tirer des conclusions significatives en psychologie.
Typology: Study notes
1 / 51
This page cannot be seen from the preview
Don't miss anything!
Introduction
La psychologie est une discipline scientifique, dont la légitimité s’appuie notamment sur le recours à l’expérience pour confronter des hypothèses théoriques à une réalité expérimentale. L’expérimentation pouvant être un processus long, coûteux et difficile, on est souvent contraint de travailler sur un nombre limité de sujets, considérés comme formant un échantillon d’une plus grande population. Dès lors, une question qui survient rapidement est de savoir avec quelle précision et quel degré de certitude il est possible de tirer des conclusions à partir de tels échantillons. Ce semestre de cours aboutira notamment à introduire quelques outils d’estimation permettant de déterminer un intervalle de confiance, c’est-à-dire de connaître (en fonction de la confiance souhaitée) la marge d’erreur dont on doit tenir compte lorsqu’on tire des conclusions à partir d’un petit échantillon. Afin de suivre une progression logique aboutissant à ces outils, le cours s’articulera en chapitres :
Rappels et compléments de mathématiques
Chapitre 1 : Statistique descriptive univariée
Chapitre 2 : Statistique descriptive bivariée
Chapitre 3 : Introduction aux probabilités
Chapitre 4 : Loi normale
Chapitre 5 : Estimation
Calcul : Outil fondamental
Statistique descriptive : Résumer des données expérimentales
Probabilité : Outil de prédiction du résultat d’une expérience, sous certaines hypothèse ) Statistique inférentielle : déductions à partir de mesures sur un échantillon
Comme indiqué ci-dessus, ils s’inscrivent dans des branches des mathématiques appelées respectivement « statistique descriptive », « probabilité » et « statistique inférentielle ».
Déroulement du semestre et contrôle des connaissances
Les présentes notes de cours 1 , ainsi que les documents pédagogiques (formulaire, feuilles d’exercices, examens d’années antérieures, etc) sont disponibles sur la page plubel du cours, à l’adresse https:// plubel-prod.u-bourgogne.fr/course/view.php?id=889. À chaque séance, il vous est demandé d’avoir le formulaire distribué en début de semestre, ainsi qu’une calculatrice scientifique (par exemple, la calculatrice libre NumWorks est parfaitement adaptée, de même que les modèles «Graph 35+ USB» de Casio et «TI-83» de Texas Instruments). La calculatrice (réinitialisé ou en mode examen) et le formulaire (vierge de toute annotation) sont autorisés aux contrôles et examens.
Ce chapitre introductif contient d’une part des « rappels » (première partie du chapitre) et d’autre part des compléments. Les rappels s’adressent uniquement aux étudiants les moins à l’aise avec les mathématiques de collège et de lycée, tandis que la partie « compléments » est indispensable pour l’ensemble des étudiants.
On rappelle ici les principales règles de calcul concernant les opérations usuelles : à titre d’exemple on pourra considérer l’expression suivante :
−x +
Notations
Priorités de calcul
Pour calculer une expression comme −x + (^) 8+3^55 + 3(−4 + 7) − 62 , on effectue les étapes suivantes dans cet ordre :
−x +
−x + 5 + 9 − 36 = −x − 22
Pour cet exemple on obtient donc, à l’issue des calculs, que −x + (^) 8+3^55 + 3(−4 + 7) − 62 = −x − 22. Ces étapes s’effectuent toujours dans cet ordre (parenthèses, puissances, multiplications/divisions et enfin additions/soustractions). On peut en pratique s’en remettre aux calculatrices ou ordinateurs, qui connaissent cet ordre, mais lorsqu’on veut manipuler soi-même ce type d’expressions sans erreurs de parenthèses, il est indispensable de connaître ces règles de priorité. Par exemple, il faut savoir que 8 × 2 + 9 est égal à (8 × 2) + 9 et non pas à 8 × (2 + 9).
Autres règles de calcul
9 × (7 − 3) = 9 × 7 − 9 × 3
Si vous n’êtes pas habitués à utiliser la calculatrice, vous êtes vivement encouragés à faire les Exercices 1 à 4 de la liste d’exercices de TD. (Ces exercices font partie de ceux qui ne seront pas traités en séances, et dont un corrigé est disponible sur la page plubel du cours.)
Les données statistiques que l’on est amené à analyser peuvent être de nature très différente. Cela se traduit par le fait qu’on ne peut pas effectuer les même analyses sur des données de nature trop différente : par exemple, on peut calculer l’âge moyen au sein d’un groupe d’étudiants, alors que la moyenne de la couleur des yeux ne fait aucun sens. On peut considérer un groupe d’étudiants, que l’on interroge sur leur nombre de frères et soeurs, leur taille, la couleur de leurs yeux, et leur humeur (on leur demande d’indiquer s’ils se sentent “de très bonne humeur”, “de bonne humeur”, “de relativement bonne humeur” ou “de mauvaise humeur”). On se rend alors compte que
Le tableau ci-dessous résume alors quels calculs feront sens pour chacun de ces types de données (ces calculs seront définis dans la suite du chapitre) :
Proportion d’une valeur
intervalle de valeurs
médiane
moyenne et écart type Nb de frères/sœurs
Taille ○ ✓ ✓ ✓ Humeur ✓ ✓ ✓ ○ Couleur des yeux
Variable quantitative discrète : Variable quantitative dont les modalités sont séparées par de nombreuses valeurs “interdites” Exemple Le nombre de frère et soeur peut être égal à 1 ou 2 , mais pas 1 , 5 ni 1 , 0356. C’est donc une variable quantitative discrète.
Variable quantitative continue : Variable dont les modalités ne sont séparées par aucune valeur interdite (elles forment un intervalle). Exemple La taille.
Variable qualitative : Variable qui n’est pas quantitative Exemples • La couleur des yeux
Variable qualitative ordinale : Variable qualitative dont les modalités sont ordonnées de manière claire et consensuelle. Exemples • L’humeur d’une personne : Si on demande à des personnes d’indiquer s’ils sont “de très bonne humeur”, “de bonne humeur”, “de relativement bonne humeur” ou “de mauvaise humeur”, alors cela forme une variable qualitative ordinale.
1.2 Regroupement de données
Considérons par exemple, que l’on demande à un groupe d’étudiants leur nombre de frères et soeurs, leur humeur, et leur taille. On peut obtenir les données suivantes :
Laetitia de bonne humeur 3 frères/soeurs 1m
Isabelle de relativement bonne humeur 2 frères/soeurs 1m
Aurélien de très bonne humeur 1 frère/soeur 1m
Jocelyne de mauvaise humeur 2 frères/soeurs 1m
Sylvain de bonne humeur 0 frère/soeur 1m
David de bonne humeur 1 frère/soeur 1m
Chantal de bonne humeur 2 frères/soeurs 1m
Théo de bonne humeur 3 frères/soeurs 1m
Pascale de mauvaise humeur 1 frère/soeur 1m
Une fois obtenues ces données, on va chercher à les mettre sous une forme plus synthétique et permettant de mieux les analyser. Dans ce chapitre, dédié aux statistiques descriptives univariées, on n’étudiera qu’une variable à la fois (sans considérer le lien entre les variables).
Pour une variable fixée, on calcule l’effectif de chaque modalité : c’est le nombre d’individus chez qui la variable prend cette valeur précise. On présente les effectifs sous forme de tableau : par exemple, pour l’humeur et le nombre de frères et soeurs on obtient les tableaux suivants
Modalité de mauvaise humeurde relativement bonne humeurde bonne humeurde très bonne humeur Effectif 2 1 5 1 (a) Humeur
Modalité 0 1 2 3 Effectif 1 3 3 2 (b) Nombre de frères et soeurs
Table 1.1 – Tableau présentant les effectifs des différentes modalités, pour l’humeur et le nombre de frères et soeurs d’un échantillon d’étudiants
Remarque : Nous n’utiliserons pas cette terminologie mais il est utile de savoir que certaines personnes (et certaines calculatrices) utilisent le terme « fréquence absolue » pour désigner les effectifs.
On désigne par x 1 la modalité de la première colonne, par x 2 la modalité de la deuxième colonne,
... par xi la modalité de la ième^ colonne. De même on désigne par n 1 l’effectif de la première colonne, par n 2 l’effectif de la deuxième colonne, ... par ni l’effectif de la ième^ colonne.
Exemple Dans la table 1.1b (indiquant le nombre de frères et soeurs), on a x 1 = 0, x 2 = 1, x 3 = 2 , x 4 = 3 ; n 1 = 1, n 2 = 3, n 3 = 3 , et n 4 = 2. Il y a 4 colonnes, d’où r = 4. L’effectif total est n = 1 + 3 + 3 + 2 = 9
Enfin on désigne par r le nombre total de colonnes, et par n l’effectif total, c’est à dire la “taille de l’échantillon”. On a donc
n = n 1 + n 2 + · · · + nr. (1.1)
On prendra l’habitude d’écrire la formule (1.1) de manière plus compacte, sous la forme
n =
X^ r
i=
ni , (1.2)
qui signifie exactement la même chose.
Il est parfois pertinent, en particulier pour des variables quantitatives continues, de regrouper les modalités au sein d’intervalles. Ces intervalles s’appellent des classes, et on calcule les effectifs comme précédemment :
Classe [1,55 ; 1,60[ [1,60 ; 1,65[ [1,65 ; 1,70[ [1,70 ; 1,75[ [1,75 ; 1,80[ [1,80 ; 1,85[ [1,85 ; 1,90[ Effectif 1 1 3 0 2 1 1
Table 1.2 – Regroupement en classes de la taille des étudiants interrogés
Humeur mauvaiserelativement bonnebonne très bonne Effectif 2 1 5 1 Fréquence 0,222 0,111 0,556 0, Fréquence cumulée
(a) Humeur
Nombre de frères/soeurs
Effectif 1 3 3 2 Fréquence 0,111 0,333 0,333 0, Fréquence cumulée
(b) Nombre de frères et soeurs
Taille [1,55 ; 1,60[ [1,60 ; 1,65[ [1,65 ; 1,70[ [1,70 ; 1,75[ [1,75 ; 1,80[ [1,80 ; 1,85[ [1,85 ; 1,90[ Effectif 1 1 3 0 2 1 1 Fréquence 0 , 111 0 , 111 0 , 333 0 , 000 0 , 222 0 , 111 0 , 111 Fréquence cumulée 0 ,^111 0 ,^222 0 ,^555 0 ,^555 0 ,^777 0 ,^888 0 ,^999 (c) Taille
Table 1.3 – Humeur, taille et nombre de frères et soeurs : calcul des fréquences et des fréquences cumulées
Remarque La dernière fréquence cumulée est toujours égale à 1. Toutefois, quand on la calcule on commet souvent des erreurs d’arrondis qui peuvent aboutir à trouver par exemple 0 , 999 ou 1 , 001 au lieu de 1. Il est possible de l’éviter en gardant (sur la calculatrice) plus de chiffres après la virgule, à default de quoi il vaut mieux garder 0 , 999 ou 1 , 001 plutôt que de « tricher » pour obtenir exactement 1.
1.3 Représentations graphiques
Un premier type de graphique consiste à représenter les fréquences. Il y a principalement trois situation :
mauvaise
11 , 1 %
relativement bonne
bonne
très bonne
Figure 1.1 – Humeur des étudiants : représentation en diagramme circulaire ("camembert")
Nombre de frères/soeurs
Fréquence
Figure 1.2 – Nombre de frères et soeurs : représentation en bâtons
Taille Y 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,
Figure 1.4 – Polygone des fréquences cumulées, pour la taille des étudiants de l’échantillon
1.4 Calcul d’indicateurs
Définition La médiane est définie si X est une variable numérique ou ordinale. C’est une modalité notée Med telle que Pr [X ⩾ Med] ⩾ 0 , 5 et que Pr [X ⩽ Med] ⩾ 0 , 5. C’est à dire qu’il y a une moitié des individus chez qui la variable est inférieure (ou égale) à la médiane, et l’autre moitié des individus chez qui la variable est supérieure (ou égale) à la médiane.
Mode de calcul et convention Pour la calculer on ordonne les valeurs, et on choisit la