







Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
Una introduzione teorica alla statistica descrittiva e inferenziale, incluse le unità statistiche e le fasi di un'indagine statistica. Viene inoltre discusso il concetto di unità statistica semplici, composite e complesse, e il modo in cui i dati vengono organizzati in matrici e tabelle. Il documento include anche informazioni sulla origine dei dati e le fonti statistiche.
Typology: Summaries
1 / 13
This page cannot be seen from the preview
Don't miss anything!
I principali rami della statistica sono:
sesso → variabile qualitativa / altezza → variabile: I caratteri cardinali (quantitativi) possono essere suddivisi in base all’identificazione o meno di un’origine (0). Nel caso in cui tale origine esista, parleremo di scala di rapporto mentre, in caso contrario, si dirà che il carattere è su scala di intervallo. Riguardo l’ origine dei dati il ricercatore può operare in due modi: attingere a dati che già esistono o creare in proprio la raccolta dei dati necessari. Nel primo caso parleremo di fonti statistiche. Quelle “ufficiali” (riconosciute e certificate allo scopo) possono suddividersi a seconda della natura dell’Ente che produce i dati, degli scopi per cui gli stessi sono prodotti e per il contesto (spesso territoriale) in cui sono ottenuti. Per quanto riguarda la natura dell’ente possono aversi:
Sono valori (quozienti) ottenuti da due quantità di cui almeno una è un dato statistico. Se riguardano grandezze omogenee permettono di non tenere conto dell’unità di misura. Sono molto utili per dare una descrizione del collettivo statistico e possono essere moltiplicati per una potenza del 10 per renderli piú facilmente leggibili. Abbiamo:
Gli indici statistici di centralità o medie, si prefiggono lo scopo di sintetizzare una serie di micro- dati o una distribuzione andando a costituire un informatore di collettivo. Riassumendo, per i caratteri qual. sconn. potremo usare solo la moda, per i qual. ord. moda, mediana e quantili, per i quantitativi invece dipenderà dal tipo di calcolo richiesto. Medie di posizione:
La maggior parte delle volte che si analizza un collettivo sono piú di uno i fenomeni da osservare, quindi, procediamo allo studio di due caratteri qualitativi alla volta. In questo caso la tabella prenderá il nome di tabella di contingenza e avrà tante righe quante le modalitá del primo carattere e tante colonne quante le modalità del secondo carattere. Nel caso in cui la tabella descrivesse caratteri quantitativi allora prenderebbe il nome di tabella di correlazione ; si chiamerà tabella mista nel caso in cui un carattere fosse qualitativo e l’altro quantitativo. Se, quindi, questa fosse la tabella univariata: Quella di contingenza rappresenterebbe l’analogo della distribuzione di frequenza fatta però in base alla presenza contemporanea delle modalità del primo e del secondo carattere. Nel caso in esame, prevedendo i caratteri 2 modalità ciascuno, avremo una tabella con 4 (2X2) celle in ciascuna delle quali indicheremo il numero di unità che si presentano con la relativa modalità di riga per il primo carattere e quella di colonna per il secondo. La tabella verrà poi completata con i totali di riga, di colonna e il totale generale (che dovrà coincidere con la numerosità del collettivo. Dopo i conteggi avremo la seguente situazione: I totali, 9, 11 e 20 sono le distribuzioni marginali della colonna; 8, 12 e 20 della riga. Per una dipendenza perfetta la tabella di contingenza dovrebbe essere quadrata.
Le tabelle in ipotesi di indipendenza comprendono dei valori ipotetici che ci si aspetta di vedere laddove al variare di una modalità del carattere non vanno a modificarsi le frequenze relative all’altro carattere; esse hanno gli stessi totali. Le frequenze si ottengono molitplicando del totale sulla riga corrisponende e il totale della colonna corrispondende e dividendo il risultato per il totale generale. Quindi, si avrà: 8x10/20, 8x11/20, e così via: Si chiamano contingenze gli scostamenti tra le frequenze realmente osservate e quelle che mi aspetto di vedere laddove tra i due caratteri non c’è relazione. Gli scostamenti, quindi, sono le contingenze e si calcolano facendo la differenza tra i valori della tabella in ipotesi di indipendenza e quella di contingenza iniale. Avremo: Adesso è possibile trovare il chi quadro.