





















































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Dispensa Maorussia statistica scienze politiche
Tipologia: Dispense
1 / 93
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






















































































Universit`a della Calabria
Corso di Laurea in Scienze Politiche e Scienze dell’Amministrazione A.A. 2012/
Docente: Maroussa Zagoraiou [email protected]
Testo di riferimento: Cicchitelli 2008 Statistica-Principi e Metodi, Pearson Education
Ricevimento presso il Dipartimento di Scienze Economiche, Statistiche e Fi- nanziarie. Cubo 1/C - II piano.
Definizione: Scopi, risorse, periodo di riferimento, popolazione, unit`a statistiche, variabili di interesse
Raccolta Dati:
Costruzione della Matrice-Dati :
Descrizione e presentazione dati (Descrittiva):
Conclusioni generali (Inferenza):
Si tratta di dati in forma grezza riguardanti un cam- pione di 130 matricole della Facolt`a di Economia
Le risposte di ciascun studente alle varie domande del questionario (variabili di interesse) compaiono per riga
Su ogni studente sono state rilevate 50 variabili (domande del questionario)
N.B. Il data-set costruito in questo modo `e costituito da una matrice di dimensioni 130 × 50
z Ogni riga corrisponde ad una diversa unit`a statistica
z Ogni colonna rappresenta una variabile (che potrebbe aver subito delle opportune codifiche)
SESSO: m - Maschio f - Femminina
ETA’: in anni compiuti
DIPLOMA: 1 - Liceo Classico 2 - Liceo Scientifico 3 - Liceo Linguistico 4 - Istituto Magistrale 5 - Istituto Tecnico 6 - Ragioneria 7 - Altro
Tabella Paesi UE Paese Popola- Super- Anno di Temp. Forma di zione ficie ingresso media Governo nell’UE gennaio Austria 7,712 84 1995 1.8 Rep Belgio 9,950 30 1957 3.5 Mon Danimarca 5,140 43 1973 1.7 Mon Finlandia 4,986 338 1995 -2.2 Rep Francia 56,600 543 1957 5 Rep Germania 79,479 357 1957 1.8 Rep Grecia 10,123 131 1981 11.7 Rep Irlanda 3,503 70 1973 3.8 Rep Italia 56,800 301 1957 9.7 Rep Lussemb.o 381 3 1957 1.9 Mon Paesi Bassi 14,833 42 1957 3.1 Mon Portogallo 10,251 91 1986 12.5 Rep Regno Unito 55,487 244 1973 3.7 Mon Spagna 36,950 489 1986 6.5 Mon Svezia 8,559 450 1995 -1.2 Mon
FREQUENZA ASSOLUTA: Numero di unita statistiche, tra quelle osservate, che presentano una determinata modalita
NOTAZIONE USATA
X, Y variabili
xi, yi valore assunto dalle variabili X e Y sulla (i = 1,... , N) i–esima unit`a statistica
N numerosita campionaria totale (numero di unita statistiche osservate)
xj, yj modalit`a osservate delle variabili X e Y (j = 1,... , r)
r numero totale di modalit`a diverse tra loro osservate sul collettivo (r ≤ N)
nj frequenza assoluta della j–esima modalit`a (j = 1,... , r)
fj = nj/N FREQUENZA RELATIVA della j–esima (j = 1,... , r) modalit`a
Variabile X Distribuzione unitaria (seriazione) x 1 , x 2 ,... , xN
Modalit`a effettivamente osservate x 1 , x 2 ,... , xr
Distribuzione delle frequenze n 1 , n 2 ,... , nr assolute di X
Distribuzione delle frequenze f 1 , f 2 ,... , fr relative di X
∑r j=1 nj^ =^ N^
∑r j=1 fj^ = 1
Consentono di avere Consentono di fare confronti informazioni sulla di- e di analizzare la distribuzio- mensione di un feno- ne indipendentemente dalla meno numerosit`a dei dati
SESSO =⇒ VARIABILE QUALITATIVA (dicotomica)
xj nj fj maschio 62 0, femmina 68 0, totale 130 1
xj nj fj 1 22 0, 2 32 0, 3 24 0, 4 18 0, 5 16 0, 6 14 0, 7 4 0, totale 130 1
N.B. I valori numerici sono solo codici corrispondenti alle modalita (1= Liceo Classico): NON C’E’ ORDINE Pertanto le modalita nella tabella possono essere permu- tate a piacimento
(discretizzata... anno di nascita?)
xj nj fj 18 16 0, 19 78 0, 20 32 0, 21 o pi`u 4 0,
xj nj fj 60–69 20 0, 70–79 60 0, 80–89 30 0, 90-100 10 0,
xj nj fj nullo 25 0, scarso 20 0, medio 32 0, buono 28 0, elevato 25 0,
ATTENZIONE: L’operazione di suddivisione in classi comporta una perdita di informazioni. E’ il prezzo che occorre pagare per poter “leggere” i dati.
Si usa essenzialmente nel caso di variabili QUANTITATIVE (oppure qualitative ordinabili)
Dopo aver ordinato le modalit`a in ordine crescente:
Nj =
∑j s=1 ns^ Fj^ =^
∑j s=1 fs^ =^
Nj N Frequenze assolute Frequenze relative cumulate cumulate
Con riferimento alle modalit`a estreme, si noti che
N 1 = n 1 F 1 = f 1
Nr = N Fr = 1
Interpretazione: Nj e il numero di unita statistiche che hanno assunto una modalita minore o uguale a xj; Fje la corrispondente percentuale
SUDDIVISIONE IN CLASSI
Nj e il numero di unita statistiche che hanno assunto una modalita minore o uguale dell’ESTREMO SU- PERIORE xj della classe corrispondente xj− 1 a xj (strettamente minore se l’estremo superiore della classee escluso, ossia xj− 1 ` xj)
Distribuzioni di frequenze relative VARIABILI QUALITATIVE
Italia Settentrionale
Italia Centrale
Italia Meridionale
Italia Insulare
Area proporzionale alla frequenza
Popolazione italiana
Zone nj (in migliaia)
Italia Settentrionale 20. Italia Centrale 13. Italia Meridionale 12. Italia Insulare 6.
Totale 52.
Occorre calcolare il val- ore dell’angolo al cen- tro del settore corrispon- dente ad ogni modalit`a.
αj = 360 · fj
α 1 = 360 ·
' 137 o
α 2 = 360 ·
' 93 o
...
Esempio: SESSO
Attraverso i diagrammi a rettangoli separati `e possibile fare dei confronti tra due distribuzioni affiancando i ret- tangoli (attenzione, solo in termini di frequenze relative):
(oppure sovrapponendo i rettangoli)