



















































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla Statistica, definendo i concetti di fenomeno, unità statistiche, caratteri qualitativi e quantitativi, variabili statistiche, popolazione e indagine campionaria. Viene poi spiegato come costruire una distribuzione di frequenza e una distribuzione di frequenza congiunta di due caratteri. Infine, vengono presentati gli indici di posizione, ovvero la media aritmetica, la mediana e la moda.
Tipologia: Appunti
1 / 91
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




















































































STATISTICA: studio di fenomeni che si manifestano su una pluralità di soggetti. Fenomeno: oggetto di studio (es. reddito, spesa per consumo, titolo di studio…) UNITA’ STATISTICHE: soggetti su cui si manifesta il carattere Il carattere d’interesse, in generale, si manifesta in modo diverso su unità diverse (non viviamo in un mondo perfettamente uguale) Il valore che un carattere assume in corrispondenza di una certa unità lo chiameremo MODALITA’ DEL CARATTERE (per l’unità considerata) TIPOLOGIE DI CARATTERI - > classificazione dei caratteri
R modalità distinte: m 1 , m 2 , …, mk. (es. voti di statistica= 1,2…30L) Frequenza assoluta delle mi il numero di modalità della popolazione che possiedono modalità mi. (es. numero di persone che hanno preso 30). SI CHIAMA ni : numero di unità della popolazione che possiedono modalità mi. Modalità distinte Frequenza assoluta m 1 m 2 … mk n 1 n 2 …. nk n 1 +n 2 +nR=n Somma delle frequenze assolute= numero di unità della popolazione Per caratteri continui si usa spesso il raggruppamento in classi (di modalità). Ogni classe di modalità è un intervallo. Proprietà: ogni unità deve appartenere a una e una sola classe. Ciò significa che le classi devono essere:
Hi= ni/Ai Cos’è dal punto di vista intuitivo? Numero di unità che cadono in ciascun intervallo di spazio 1 in cui divido la classe, nell’ipotesi che le modalità delle unità siano uniformi dentro la classe (dalla più piccola alla più grande). Supponiamo che la classe abbia ampiezza Ai =5 (5 intervalli di ampiezza 1) e frequenza ni= 15 Hi= 15/3= 5
Supponiamo che su ciascuna unità della popolazione si rivelano le modalità non di uno solo ma di due caratteri (A, B). Ai= modalità del carattere A per l’unità i Bi= modalità del carattere B per l’unità i La distribuzione unitaria si costruisce così: 1 A,^2 A, …,^ hA modalità del carattere A 1 B,^2 B, …,^ kB modalità del carattere b nij=numero di unità che possiedono modalità (^) iA del carattere A e contemporaneamente modalità jB del carattere B^ =>questa si chiama^ frequenza assoluta^ congiunta^ delle modalità^ iA^ (es. colore degli occhi verdi) e (^) jB (es. titolo di studio licenza media). Le frequenze nij possono essere tutte poste nella c.d. tabella di contingenza. Se sommiamo tutte le frequenze congiunte della prima riga otteniamo la frequenza marginale della modalità 1 A (si legge A uno), la seconda riga della modalità 2… Se sommiamo nel senso delle colonne le frequenze congiunte otteniamo la frequenza marginale di 1 B.
Y così ottenuta è una trasformazione lineare di X. MEDIA ARITMETICA DI Y Y= aX+b Y= 1/n+ (y 1 +y 2 +…,yn) =1/n ( (ax 1 +b) + (ax 2 +b) + … + (axn+b) =1/n (ax 1 + ax 2 + …+ axn + b +b+ …+b) N volte =1/n ( a(x1+ x2+ …+ xn) + nb =a·1/n (x1+x2+…+xn)+ 1/n · nb =aX+b
=nX-nX= MEDIANA Consideriamo la solita distribuzione unitaria unità 1 2 … n Modalità di X X 1 x 2 … xn Per calcolare la mediana, poniamo in via preliminare le unità in ordine crescente di modalità X ( 1 )= modalità dell’unità con modalità più piccola X ( 2 )= modalità dell’unità con seconda modalità più piccola …. X (n)= modalità dell’unità con modalità più grande n= X 1 = X 2 = X 3 = X 4 = X 5 = Ordiniamoli dal più piccolo al più grande: 1 (x 1 ) 2 (x 2 ) 2 (x 3 ) => valore che occupa il posto centrale nei dati ordinati 3 (x 4 ) 6 (x 5 ) I dati statistici sono ordinati dal più piccolo al più grande Se n è il numero di unità della popolazione, definiamo:
- Range (CAMPO DI VARIAZIONE) INDICE DI POSIZIONE POCO INFLUENZATO DA VALORI ESTREMI: mediana INDICE DI VARIABILITA’ POCO INFLUENZATO DA VALORI ESTREMI: quartile Consideriamo un insieme di n unità statistiche su cui sono osservate le modalità di un carattere d’interesse x DISTRIBUZIONE UNITARIA UNITA’ 1,2,… ,i, ... n modalità x 1 ,x 2 ,…xi … xn Abbiamo già definito la mediana come la sequenza nella graduatoria ordinata dei dati ha posizione centrale Definiamo primo quartile (Q 1 ): il valore che lascia (nella graduatoria dei dati ordinati dal più piccolo al più grande) lascia a sinistra il 25% dei dati più piccoli e a destra il 75% dei dati più grandi PROFONDITA’ DELLA MEDIANA= (n+1)/ PROFONDITA’ DEL PRIMO QUARTILE: prof(Q 1 )= prof mediana+1)/ Dove con x indico la parte intera del numero x. Cioè il più grande intero minore o uguale a x 3,25= 10,99= 2 = Se x è intero, x=x Es. se n= 15 Prof (mediana)= (15+1)/2= Prof (Q 1 )= ( 8 +1)/2= 9/2= 4, Se n= Prof mediana= 16+1)/2=8, Prof (Q 1 )= (8,5+1)/2=4,
Definiamo Q 1 (=primo quartile) come il valore che nella graduatoria dei dati ordinati dal più piccolo al più grande:
Le osservazioni dentro il recinto interno le chiamiamo osservazioni nella norma, quelle fuori dal recinto interno le chiamiamo distanti dal centro. I dati oltre il recinto esterno li chiamiamo molto distanti dal centro Diagramma a barre (caratteri di natura qualsiasi) Si considerano le modalità e per ciascuna di esse si costruisce un rettangolo con altezza proporzionale alla frequenza della modalità corrispondente modalità frequenza a a … ak n n … nk
Tutti noi siamo chiamati a prendere decisioni in condizioni di incertezza: ovvero, la decisione può avere diverse condizioni possibili. L’esito della decisione può essere l’uno o l’altro di diversi risultati. Es. scelta di un investimento finanziario, scelta di una politica di marketing. L’incertezza riguarda l’esito del fenomeno, cioè il risultato. I fenomeni di interesse del calcolo delle probabilità sono caratterizzati da incertezza e sono formalizzati tramite la nozione di esperimento casuale. Chiameremo ESPERIMENTO CASUALE un qualunque fenomeno che può dar luogo a più “esiti”, a più risultati possibili. Quindi l’incertezza riguarda l’esito dell’esperimento casuale 22.02. ESPERIMENTO CASUALE: qualunque fenomeno sul cui esito c’è incertezza (es. andare a un esame universitario): ossia può avere l’uno o l’altro di diversi possibili esiti. I possibili esiti di un esperimento casuale sono detti “eventi elementari”. Indicheremo con S l’insieme di tutti i possibili eventi elementari di un esperimento casuale. S= spazio degli eventi
EVENTO= qualunque insieme di eventi elementari =qualunque sottoinsieme dello spazio degli eventi Esempio; consideriamo un Hotel. L’esperimento casuale consiste in questo: si chiede a un cliente di valutare la qualità dei servizi ricevuti da un hotel mediante un numero intero, da 1 (il minimo livello di qualità) a 7 (il massimo livello di qualità). S= 1,2,3,4,5,6,7. Ciascuno di questi numeri è un evento elementare. (evento) A=1,2,3 “poco soddisfatto” B=4,5,6 “abbastanza soddisfatto” C= 7 “molto soddisfatto” Esempio; consideriamo l’esperimento consistente nel lancio di un dado a 6 facce, in ognuna delle quali appare un numero di puntini da 1 a 6. Indichiamo lo spazio degli eventi come composto da: S= e 1 ,e 2 ,e 3 ,e 4 ,e 5 ,e 6 A= e 1 ,e 3 ,e 5 “evento in cui si ottiene un numero dispari di punti” B= e 2 ,e 4 ,e 6 “si ottiene numero pari di punti” In generale, per rappresentare gli eventi ricorriamo alla teoria degli insiemi. L’assunto di base è che ogni evento è un sottoinsieme dello spazio S degli eventi. S è il “più grande insieme che possiamo considerare” Gli elementi (“punti”) che costituiscono ciascun evento sono gli eventi elementari. Un evento A “si verifica” se il risultato dell’esperimento casuale è un evento elementare in A Sugli eventi definiamo le operazioni comuni che consideriamo sugli insiemi OPERAZIONI:
Consideriamo n eventi A 1 , A 2 , …, An Sono NECESSARI se la loro unione è lo spazio degli eventi S (se A 1 U A 2 U … U An= S) Sono INCOMPATIBILI se la loro intersezione non è formata da nessun evento elementare (se la loro intersezione è vuota) Se è l’evento che si verifica SEMPRE (S è anche detto EVENTO CERTO) La negazione di S (S periodico)= evento che non si VERIFICA MAI. = 0 evento impossibile) A e B sono incompatibili se AB= 0 Un’ultima relazione importante (MOLTO!) A,B eventi A= (AB) U (ABperiodico). QUESTI DUE EVENTI SONO INCOMPATIBILI Dove ABperiodico= A\B DEFINIAMO LA PROBABILITA’ non semanticamente, ma con le sue proprietà. Diamole la forma matematica giusta, ovvero quella assiomatica. S= spazio degli eventi A= evento (sottoinsieme di S) P(A) probabilità dell’evento A(NUMERO CHE QUANTIFICA IL “GRADO DI POSSIBILITA’” DI A) ASSIOMI (o postulati) DELLA PROBABILITA’ => ci dicono quali proprietà ha la probabilità senza dire cosa è la probabilità. I ASSIOMA= la probabilità di un evento è di un numero maggiore o uguale a zero qualunque sia l’evento A contenuto in S. P(A) maggiore o uguale a 0. II ASSIOMA= la probabilità dell’evento certo è 1. P(S)= III ASSIOMA= se A e B sono due eventi incompatibili (cioè se AB= 0 ) Allora P(A U B)= P(A)+ P(B) Il postulato 3 si estende a più di due eventi A,B,C EVENTI Se AB=0, AC=0, e BC= 0 Allora P(A U B U C)= P(A)+ P(B)+ P(C)p
Se A1, A2, …, An sono n eventi tali che due qualunque di essi sono incompatibili (A1, A2,…,An sono “due a due incompatibili”, ovvero tutte le coppie sono incompatibili) allora P(A1 U A2 U… U An)=P(A1)+P(A2)+…+P(An) NOTA: consideriamo due eventi A e B Abbiamo già visto che A = (A B) U (A Bperiodico) Questi due eventi sono incompatibili Dal postulato 3 quindi discende che: P(A)= P((AB) U (ABperiodico))= =P(AB)+P(ABperiodico) Es. numerico Un ristorante è aperto o a pranzo o a cena. Indichiamo con A l’evento “il cliente ordina vino” e con B “il cliente va a pranzo” indichiamo con la negazione di B “il cliente va a cena” La probabilità che un cliente che va a pranzo e ordini vino è 0, P(AB)=0, La probabilità che un cliente va a cena e ordina vino è 0, P(ABperiodico)=0, Come calcolare P(A) cioè la probabilità che un cliente (a pranzo o a cena non importa) ordini vino? La relazione che usiamo è: A= (AB) U (ABperiodico) e questi due eventi sono incompatibili (se va a pranzo non va a cena) Quindi se usiamo il terzo postulato: P(A)=P(AB)+ P(ABperiodico)= 0,13+0,26=0, PROPRIETA’ DELLA PROBABILITA’
si è verificato l’evento B. La domanda è: come si modifica la probabilità di A sapendo che si è verificato B? P(A|B) la probabilità dell’evento A condizionata a B Cioè: la probabilità di A essendo noto che si è verificato B DEFINIZIONE= P(A|B) = P(AB) / P(B) Al numeratore: eventi elementari che sono sia in A che in B Al denominatore: eventi elementari in B Questo è vero purché P(B) sia maggiore di 0 Nota: P(AB) = P(A|B) x P(B) = P(B|A) x P(A) Facciamo un esempio numerico. In un caso di omicidio ci sono due sospetti (A e B). La polizia li considera come “ugualmente probabili di essere colpevoli”, cosicché la probabilità che P (A colpevole) = P (B colpevole) = 0,5. Dopodiché la polizia trova sulla scena del delitto un reperto su cui ci sono tracce di DNA. P (risult test DNA|A colpevole) = 0, P (result test DNA|B colpevole) = 0, Cosa ci interessa? La probabilità che A sia colpevole avendo l’informazione sul test del DNA P(Acolpevole|risultato test DNA) e che B sia colpevole dato il risultato del test del DNA P(B colpevole|risultato test DNA). CALCOLIAMOCI QUESTE DUE P(A colpevole|risult test DNA)= P(A colpevolerisult test DNA)/ P(risult DNA) e lo stesso per B. P(A colpevolerisult test DNA)= P(A colpevole) x P (risult DNA|A colpevole) Cioè = 0,5 x 0,8= 0, P(B colpevolerisult test DNA)= P(B colpevole) x P (risult DNA)|B colpevole)= =0,5 x 0,5= 0, Osservazione: Acolpevole periodico (la negazione di A colpevole) significa dire B colpevole e viceversa RisultDNA= (risult DNA A colp) U (risult DNA A colpevole periodico) = (risult DNA A colp) U (risult DNA B colpevole periodico) QUESTI DUE EVENTI SONO INCOMPATIBILI DUNQUE P(risultDNA)= P(risult DNA A colpevole) + P (risult DNA B colpevole)= 0,40+0,25=0, P (A colp|risult DNA)= P (A colpevolerisultDNA) / P (risultDNA) = 0,40/0,65= 0, P (B colp|risult DNA)= 0,25/ 0,65= 0, DEFINIZIONE= due eventi A e B sono indipendenti se P(AB)= P(A) x P(B) Cosa significa?
Se A e B sono indipendenti, si ha che P(A|B)= P(AB) / P(B). Ma se sono indipendenti, al numeratore avrà P(A) x P(B). Quindi semplifico P(B) sopra e sotto e mi rimane =P(A). P(B|A) = P(AB) / P(A)= P(A) x P(B) / P(A) = P(B) Osservazioni: