



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla statistica, inclusi concetti come unità statistica, caratteri quantitativi e qualitativi, modalità, distribuzione unitaria, media aritmetica, proprietà media aritmetica, linearità, proprietà associativa, mediana, quantili, misure di variabilità e retta di regressione. Viene inoltre presentato il calcolo di media aritmetica, somma dei scarti e somma dei scarti quadrati.
Tipologia: Appunti
1 / 5
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Statistica: si occupa dei principi scientifici su cui si basa la raccolta (piano dell’esperienza), l’elaborazione (sintesi dei dati per la comprensione del fenomeno) e l’utilizzazione (uso dei risultati nella pratica) delle informazioni riguardanti fenomeni collettivi, raccolte con diversi criteri e sistemi
Statistica: demografica, economico-sociale, controllo statistico della qualità, psicometria
Statistica:
Definizioni:
Consideriamo un collettivo di N unita statistiche, dove si sia osservato il carattere X. Si chiama distribuzione statistica semplice o unitaria, l’insieme delle osservazioni relative alle N unita del collettivo. In simboli, la distribuzione semplice e’ indicata come x 1 , x 2 , ... , xn , dove x 1 e’ l’osservazione del carattere x nell’unita identificata dal numero 1, x 2 e’ l’osservazione del carattere x nell’unita identificata dal numero 2, e cosi via.
Proprietà sommatorie:
i = 1
n xi = n ⋅ k
i = 1
n
i = 1
n xi
i = 1
n
i = 1
n
i = 1
n
i = 1
n ( xi + yi ) :
i = 1
n
i = 1
n
i = 1
n yi
Distribuzione di frequenza: dato un carattere X, con modalità x 1 , x 2 , ... , xn , si definisce frequenza assoluta della modalità (^) xi ( i =1,2 , ... , h ) il numero di unita statistiche che presentano il carattere x con modalità xi
Frequenze assolute:
i = 1
h ni = n
Frequenze relative:
i = 1
h f (^) i = 1 → 1
h ni = 1 n
⋅ n = 1
Grafici:
Media aritmetica: dato un carattere x quantitativo e data la distribuzione unitaria x 1 , x 2 , ... , xn , si definisce
media aritmetica: μ= 1
n xi
Proprietà media aritmetica:
i = 1
n
i = 1
n
i = 1
n xi − n μ= n μ− n μ= 0
i = 1
n ( xi − c )^2 = min ⇔ c = μ
d
n ( xi − c )^2 = 0 → d
n [( x 1 − c )^2 +( x 2 − c )^2 + ...+( xn − c )^2 ]
2 ( x 1 − c )^2 −^1 ⋅(− 1 )+...+ 2 ( xn − c )^2 −^1 ⋅(− 1 )= 0 − 2 ( x 1 + x 2 +...+ xn )− nc = 0
i = 1
n xi − nc = 0 ⇒ c =
i = 1
n xi
n
⇒ c = μ
μ (^) y = 1
n yi = 1
n ( a + bxi )= 1 n
i = 1
n xi ]=^1 n
na + 1 n
i = 1
n xi = a + b ⋅^1
n xi = a + b μ
μ=
n 1 μ 1 + n 2 μ 2 +...+ nk μ k n
n
( x 1 +...+ xn 1 + y 1 +...+ yn 2 + z 1 + ...+ zn 3 )= 1
n xi + 1
n yi + 1
n zi =
n 1 μ 1 + n 2 μ 2 + n 3 μ 3 n
Mediana: e’ la modalità del carattere che occupa il “posto centrale” nella successione della distribuzione unitaria ordinata in ordine non decrescente; e’ quel valore che bipartisce la graduatoria delle osservazioni.
Quantili: permettono di dividere in N parti uguali la graduatoria delle osservazioni. Data una frazione
Funzione di ripartizione empirica: la funzione di ripartizione empirica F(x) associa a ogni numero reale x la frequenza cumulata relativa alla modalità x della variabile, ossia la proporzione di unita con modalità inferiore o uguale a x. Proprietà:
Per rappresentare l’associazione tra due caratteri qualitativi viene usata la distribuzione doppia di frequenza (tabella di contingenza). Per calcolare l’associazione/dipendenza tra due caratteri qualitativi si utilizzano: χ^2 , ϕ^2 ,V di Cramer Per calcolare la dipendenza tra un carattere quantitativo e uno qualitativo, si utilizza l’indice di dipendenza in media η^2 ; indica quanta parte della variabilità di Y e’ spiegata dalle modalità di X
Probabilità:
un evento E e’ un insieme di eventi elementari, ossia un sottoinsieme dello spazio campionario Ω esempio: ξ = “lancio una moneta 2 volte Ε = Testa o Croce Ω = {TT, TC, CC}
La probabilità e’ una funzione, P(), definita su una famiglia di sottoinsiemi Ω con proprietà:
∞
i = 1
∞ P ( Ei ) ne deriva che: ▪ P (∅)= 0 ▪ P ( A )∈[ 0 , 1 ] ▪ (^) se A ⊆ B , allora P ( A )≤ P ( B ) ▪ P ( A ∪ B )= P ( A )+ P ( B )− P ( A ∩ B ) ▪ P ( B )= 1 ⇒ P ( B ∩ A )= P ( A )→ P ( B )= 0 ⇒ P ( B ∪ A )= P ( A )
Teorema di Bayes: siano A 1 , A 2 , …, An una partizione di Ω e sia B un evento, allora:
P ( Ai ∣ B )=
P ( B ∣ Ai )⋅ P ( Ai )
i = 1
n P ( B ∣ Ai )⋅ P ( Ai )
dato un effetto (evento), qual e’ la probabilità di una certa causa P ( Ai ) : probabilità a priori P ( B ∣ Ai ) : verosomiglianza P ( Ai ∣ B ) probabilità a posteriori denominatore: verosomiglianza marginale
Un variabile casuale X e’ una funzione che associa a ogni risultato dell’esperimento un valore numerico. Le variabili casuali sono distinte in:
Variabili casuali discrete:
Variabili casuali continue:
Inferenza statistica:
a priori l’errore α , la decisione sarà errata nei confronti dell’errore di primo tipo al massimo di un valore pari a^ α^ , solitamente 0.05. Fissare l’errore garantisce al ricercatore che la propria decisione sarà sbagliata, nei termini dell’errore di primo tipo, al massimo nel 5% dei casi ◦ viene fatto un assunto secondo cui il fenomeno si distribuisce secondo una normale, segue una certa distribuzione probabilistica ◦ i parametri della distribuzione ( μ , σ ) non si conoscono, per stimarli si utilizza il dato osservato (campionario); si usano i dati a disposizione per dare una stima/approssimazione dei parametri della popolazione (stimatori) ◦ vengono definite le regioni critiche; la regione di rifiuto avrà l’area pari a α. Il limite dell’area, in caso di H 1 unilaterale destra e’ il quantile a livello 1 − α della distribuzione; in caso di H 1
−∞⇒ q^ α 2
e q 1 −^ α 2
⇒+∞ →solitamente si lavora con la normale standardizzata (unilaterale=1.64, bilaterale=1.96) ◦ si confronta il valore stimato rispetto a quella che e’ la curva si ipotizza descriva i dati; si osserva in quale regione il campione si colloca ◦ se il valore campionario cade nella regione di accettazione, si dirà che non si ha abbastanza evidenza sperimentale per rifiutare l’ipotesi nulla; se il valore cade nella regione di rifiuto, si rifiuta l’ipotesi nulla → rifiutare l’ipotesi nulla significa cambiare lo stato attuale delle cose