Scarica Esercizi e Quiz di Statistica - Prof. Punzo e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!
FORMULARIO STATISTICA
N Unità statistiche X Carattere nj Frequenze assolute n o N=tot freq. 𝞓 Ampiezza delle CLASSI quantitativo continuo edx-esx 𝞓 Ampiezza delle CLASSI quantitativo discreto edx-esx+ fr Frequenze relative nj/n (tot freq. ass.) Cj Frequenze cumulate 1°=n1; 2°=n1+n2;3°=n1+n2+n3….. Fj Frequenze cumulate rel. Cj/n (tot freq. cum.) Rj Frequenze retrocumulate 1°=n ; 2°=n-n1; 3°= 2°-n Fj soprassegnato Frequenze retrocumulate rel. Rj/n fs Frequenze specifiche assolute CLASSI nj/ 𝞓 fs Frequenze specifiche relative CLASSI fr/ 𝞓 qj Cumulata di x*nj Xi/N, sommare dalla seconda in poi Qi fi Densità relativa fs/N GRAFICI NATURA SCALA CLASSI GRAFICO Qualitativo Nominale - Torta(pref.)/barre Qualitativo Ordinale - Barre(pref.)/torta Quantitativo discreto Rapporti/intervalli No Barre Quantitativo discreto Rapporti/intervalli Si Pettine Quantitativo continuo Rapporti/intervalli Si Istogramma
I caso “solo x” II caso “x e nj (freq)” III caso “x e nj con classi” MEDIA ARITMETICA M=∑x/N M=∑(xnj)/N M=∑(xinj)/N xi=(x1+x2)/2 (valore centrale) INDICI DI VARIABILITÀ:
- VARIANZA
- SCARTO QUADRATICO MEDIO
3) COEFFICIENTE DI
VARIABILITÀ
CV=𝞂/M (100=%) CV=𝞂/M (100=%) CV=𝞂/M (*100=%)
INDICI DI
POSIZIONE:
- MODA Se nessun valore si ripete la moda non esiste; la moda è la modalità che si ripete più volte. La moda è la modalità con la frequenza più alta La moda è la classe modale con la frequenza specifica più alta. fs=nj/𝞓;=x2-x
- MEDIANA
M
TOT=T TOT
Interpretazione dei punti sul diagramma: al tot% (pj) di con (es. reddito minore) spetta il tot% (qj) del totale (di N) RETTA DI REGRESSIONE: CODEVIANZA:
COVARIANZA:
Proprietà:
- : La somma delle ordinate effettive e è uguale a quella delle ordinate teoriche
- : La retta ai minimi quadrati passa per il punto di coordinate ( )
- : La covarianza fra la variabile residua Z e la variabile X è nulla. COEFFICIENTE DI CORRELAZIONE LINEARE: Commento: Vi è una forte/media/debole concordanza tra x e y. BONTÀ DI ADATTAMENTO - INDICE DI DETERMINAZIONE
DISTRIBUZIONI MARGINALI:
DISTRIBUZIONI PARZIALI:
Rispetto a x: tante tabelle per quante sono le righe Rispetto a y: tante tabelle per quante sono le colonne DISTRIBUZIONI MARGINALI RELATIVE: Sulle marginali si calcola la colonna delle frequenze relative CONTINGENZE ASSOLUTE: ⁃ Calcolo tabella frequenze teoriche —> ⁃ Calcolo tabella contingenza —>
FREQUENZE TEORICHE IN CASO DI INDIPENDENZA DISTRIBUTIVA:
Contingenze assolute: …
⁃ Se Cij=0 sempre, si ha indipendenza distributiva ⁃ Se Cij>0 vi è ATTRAZIONE: si sono osservate più unità statistiche di quelle che ci saremmo aspettati in caso di indipendenza distributiva. ⁃ Se Cij<0 vi è REPULSIONE ⁃ Contingenze relative—> VARIAZIONI RELATIVE
INDICE QUADRATICO DI DIPENDENZA DISTRIBUTIVA O INDICE DI
DIPENDENZA ASSOLUTA:
INDICE DI CONTINGENZA/ INDICE DI CRAMER/ INDICE DISTRIBUTIVO
NORMALIZZATO:
⁃ Se dividiamo Normalizziamo l’indice—> L’indice normalizzato indica che in media quadratica, le frequenze effettive differiscono da quelle teoriche di “0,1629”. L’indice normalizzato di dipendenza distributiva è pari al tot% del suo massimo valore teorico e denota una bassa/alta dipendenza distributiva. INDIPENDENZA DISTRIBUTIVA =>INDIPENDENZA IN MEDIA INDICE DI DIPENDENZA IN MEDIA O RAPPORTO DI CORRELAZIONE: (diverso da COEFFICIENTE DI CORRELAZIONE) ⁃ Calcolo della distribuzione marginale ⁃ Calcolo devianza totale ⁃ Calcolo delle medie parziali
1. P(A∪B)=P(A)+P(B)-P(A∩B)
2. P(A∩B)=P(A/B)×P(B)
3. P(A⎮B)=P(A∩B)/P(B)
- P(A∩B)= P(A)*P(B)
- P(A⎮B)=P(A)
- P(B⎮A)=P(B)
- P(A∪B)=P(A)+P(B) SPAZIO CAMPIONARIO Ω: Insieme formato da tutte le possibili coppie ordinate derivanti dal caso tenuto in esame. Ex: Ω={(AB),(AC)….} E= evento che voglio calcolare, insieme formato da tutte le coppie che soddisfano la mia richiesta P= probabilità dell’evento, n° di coppie di E/n° di coppie totali E/N FUNZIONI: ⁃ Funzione di probabilità: è quel grafico, per variabili discrete, in cui ad ogni PX=x ascisse, si associa una p(x) ordinate ⁃ Funzione di ripartizione: F(x)=P(X≤x) (discreta) L’ordinata della funzione di ripartizione calcolata nel punto x∈R indica pertanto la probabilità per cui X assume valori non maggiori di x. CURVA NORMALE I CASO Elementi noti x= evento che voglio calcolare 𝝻= media 𝞂= scarto x>p z=+ p=1-𝚽z=- p=𝚽 x<p z=+ p=𝚽 z=- p=1-𝚽 z+ e z+ p<x<p —> P=𝚽max-𝚽min; z+ e z-⎬P=𝚽 −(1-𝚽 )₊ ₋ z- e z- CURVA NORMALE II CASO %>5% n>
Elementi noti p= tot% n= popolazione campione ⁃ Calcolo 𝝻= np [E(x)= valore atteso] ⁃ Calcolo 𝞂= √np(1-p) ⁃ Calcolo 𝞂 = np*(1-p)² ⁃ Agisco come nel caso I DISTRIBUZIONI DI PROBABILITÀ: Funzione Di Ripartizione: Parametri Della Funzione Di Probabilità: BINOMIALE %>5 n≤ Elementi noti caso I p= tot% n= popolazione campione x= evento da calcolare
- Gli eventi elementari comprendono tutte le possibili combinazioni;
- La probabilità= evento/ totale eventi= 1(sempre)/N
- Valori della variabile= quante volte c’è lo stesso elemento x nella stessa combinazione (TTTCT: 4 volte testa)
- Probabilità= identica all’altra
- Numero di frequenze X=xj —> numero di combinazioni con xj (numero di teste)
- Probabilità delle singole frequenze: —> 1/ combinazioni (es: 1/22)
- P(xj)= Numero di frequenze * Probabilità della singola frequenza
STIMA PUNTUALE
STIMA PUNTUALE DELLA MEDIA:
- x = è stimatore puntuale di 𝝻
- E(X)=𝝻 (aspettativa coincide con la media 𝝻 della popolazione)
- Var(Xi)=𝞂²
- Var(X)= La varianza della media campionaria x è inversamente proporzionale alla numerosità del campione STIMATORI:
- Proprietà della NON distorsione E(T)= 𝛩
- Distorsione:
- E(T)> 𝛩 distorsione positiva
- E(T)< 𝛩 distorsione negativa Commento: Lo stimatore T fornisce mediamente valori t maggiori/minori di 𝛩 VARIANZA CAMPIONARIA CORRETTA
INTERVALLI DI CONFIDENZA
I CASO I.C. ( 𝝻 , 1- 𝛂 ), 𝞂 ² noto
- X= media 𝝻
- Dato (1-𝛂) calcolo (1-𝛂/2) :
- Cerco sulle tavole
- 𝞂= scarto
- N= osservazioni II CASO I.C. ( 𝝻 , 1- 𝛂 ), 𝞂 ² NON noto, n<
- X= media 𝝻
- t= p(t) si cerca sulle tavole di t student
- s²= varianza campionaria corretta
- n= osservazioni
- Dato (1-𝛂) calcolo ( )
- Cerco sulle tavole
- Calcolo s²=
- Applico la formula, scrivo l’intervallo [ ] Commento: l’intervallo di confidenza conterrà al suo interno la vera ma incognita media 𝝻/proporzione p con probabilità del tot%
III CASO I.C. ( 𝝻 , 1- 𝛂 ) 𝞂 ² NON noto, n≥
- X= media 𝝻
- 𝞂²= varianza campionaria corretta
- N= osservazioni
- Calcolo s²=
- Dato (1- 𝛂) calcolo ( ) cerco P(Z) sulle tavole
- Applico la formula, scrivo l’intervallo [ ] IV CASO I.C. (p, 1- 𝛂 ) n<
- p= frequenza relativa campionaria
- n= osservazioni
- Dato (1-𝛂) calcolo ( ) cerco P(Z) sulla tavola
- Applico la formula, scrivo l’intervallo [ ] V CASO I.C. (p, 1- 𝛂 ), n≥
- p= frequenza relativa campionaria
- n= osservazioni
- Dato (1-𝛂) calcolo ( ) cerco P(Z) sulla tavola
- Applico la formula, scrivo l’intervallo [ ] AMPIEZZA DELL’INTERVALLO: 𝞓=Estremo dx – Estremo sx 𝞓= 𝞓=
- Confronto Zoss con Z ₁₋α; se Zoss è MAGGIORE allora rifiuto l’ipotesi, viceversa accetto. II CASO TEST SU 𝝻 CON 𝞂 ²INCOGNITO ED n< 1- H : 𝝻o= TOT₀ VS H :𝝻o< TOT₁
- Calcolo Toss
- Calcolo regione di rifiuto R=
- Confronto Toss con t ; se Toss è MINORE rifiuto l’ipotesi nulla, viceversa accetto. 2- Ho: 𝝻o=TOT VS H : 𝝻o≠TOT₁
- Calcolo Toss=
- Calcolo regione di rifiuto R=
- Confronto Toss con la regione di rifiuto; se Toss appartiene alla regione di rifiuto sono portato a rifiutare l’ipotesi nulla, viceversa accetto. 3- Ho: 𝝻o=TOT VS H : 𝝻o> TOT₁
- Calcolo Toss=
- Calcolo regione di rifiuto R=
- Confronto Toss con t , se Toss è MAGGIORE rifiuto l’ipotesi nulla, viceversa accetto. III CASO TEST SU 𝝻, 𝞂 ²INCOGNITO ED n ≥ 1- H : 𝝻o= TOT₀ VS H :𝝻o< TOT₁
- Calcolo Zoss=
- Calcolo regione di rifiuto R=
- Confronto Toss con t ; se Toss è MINORE rifiuto l’ipotesi nulla, viceversa accetto. 2- Ho: 𝝻o=TOT VS H : 𝝻o≠TOT₁
- Calcolo Zoss=
- Calcolo regione di rifiuto R=
- Confronto Toss con la regione di rifiuto; se Toss appartiene alla regione di rifiuto sono portato a rifiutare l’ipotesi nulla, viceversa accetto. 3- Ho: 𝝻o=TOT VS H : 𝝻o> TOT₁
- Calcolo Toss=
- Calcolo regione di rifiuto R=
- Confronto Toss con t , se Toss è MAGGIORE rifiuto l’ipotesi nulla, viceversa accetto. IV CASO TEST SU p 1- H₀:po=TOT vs H₁:po<TOT
- Calcolo Zoss=
- Calcolo regione di rifiuto R=
- Confronto Zoss con Z𝝰, se Zoss è MINORE rifiuto l’ipotesi, viceversa accetto. 2- Ho:po=TOT vs. H₁:po≠TOT
- Calcolo Zoss=
- Calcolo regione di rifiuto R=
- Confronto Zoss con la regione di rifiuto, se Zoss appartiene alla regione di rifiuto allora sono portato a rifiutare l’ipotesi nulla, viceversa accetto 3- H₀:po=TOT vs H₁:po>TOT
- Calcolo Zoss=