Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Unipi 5511PP, Appunti di Statistica

Contiene la sintesi del libro, le domande più ricorrenti alla teoria, gli esercizi in parte risolti del libro. Utile per l'esame.

Tipologia: Appunti

2022/2023

Caricato il 10/09/2023

marco.farulli
marco.farulli 🇮🇹

4.4

(20)

17 documenti

1 / 38

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
pag. 1
Statistica Esame Pacini 551PP
In azzurro le domande di teorie più comuni.
In verde come riconoscere il problema.
In rosso come risolvere il problema
In cosa consiste l’esame.
Tempo 1 h 30 - Foglio di cinque esercizi e due domande di teoria
Foglio con Tabella V, Tabella VI e Tabella VII. presente tabellina livelli di confidenza e significatività libro.
Ogni esercizio vale sei punti. Attenzione ogni risposta sbagliata -1, mancata risposta 0.
Consiglio fare la brutta a lapis, considerate tempo di ricopiatura in bella minimo 15 minuti.
Consiglio, se non si sa la soluzione dell’esercizio lasciarlo in bianco e proseguire per non perdere tempo.
Tipi di esercizi.
- Calcolare moda, media, mediana e disegnare box-plot di una distribuzione semplice o a gruppi.
- Calcolare media e percentuale di una distribuzione a classi.
- Calcolare valori medi e percentuali di una distribuzione a frequenza doppia
- Costruire una distribuzione marginale di frequenza relativa da una tabella
- Determinare il grado di dipendenza da una distribuzione condizionata
- Determinare la probabilità.
- Disegnare diagramma di dispersione e calcolare grado di correlazione
- Determinare probabilità media di una distribuzione normale.
- Determinare stima della media con costruzione intervallo di confidenza.
- Determinare stima della media data una distribuzione con costruzione intervallo di confidenza.
- Test di ipotesi data la significatività.
Argomenti da NON studiare.
- Capitolo 1.4 Campionamento stratificato.
- Capitolo 3.2.5 Disuguaglianza di Chebyshev
- Capitolo 5.5 Calcolo combinatorio
- Capitolo 6.2 Probabilità calcolo binomiale
- Capitolo 7.4 e 7.5 Distribuzione binomiale
- Capitolo 11.1 No Test Chi-quadro
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26

Anteprima parziale del testo

Scarica Statistica Unipi 5511PP e più Appunti in PDF di Statistica solo su Docsity!

Statistica Esame Pacini 551PP

In azzurro le domande di teorie più comuni. In verde come riconoscere il problema. In rosso come risolvere il problema In cosa consiste l’esame. Tempo 1 h 30 - Foglio di cinque esercizi e due domande di teoria Foglio con Tabella V, Tabella VI e Tabella VII. presente tabellina livelli di confidenza e significatività libro. Ogni esercizio vale sei punti. Attenzione ogni risposta sbagliata - 1 , mancata risposta 0. Consiglio fare la brutta a lapis, considerate tempo di ricopiatura in bella minimo 15 minuti. Consiglio, se non si sa la soluzione dell’esercizio lasciarlo in bianco e proseguire per non perdere tempo. Tipi di esercizi.

  • Calcolare moda, media, mediana e disegnare box-plot di una distribuzione semplice o a gruppi.
  • Calcolare media e percentuale di una distribuzione a classi.
  • Calcolare valori medi e percentuali di una distribuzione a frequenza doppia
  • Costruire una distribuzione marginale di frequenza relativa da una tabella
  • Determinare il grado di dipendenza da una distribuzione condizionata
  • Determinare la probabilità.
  • Disegnare diagramma di dispersione e calcolare grado di correlazione
  • Determinare probabilità media di una distribuzione normale.
  • Determinare stima della media con costruzione intervallo di confidenza.
  • Determinare stima della media data una distribuzione con costruzione intervallo di confidenza.
  • Test di ipotesi data la significatività. Argomenti da NON studiare.
  • Capitolo 1.4 Campionamento stratificato.
  • Capitolo 3.2.5 Disuguaglianza di Chebyshev
  • Capitolo 5.5 Calcolo combinatorio
  • Capitolo 6.2 Probabilità calcolo binomiale
  • Capitolo 7.4 e 7.5 Distribuzione binomiale
  • Capitolo 11.1 No Test Chi-quadro

Media popolazione e Media popolazione dati raggruppati: Media campionaria e Media campionaria dati raggruppati: Attenzione! una distribuzione classica è così: 2,4, 5,5,7,9, Una distribuzione per dati raggruppati diventa: 2-1 4-1 5-2, 7-1, 9-1, 12- 1 La Frequenza relativa = frequenza assoluta / n , dove n è la somma delle frequenze assolute. Nel caso di raggruppati col calcolo media e varianza non si ha il valore esatto Calcolare la Mediana di una distribuzione raggruppata : Ordinare crescente, Cumulare le sole frequenze, la Mediae è alla posizione del’ultimo risultato+1 /2 se dispari; invece se pari è la posizione intermedia tra n/2 e n+1/2. Calcolare la moda di una distribuzione raggruppata: La moda è la modalità con la frequenza più numerosa, contare quante volte non sommare. Istogramma. La base sono gli estremi della classe e l’altezza è la “densità di frequenza”, frequenza / ampiezza classe doe ampiezza classe è limsup-liminf classe.

  • Nell’istogramma la base rappresenta? L’ampiezza di classe.
  • Nell’istogramma l’altezza rappresenta? La frequenza / ampiezza classe
  • Il box-plot? Si può costruire solo per cratteri quantitativi ( discreti o continui).
  • La lunghezza della scatola del box-plot corrisponde? allo scarto diffenrenza interquartile
  • Area sottesa tra primo e terzo interquartile? 50%
  • Sottraendo una costante c da tutte le modalità di X la media? si riduce di c
  • Per trasfomazioni dei dati X+a con a<0? La varianza non cambia la media si riduce
  • Se popolazione media=80 e deviazione=18? campione di n=36 media=80 e deviazione=
  • La somma delle frequenze relative è? 1
  • Dalla frequenza relativa si può risalire alla frequenza assoluta purché si conosca? La numerosità
  • Strumenti grafici per rappresentare carattere qualitativo? Diagramma a barre
  • Nel caso Media superiore alla mediana? la distribuzione è asimmetrica positiva a destra
  • la media di una variabile qualitativa? Non si può mai calcolare
  • la media aritmetica è espressa? nella stessa unità di misura della variabile
  • La media rende nulla la somma di? Degli scarti (differenza tra osservazione e media) stimatore
  • L’unità di misura in cui è espressa la media è? Uguale al fenomeno oggetto di studio.
  • Per una variabile quantitativa X la media è? Un valore tra minimo e massimo osservato
  • Dalla media di due sottogruppi, si può ricavare la media della popolazione? Sì, se è nota la numerosità dei due gruppi.
  • L’asimmetria di una distribuzione può essere negativa? Si dipende dai dati
  • Secondo e terzo quartile possono coincidere? Sì, in alcuni casi
  • La mediana è preferita alla media perché? È meno sensibile ai valori estremi

Il coefficiente di variazione è la: ( deviazione standard / media ) * 100.

  • Il coefficiente di variazione è? È una misura di variabilità relativa DevStd/media * Forma distribuzione: confrontare media con mediana, se sono uguali è simmetrica, se media maggiore mediana asimmetrica positiva coda a destra, se media minore mediana asimmetrica negativa coda a sinistra.

CORRELAZIONE.

  • Se per due caratteri quantitativi X e Y risulta rxy = - 1 allora? La retta di regressione riproduce esattamente i dati osservati
  • il coefficiente di correlazione lineare è? Valore tra - 1 e 1
  • Un valore del coefficiente di correlazione pari a 1 significa? Perfetta associazione lineare
  • Se X e Y risultano X^2 =0 e r=1? No, se X e Y sono indipendenti r=
  • Se due caratteri X e Y risulta x^2 =0 allora? I due caratteri sono indipendenti
  • Un coefficiente di correlazione - 1 significa? Perfetta associazione lineare inversa
  • Se per due caratteri quantitativi X e Y, X^2 = 0 allora? I due caratteri sono indipendenti
  • Si ritiene plausibile che, se X e Y risulti X^2 =0 e R^2 = 1? NO, se X e Y sono indipendenti R^2 =
  • Si ritiene plausibile se X e Y risulti X^2 e R^2 =1? No, Sono statisticamente indipendenti e R^2 = Il coefficiente di correlazione Retta di regressione ai minimi quadrati.
  • Il coefficiente 1,2 nella retta y = 1,2+0,4x è? 1,2 è Il punto di incontro con le ordinate.
  • Il coefficiente 0,4 nella retta y=1,2+0,4X è? La pendenza della retta, coefficiente angolare
  • Quando il coefficiente angolare è 0, il coefficiente di correlazione lineare? Coefficiente 0
  • il coefficiente angolare della retta di regressione? Indica quanto varia Y all’aumentare di X
  • Operando trasformazione lineare di y=0,5+ 2 x con varianza 5,8? varianza y 2,9 (5,8/2)
  • Nella retta di regressione il termine osservazione influente? Un’osservazione che modifica la retta.
  • il termine residuo si intende? Differenza tra valore osservato e variabile risposta
  • Se nella regressione lineare la devianza residua è 0 allora? I punti sono allineati alla retta di regressione

LE PROBABILITÀ.

Che possa accadere A o B o entrambi: Che possa accadere A e B, sia A che B:

  1. La regola dell'addizione o somma: se due eventi sono:
  • disgiunti o incompatibili allora: Pr (A o B) = Pr(A)+ Pr(B) *disgiunti se non hanno risultati comuni.
  • compatibili allora: Pr (A o B) = Pr(A)+ Pr(B) - Pr (A e B)
  • Nella regola generale della probabilità la regola della somma? P(AoB) incompatibili
  • Due eventi A e B, A 0,3 e B 0,7 incompatibili o disgiunti, che esca A o B? A+B Pr (AoB) = 1
  • A e B sono eventi incompatibili PA 0,5 e PB 0,3 quanto vale AoB? 0.
  • Due eventi A e B incompatibili A0,4 e B0,2 allora? AuB = 0,
  • Se Ae B sono incompatibili e A0,3 e B0,7 allora? AuB = 1
  • Due eventi A e B sono incompatibili, vale il seguente risultato? PA) +P(B)
  • Se A e B A0,6, B0,4 e AeB=0,2: AoB? 0,6+0,4-0,2= 0,
  1. probabilità condizionata regola della moltiplicazione, se due eventi sono:
  • qualsiasi A e B si influenzano allora: P(A|B) = PB e PA / PB attenzione!
  • A e B sono disgiunti (AB=Ø) segue P(B|A) =0 e P(A|B) =0 poiché il verificarsi di un evento esclude il verificarsi dell’altro.
  • P(A|B) sono indipendenti, la probabilità di un evento non influenza l’altro: P(A|B) è = P(A)
  • La probabilità condizionata P(B|A) per eventi indipendenti A0,3 B 0,5? P(B|A) =P(B) 0,
  • La probabilità condizionata P(B|A) per eventi disgiunti A 0,7 e B 0,15? P(B|A) =
  • La probabilità condizionata P(A|B) è pari P(A) se? sono eventi indipendenti P(A|B) =P(A)
  • Se probabilità condizionata P(B|A) = P(A)? quando sono indipendenti
  1. La regola della moltiplicazione: se due eventi sono:
  • qualunque allora Pr (A e B) = PA * P(B|A)
  • indipendenti alllora PA e PB = Pr(A) * Pr(B) Due eventi si dicono Indipendenti se la probabilità che accada A non influenza la probabilità che accada B. Se il 20,9% sono fumatori e il 33,4% sono donne, che probabilità che una donna fumi? 0,209*0,334=0,
  • Nella regola generale della probabilità la regola del prodotto? P(AeB) se indipendenti
  • Due eventi A e B indipendenti A0,4 e B0,2 allora? AeB = 0,
  • Due eventi A e B, A 0,45 B0,15 indipendenti che esca A e B, si ha? A*B = Pr(AeB)= 0,
  • Se A e B eventi indipendenti P(A)0,7 e P(B)0,5 allora? 0,
  • Se A e B sono indipendenti? A e B = P(A)*P(B)
  • Due eventi A e B indipendenti? P(A) * P(B)
  • Due eventi indipendenti A 0,4 e B 0,2 allora? PeA = 0,
  1. Evento complementare quando si calcola la probabilità che non accada. P(A) = 1- P(B) i due eventi sono incompatibili.
  • Se A e il complemento di A? sono eventi incompatibili disgiunti.
  • Dati un evento A e il complemento di A possiamo dire che? Sono eventi incompatibili
  • Due eventi A e B sono incompatibili quando? Non possono verificarsi contemporaneamente.
  • Due eventi si dicono incompatibili quando? Il verificarsi di uno esclude l’altro

RIEPILOGO

Distribuzione normale - Variabile casuale X distribuita normalmente. Usare valore critico tabella V indicato da Z

  • Una variabile standardizzata ha media pari a? 0
  • La curva normale si modifica se? sia se cambia la media che la varianza.
  • Una variabile casuale normale possiede sempre? Due code simmetriche
  • Uno stimatore incognito della popolazione si dice correttore se? non sovrastima o sottostima
  • Dato un valore di variabile quantitativa X, il punteggio Z è? (x-mu) /delta
  • Una distribuzione normale standardizzata obbedisce a? 68% tra +1delta e - 1 delta
  • Curva normale valore Z=0.10? - 1,
  • Curva normale valore Z=0,67? 0, Il problema indica che: è una variabile casuale X distribuita normalmente.
  • indica la media e la deviazione standard della popolazione
  • chiede di calcolare la probabilità che X sia maggiore o minore della media popolazione Risolvere: 1° Calcolare il valore critico di Ztest , vedi formula ( x0 – mu ) / delta 2° Dalla Tabella V “distribuzione normale” ricavare l’area di probabilità a sinistra sulla riga Ztest 3° Se chiede maggiore o almeno, sta a destra della curva, cioè 1 - valore Infine Se chiede il numero esatto di n, moltiplicare la probabilità per n Distribuzione normale: moda, mediana e media sono le stesse. La curva normale è simmetrica rispetto alla media, la sua area è 1, media = 0 e deviazione standard = 1 si può standardizzare la variabile continua come fosse una variabile casuale normale finita. L’area sottesa dalla curva normale standardizzata si avvicina a zero ma mai 0, e dall’altra parte si avvicina a 1 mai 1. Quindi massimo 99 e 100 percentili sono uguali. Un evento è raro se sotto il 5%.

8 Distribuzione della media campionaria. Con varianza/scarto quadratico nota.

**- La media campionaria? coincide con la media della popolazione

  • Media e varianza campionaria, sono pari a? mu = mu e delta**^2 =delta^2 /n oppure delta=s/rad(n) Se al posto della popolazione e di una distribuzione normale abbiamo una distribuzione campionaria, la media è la stessa ma la deviazione standard si riduce a: sigma / radice di n per calcolare Z. L’ampiezza campionaria però deve essere >= 30 campionature. quindi: Il problema indica variabile casuale X, ci dà la media e la deviazione standard (o varianza). Poi ci dà la dimensione n del campione. Chiede calcolare probabilità che media campione > o < di X. Per calcolare quanti siano moltiplicare il numero di campioni per la probabilità. Risolvere con deviazione standard conosciuta: 1° Calcolare il valore critico Z del campione, formula: z: (x-mu) / ( scarto quad / rad( n)) 2 ° Rilevare sulla riga di Z (Tabella V) l’ara di Z (se chiede minore l’area di probabilità è quella) 3 ° Se chiede maggiore fare 1-area, se chiede tra due probabilità fare la differenza se chiede almeno significa minore uguale, quindi l’Area trovata che è a sinistra. Esempio media =100 deviazione = 15, se abbiamo campione di 10, calcolare probabilità media campionaria a 110: su 100 campioni di 10 individui, 2,11 avranno probabilità > 110.

Capitolo 9 stima della media e intervalli di confidenza.

**- I test bilaterali possono essere condotti da intervalli di confidenza? Si

  • L’ampiezza dell’intervallo di confidenza per la media? è tanto minore quanto maggiore è alfa** La stima puntuale è il valore che fornisce il valore di un parametro (media o deviazione std o proporzione) e consiste in un margine di errore in + o - (detto confidenza, cioè, confidiamo che la media rientri in una certa percentuale) rispetto alla media della popolazione incognita. Perché con la media campionaria commettiamo un errore; quindi, ci prendiamo un margine di errore la confidenza. Il livello di confidenza è un valore alfa esempio 95% cioè, alfa=0,05, dalla formula: (1-alfa) * 100% è la confidenza, cioè il margine di errore.
  • Se aumentiamo la confidenza, essendo un errore, l’errore che possiamo commettere aumenta.
  • Se aumentiamo l’ampiezza n invece l’errore diminuisce Questa tabella Z serve per calcolare il valore critico Z sia nel caso si conosca la deviazione standard della popolazione sia nel caso si stimi la proporzione.

1 Stimare la media della popolazione quando si conosce la media e la deviazione standard della popolazione. Non serve usare la tabella V normale, si usa la tabella di confidenza fissa. Come si modifica intervallo di confidenza passando da 95 al 90%? Si riduce ampiezza Premesso che: n >= 30 campioni oppure che la distribuzione sia normale Il problema si riconosce dagli altri perché presenta il valore della confidenza (90%-95%-98%)

  • propone la media campionaria x, la numerosità n, e soprattutto la deviazione standard della popolazione.
  • chiede di calcolare l’intervallo di confidenza della media campionaria rispetto alla media popolazione. Si calcola così: Zalfa/mezzi (preso dalla tabella confidenza) * scarto/radice(n)
  • il risultato si somma e sottrae alla media campionaria. Come r isolvere esercizio: Premessa: Se fornisce solo la distribuzione calcolare la media e la deviazione standard dal campione. 1 ° Si identifica il valore critico della confidenza dalla tabellina di confidenza, senza calcolarlo. 2° Si moltiplica il valore critico Z allo scarto ( scarto/radice n ) 3° Si aggiunge e toglie alla media il valore trovato, ottenendo la distanza dalla media della popolazione.

3 Stima puntuale della frequenza relativa sulla proporzione della popolazione. Per poter usare la tabella dei valori critici intervallo di confidenza serve premettere che:

  • Il campione casuale deve avere n * p * (n-p) => 10
  • la numerosità n sia inferiore al 0,05 della popolazione Il problema si riconosce perché:
  • indica la numerosità, la media campionaria e la percentuale della confidenza.
  • si riconosce perché indica di cui e che serve a calcolare la stima della proporzione. Come r isolvere esercizio: 1° Calcolare p^ =x / n, cioè, numero casi/n sul campione 2° Verificare la premessa che: n * p (1-p ) > 10 e che n < 0,05 popolazione 3° Identificare il valore critico Z dalla tabella intervallo di confidenza 4 ° Con Z calcolare l’errore: Z * sqrt ( p^ * ( 1-p ) / n 5° Calcolare l’intervallo di confidenza p^ + o – l’errore Calcolare Ampiezza campionaria. Attenzione l’ampiezza campionaria per approssimare alla distribuzione normale basta sia >= 30. Si riconosce perché il problema indica oltre all’errore, solo la confidenza e lo scarto quadratico, oppure la confidenza e la proporzione p.
  • Definire la percentuale di margine di errore E, esempio 3% è E=0,03. Formula per il campione: Formula per la proporzione: Serve usare la tabella Z 90, 95 e 99% con i relativi valori critici.

La Verifica delle ipotesi capitolo 10. La significatività.

  • Cosa indica il livello di significatività? La probabilità di compiere errore tipo I°
  • Il livello di significatività di un test? È la probabilità dell’errore di primo tipo.
  • Test significativo al 5% decisione? Si rifiuta H 0
  • Si commette errore di I° tipo quando? Si rifiuta H 0 se è vera.
  • Si commette errore di seconda specie quando? Non si rifiuta ipotesi nulla H 0 mentre vera H 1
  • Se la probabilità di rifiutare H 0 è pari a 0,05 la probabilità di accettare H 0 è? 1-0,05 quindi 0, Il livello di significatività (alfa) è l’ errore I° tipo è la probabilità di rifiutare l’ipotesi nulla H 0 quando è vera. L’errore di I° tipo può essere 0,05 oppure 0,10 o 0, Errore tipo I: rifiutare H 0 ipotesi nulla se vera.

Tabella Test – livello di significatività, attenzione è già alfa mezzi, la significatività qui non va divisa per 2. Il problema chiede di verificare un’ipotesi con livello di significatività alfa.

  • indica il valore della media e, dello scarto quadratico della popolazione.
  • indica la numerosità del campione n e la media del campione - richiedere di verificare se la media del campione è maggiore, minore o diversa dalla media popolazione Come risolvere: 1° Impostare l’ipotesi nulla H0 e l’ipotesi alternativa H1. 2° Ipotesi nulla H0= media popolazione 3° ipotesi alternativa H1 > media o H1 < media o H1 <> media , popolazione 4 ° reperire dalla tabellina significatività il valore critico Z che confuta H0 a > , < o <> , in base ad alfa 5 ° calcolare il valore Z test dalla formula Ztest = ( Xmediacampione – MediaH0) / (delta / rad( n)) 6° confrontare il valore Ztest con il valore critico di significatività che confuta H METODO CLASSICO. Verifica delle ipotesi se la deviazione standard della popolazione NON è nota. Nel caso deviazione standard NON nota, si usa la distribuzione T Student con gl = n-1. Sempre numerosità campionaria deve essere > 30. In questo caso di delta non noto si usa la tabella Tstudent ma non alfa mezzi, con gl = n-1 per trovare l’area. Attenzione! non si usa la tabellina di livello di significatività ma si deve trovare nella tabella. VI

Il problema propone un livello di significatività alfa come valore critico. Indica la numerosità n, indica la media della popolazione ma NON indica la deviazione della popolazione ma indica la media campionaria e la deviazione campionaria. Chiede di verificare una certa ipotesi <, > oppure <>. Come Risolvere: 1° Proporre un’ipotesi dove H0 è la media, H1 è l’ipotesi contraria >, < o <>. 2° Trovare il valore critico di significatività nella tabella VI, incrocio gl (n-1 ) e alfa ( non mezzo ) 3° Calcolare il valore critico T test con la formula: (X – H0 ) / ( s / rad( n) ) 4° Confrontare il valore Ttest con il valore critico di significatività, in base a > < o <>. METODO CLASSICO. Verifica delle ipotesi per una proporzione della popolazione Il campione deve essere casuale semplice e deve essere che n * p * ( 1 – p ) >= 10 e valori campionari indipendenti. Ricordiamoci che si usa la tabella Test di livello significatività che indica il valore critico di rifiuto e non la t test.

  • la media Up^ = p
  • la deviazione Deltap^ = sqr ( p (1-p) / n ) Il problema propone la verifica di una probabilità. Indica la numerosità campionaria n e anche un valore X di cui. Poi indica il livello di significatività alfa mezzi che vuole usare come test. Infine chiede di verificare una percentuale, solitamente la metà.