























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
domande di tutti gli esami passati di statistica
Tipologia: Sintesi del corso
1 / 31
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
























1. L'impostazione assiomatica al calcolo della probabilità L'approccio assiomatico, formalizzato da Kolmogorov, non cerca di definire "cosa sia" la probabilità in termini filosofici (come l'approccio classico o frequentista), ma ne stabilisce le regole matematiche affinché il calcolo sia coerente. Si basa su tre concetti fondamentali: lo spazio campionario (Ω), l' insieme degli eventi e la funzione di probabilità. I tre assiomi fondamentali sono: 1. Assioma di Positività: Per ogni evento A, la probabilità è un numero reale non negativo: P(A)≥0. Questo garantisce che non esistano probabilità negative. 2. Assioma di Certezza: La probabilità dell'evento certo Ω (l'insieme di tutti i possibili risultati) è pari a 1: P(Ω)=1. Ciò definisce il limite superiore del range di probabilità [0,1]. 3. Assioma di Additività (per eventi incompatibili): Se due eventi A e B sono incompatibili (A∩B=∅), allora la probabilità della loro unione è la somma delle singole probabilità: P(A∪B)=P(A)+P(B). Questo assioma si estende a una successione numerabile di eventi disgiunti. Pagina del file: 83 2. Dopo aver definito la funzione di ripartizione ed averne descritto le principali caratteristiche, dire come si stabilisce se è relativa ad una variabile casuale discreta o continua e come si
determina la corrispondete funzione di probabilità o di densità.
3. Definizione, proprietà e dimostrazione della monotonia della funzione di ripartizione La funzione di ripartizione F(x) associa ad ogni valore x la probabilità cumulata fino a quel punto. Proprietà fondamentali:
questo specifico campione" il più probabile possibile. Massimizzare la verosimiglianza significa scegliere il modello statistico che meglio si adatta (meglio spiega) l'evidenza empirica raccolta. Operativamente, si cerca il punto in cui la derivata della funzione (o più spesso del suo logaritmo, la log-verosimiglianza ) rispetto a θ è uguale a zero, verificando che si tratti di un massimo. -Pagina del file: 136-
**6. Significato e uso della funzione di verosimiglianza
8. Utilizzando la nozione di spazio degli eventi elementari, definire la variabile casuale. Illustrarne inoltre la differenza tra variabile casuale discreta e continua. Una Variabile Casuale X è una funzione definita sullo spazio degli eventi elementari Ω che associa a ogni evento elementare ω∈Ω un numero reale x∈R. Formalmente: X:Ω→R. Questo permette di trasformare eventi qualitativi o complessi in entità numeriche su cui applicare il calcolo matematico. Differenza tra Discreta e Continua: Discreta: Lo spazio dei valori che la variabile può assumere (supporto) è un insieme finito o infinito numerabile (es. numero di teste in 10 lanci). La probabilità è concentrata in punti isolati. Continua: Il supporto è un intervallo di numeri reali (es. l'altezza di una persona). La variabile può assumere infiniti valori non numerabili. Non è possibile assegnare probabilità ai singoli punti (che hanno probabilità zero), ma solo a intervalli tramite l'integrazione della funzione di densità. Pagina del file: 88- 9. Dimostrare la proprietà di internalità (CAUCHY) della media aritmetica.
Indice Normalizzato: Poiché il valore massimo di φ2 è min[(k−1),(m−1)], si utilizza l'indice normalizzato che varia tra 0 (indipendenza) e 1 (massima dipendenza). 12. La variabile casuale Binomiale: definizione, rilevanza e normalizzazione Definizione: La variabile casuale Binomiale, indicata con X∼Bi(n,π), descrive il numero di "successi" in n prove indipendenti (esperimento bernoulliano), dove ogni prova ha due soli esiti possibili (successo con probabilità π e insuccesso con probabilità 1−π). La sua funzione di probabilità è: per x=0,1,…,n. Rilevanza pratica: Viene utilizzata per modellare fenomeni in cui si effettuano n estrazioni con ripetizione (campionamento bernoulliano) da una popolazione divisa in due categorie (es. prodotti conformi/non conformi, votanti sì/no). Verifica della condizione di normalizzazione: La somma di tutte le probabilità deve essere pari a 1. Utilizzando lo sviluppo del binomio di Newton (a+b)n=∑(xn)axbn−x, ponendo a=π e b=( 1 −π), otteniamo:
13. Determinare la media della variabile casuale Binomiale Il valore atteso (o media) di una variabile casuale Binomiale è dato dal prodotto tra il numero di prove n e la probabilità di successo π: E(X)=nπ Questa formula deriva dal fatto che una Binomiale è la somma di n variabili casuali di Bernoulli indipendenti, ciascuna con media E(Xi)=π. Per la proprietà di linearità del valore atteso, la media della somma è la somma delle medie:
Pagine del file: 96-
14. Definire i quantili ed illustrarne la rilevanza statistica Definizione: Sia X una variabile quantitativa e p un numero tra 0 e 1. Il quantile di ordine p (xp) è il più piccolo valore del supporto Sx tale che la funzione di ripartizione F(x) raggiunga o superi il valore p: xp=inf{x∈Sx:F(x)≥p}. Casi particolari: La mediana è il quantile di ordine p=0,5 (divide i dati in due parti uguali). I quartili dividono la distribuzione in quattro parti: Q1 (p=0,25), Q2 (mediana), Q3 (p=0,75). Rilevanza statistica: I quantili sono indici di posizione robusti che permettono di sintetizzare la distribuzione senza essere influenzati dai valori estremi (outliers), a differenza della media aritmetica. Sono fondamentali per calcolare la differenza interquartilica (Q3−Q1), un'importante misura di variabilità. Pagina del file: 22-23 (definizione e quartili), 25 (confronto con media) e 34 (variabilità). 15. Coefficiente di correlazione: definizione, variabili e significato Definizione: Il coefficiente di correlazione lineare (Rho di Pearson) è definito come il rapporto tra la covarianza di X e Y e il prodotto dei loro scarti quadratici medi: Tipo di variabili: Può essere calcolato solo per variabili quantitative (misurate su scala intervallare o di rapporto), poiché richiede il calcolo di medie e scarti quadratici. Significato: Misura il grado di interdipendenza lineare tra due variabili. Il valore di ρ è sempre compreso tra -1 e +1: o ρ=+1: perfetta associazione lineare diretta (i punti sono su una retta con pendenza positiva). o ρ=−1: perfetta associazione lineare inversa (i punti sono su una retta con pendenza negativa). o ρ=0: le variabili sono incorrelate linearmente (non esiste un legame di tipo retta, sebbene possa esistere un altro tipo di legame non lineare). Pagina del file: 68 (covarianza) e 71 (indice Rho).
Rilevanza statistica: Permette di capire se i dati sono molto vicini alla media (bassa varianza) o molto dispersi (alta varianza). Essendo espressa al quadrato, viene spesso utilizzata la sua radice quadrata (scarto quadratico medio) per tornare all'unità di misura originale. Proprietà: Pagina del file: 34-
19. Il Teorema del Limite Centrale e sua importanza Il Teorema del Limite Centrale è un pilastro della statistica inferenziale. Esso afferma che, data una successione di variabili casuali indipendenti e identicamente distribuite con media e varianza finite, la distribuzione della loro somma (o della loro media campionaria) tende a una distribuzione Normale all'aumentare della numerosità campionaria (n), indipendentemente dalla forma della distribuzione originale della popolazione. Importanza: Questo teorema giustifica l'uso della curva normale per compiere inferenze sulla popolazione anche quando non conosciamo la distribuzione del fenomeno studiato. Grazie a questo teorema, sappiamo che per campioni sufficientemente grandi (solitamente n> 30 ), la media campionaria si comporterà come una variabile normale, permettendoci di calcolare intervalli di confidenza e test di ipotesi con estrema precisione. Pagina del file: 134, 139 **20. Consistenza e dimostrazione della media campionaria (Chebichev)
di ampiezza n estratto da una popolazione con varianza σ2, la varianza della media campionaria (Xˉ) è data dal rapporto: Importanza: Questa formula è cruciale per l'inferenza statistica per due motivi principali:
Poiché la media condizionata E(Y∣xi) risulta uguale alla media marginale E(Y) per qualunque valore di xi, le medie condizionate sono tutte uguali tra loro. Questo dimostra che non vi è dipendenza in media. Pertanto, l'indipendenza assoluta è una condizione più forte che implica necessariamente l'indipendenza in media. Pagina del file: 60-61, 70-
26. Elementi incompatibili e eventi indipendenti: definizioni e dimostrazione In probabilità, è fondamentale non confondere l'incompatibilità con l'indipendenza. Eventi Incompatibili: Due eventi A e B si dicono incompatibili se il loro verificarsi simultaneo è impossibile, ovvero se la loro intersezione è l'insieme vuoto (A∩B=∅). In questo caso, P(A∩B)= 0. Eventi Indipendenti: Due eventi A e B si dicono indipendenti se il verificarsi di uno non altera la probabilità del verificarsi dell'altro. Matematicamente: P(A∩B)=P(A)⋅P(B). Pagina del file: 81, 86 27. Illustrare l'utilità che comporta l'uso di stimatori corretti
Pagina del file: 134-
**28. Giustificare l'uso degli stimatori corretti
32. Illustrare il concetto di media secondo CHISINI. Secondo la definizione di Oscar Chisini , la media è un valore M che, sostituito a ciascuna delle modalità osservate xi di una distribuzione, lascia inalterata una determinata funzione g di tali valori. Definizione formale: Data una successione di numeri x1,x2,…,xn e una funzione g, il valore M è la media dei numeri rispetto alla funzione g se soddisfa la condizione di invarianza : g(x1,x2,…,xn)=g(M,M,…,M) In base alla scelta della funzione g, si ottengono le diverse medie note: Se g è la somma (∑xi), M è la media aritmetica. Se g è il prodotto (∏xi), M è la media geometrica. Se g è la somma dei reciproci, M è la media armonica. Pagina del file: 32-
34. Dimostrare che l'indipendenza assoluta comporta in correlazione. L' indipendenza assoluta (o in distribuzione) tra due variabili X e Y è una condizione molto più forte dell'incorrelazione. Se due variabili sono indipendenti, allora sono necessariamente incorrelate (ovvero la loro covarianza è pari a zero). Dimostrazione: La covarianza è definita come Cov(X,Y)=E[XY]−E[X]E[Y]. Se le variabili sono indipendenti in distribuzione, la frequenza relativa congiunta Pij è pari al prodotto delle frequenze marginali Pi.⋅P.j. Sviluppando il valore atteso del prodotto E[XY] nel caso di indipendenza: Possiamo separare le sommatorie: Sostituendo questo risultato nella formula della covarianza otteniamo: Cov(X,Y)=E[X]E[Y]−E[X]E[Y]= 0 Questo dimostra che l'indipendenza implica covarianza nulla (incorrelazione). Il viceversa non è sempre vero: due variabili possono essere incorrelate ma non indipendenti (es. se esiste un legame non lineare). Pagina del file: 70 (dimostrazione formale) e 52 (definizione di indipendenza). 35 Giustificare perché il coefficiente di correlazione è un indice che misura l'intensità della dipendenza lineare tra 2 caratteri. Il coefficiente di correlazione ρ (rho) è un indice che misura la forza e la direzione del legame lineare tra due variabili quantitative per i seguenti motivi: 1. Normalizzazione: Deriva dal rapporto tra la covarianza e il prodotto degli scarti quadratici medi. Questo annulla l'unità di misura delle variabili, rendendo l'indice un numero puro (adimensionale) confrontabile tra diversi fenomeni. 2. Limitazione: Grazie alla disuguaglianza di Cauchy-Schwarz, il valore di ρ è sempre compreso tra -1 e +1. 3. Interpretazione geometrica: o Se ∣ρ∣= 1 , i punti nello spazio sono perfettamente allineati su una retta. L'intensità è massima. o Se ∣ρ∣ è vicino a 1, la "nuvola" di punti è molto stretta attorno a una retta (forte dipendenza lineare). o Se ρ= 0 , non esiste alcun legame di tipo lineare (le variabili sono incorrelate), indicando che la conoscenza di una non permette di prevedere l'altra tramite una funzione di primo grado.
38. Mutua variabilità e variabilità da un centro: aspetti comuni e specifici Questi due approcci rappresentano le due modalità principali per analizzare la dispersione di una distribuzione. Variabilità da un centro: Misura quanto i valori della variabile si discostino da un punto focale di sintesi (solitamente la media o la mediana). L'indice più comune è la varianza , che calcola la media degli scarti al quadrato dalla media aritmetica. Mutua variabilità: Analizza quanto le unità statistiche differiscano tra loro, senza riferirsi a un centro fisso. Si basa sul confronto a coppie di tutte le modalità osservate. L'indice tipico è la differenza semplice media. Aspetti comuni: Entrambi servono a verificare la capacità di sintesi di un indice di posizione. In entrambi i casi, valori bassi indicano una distribuzione molto concentrata (buona sintesi), mentre valori alti indicano forte dispersione (scarsa sintesi). Aspetti specifici: Mentre la variabilità da un centro è legata a una specifica funzione obiettivo (es. minimi quadrati per la media), la mutua variabilità è un concetto più globale di diversità interna al collettivo. Pagine del file: 34- 39. Il campionamento: indicare per quale motivo si effettuano rilevazioni campionarie; illustrare come si ottengono campioni rappresentativi. Il campionamento è il processo di estrazione di un sottoinsieme di unità (campione) da una popolazione più vasta (universo) al fine di compiere inferenze sul totale. Motivi delle rilevazioni campionarie: Si ricorre al campione principalmente per motivi di efficienza: una rilevazione totale (censimento) risulta spesso troppo costosa in termini di tempo, denaro e risorse umane. Inoltre, in alcuni casi (test distruttivi), il campionamento è l'unica via possibile. Campioni rappresentativi: Un campione è rappresentativo quando riproduce fedelmente, in scala ridotta, le caratteristiche della popolazione da cui è estratto. Per ottenerlo, è fondamentale utilizzare tecniche di selezione casuale (campionamento probabilistico), come il campionamento bernoulliano (estrazioni indipendenti e con ripetizione), che garantiscono a ogni unità della popolazione la stessa probabilità di entrare a far parte del campione. Pagine del file: 137-