Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


domande esami statistica, Sintesi del corso di Statistica

domande di tutti gli esami passati di statistica

Tipologia: Sintesi del corso

2025/2026

Caricato il 15/03/2026

mariacarlotta_05
mariacarlotta_05 🇮🇹

2 documenti

1 / 31

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1. L'impostazione assiomatica al calcolo della probabilità
L'approccio assiomatico, formalizzato da Kolmogorov, non cerca di definire "cosa sia" la probabilità
in termini filosofici (come l'approccio classico o frequentista), ma ne stabilisce le regole matematiche
affinché il calcolo sia coerente. Si basa su tre concetti fondamentali: lospazio campionario(Ω),
l'insieme degli eventie lafunzione di probabilità.
I tre assiomi fondamentali sono:
1. Assioma di Positività:Per ogni eventoA, la probabilità è un numero reale non
negativo:P(A)≥0. Questo garantisce che non esistano probabilità negative.
2. Assioma di Certezza:La probabilità dell'evento certoΩ(l'insieme di tutti i possibili risultati)
è pari a 1:P(Ω)=1. Ciò definisce il limite superiore del range di probabilità[0,1].
3. Assioma di Additività (per eventi incompatibili):Se due eventiAeBsono incompatibili
(A∩B=), allora la probabilità della loro unione è la somma delle singole
probabilità:P(AB)=P(A)+P(B). Questo assioma si estende a una successione numerabile di
eventi disgiunti.
Pagina del file:83
2. Dopo aver definito la funzione di ripartizione ed averne descritto le principali caratteristiche,
dire come si stabilisce se è relativa ad una variabile casuale discreta o continua e come si
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f

Anteprima parziale del testo

Scarica domande esami statistica e più Sintesi del corso in PDF di Statistica solo su Docsity!

1. L'impostazione assiomatica al calcolo della probabilità L'approccio assiomatico, formalizzato da Kolmogorov, non cerca di definire "cosa sia" la probabilità in termini filosofici (come l'approccio classico o frequentista), ma ne stabilisce le regole matematiche affinché il calcolo sia coerente. Si basa su tre concetti fondamentali: lo spazio campionario (Ω), l' insieme degli eventi e la funzione di probabilità. I tre assiomi fondamentali sono: 1. Assioma di Positività: Per ogni evento A, la probabilità è un numero reale non negativo: P(A)≥0. Questo garantisce che non esistano probabilità negative. 2. Assioma di Certezza: La probabilità dell'evento certo Ω (l'insieme di tutti i possibili risultati) è pari a 1: P(Ω)=1. Ciò definisce il limite superiore del range di probabilità [0,1]. 3. Assioma di Additività (per eventi incompatibili): Se due eventi A e B sono incompatibili (A∩B=∅), allora la probabilità della loro unione è la somma delle singole probabilità: P(A∪B)=P(A)+P(B). Questo assioma si estende a una successione numerabile di eventi disgiunti.  Pagina del file: 83 2. Dopo aver definito la funzione di ripartizione ed averne descritto le principali caratteristiche, dire come si stabilisce se è relativa ad una variabile casuale discreta o continua e come si

determina la corrispondete funzione di probabilità o di densità.

3. Definizione, proprietà e dimostrazione della monotonia della funzione di ripartizione La funzione di ripartizione F(x) associa ad ogni valore x la probabilità cumulata fino a quel punto. Proprietà fondamentali:

questo specifico campione" il più probabile possibile. Massimizzare la verosimiglianza significa scegliere il modello statistico che meglio si adatta (meglio spiega) l'evidenza empirica raccolta. Operativamente, si cerca il punto in cui la derivata della funzione (o più spesso del suo logaritmo, la log-verosimiglianza ) rispetto a θ è uguale a zero, verificando che si tratti di un massimo. -Pagina del file: 136-

**6. Significato e uso della funzione di verosimiglianza

  1. Esporre il metodo di stima della verosimiglianza e le proprietà degli stimatori ottenuti con tale metodo"** Il Metodo della Massima Verosimiglianza consiste nei seguenti passaggi:
    1. Definizione della funzione di verosimiglianza L(θ).
    2. Passaggio alla log-verosimiglianza ℓ(θ)=lnL(θ).
    3. Calcolo della derivata (Score) e risoluzione dell'equazione d/dθ ℓ(θ)=0.
    4. Verifica del massimo tramite la derivata seconda.

8. Utilizzando la nozione di spazio degli eventi elementari, definire la variabile casuale. Illustrarne inoltre la differenza tra variabile casuale discreta e continua. Una Variabile Casuale X è una funzione definita sullo spazio degli eventi elementari Ω che associa a ogni evento elementare ω∈Ω un numero reale x∈R. Formalmente: X:Ω→R. Questo permette di trasformare eventi qualitativi o complessi in entità numeriche su cui applicare il calcolo matematico. Differenza tra Discreta e Continua:Discreta: Lo spazio dei valori che la variabile può assumere (supporto) è un insieme finito o infinito numerabile (es. numero di teste in 10 lanci). La probabilità è concentrata in punti isolati.  Continua: Il supporto è un intervallo di numeri reali (es. l'altezza di una persona). La variabile può assumere infiniti valori non numerabili. Non è possibile assegnare probabilità ai singoli punti (che hanno probabilità zero), ma solo a intervalli tramite l'integrazione della funzione di densità.  Pagina del file: 88- 9. Dimostrare la proprietà di internalità (CAUCHY) della media aritmetica.

Indice Normalizzato: Poiché il valore massimo di φ2 è min[(k−1),(m−1)], si utilizza l'indice normalizzato che varia tra 0 (indipendenza) e 1 (massima dipendenza). 12. La variabile casuale Binomiale: definizione, rilevanza e normalizzazioneDefinizione: La variabile casuale Binomiale, indicata con X∼Bi(n,π), descrive il numero di "successi" in n prove indipendenti (esperimento bernoulliano), dove ogni prova ha due soli esiti possibili (successo con probabilità π e insuccesso con probabilità 1−π). La sua funzione di probabilità è: per x=0,1,…,n.  Rilevanza pratica: Viene utilizzata per modellare fenomeni in cui si effettuano n estrazioni con ripetizione (campionamento bernoulliano) da una popolazione divisa in due categorie (es. prodotti conformi/non conformi, votanti sì/no).  Verifica della condizione di normalizzazione: La somma di tutte le probabilità deve essere pari a 1. Utilizzando lo sviluppo del binomio di Newton (a+b)n=∑(xn)axbn−x, ponendo a=π e b=( 1 −π), otteniamo:

13. Determinare la media della variabile casuale Binomiale Il valore atteso (o media) di una variabile casuale Binomiale è dato dal prodotto tra il numero di prove n e la probabilità di successo π: E(X)=nπ Questa formula deriva dal fatto che una Binomiale è la somma di n variabili casuali di Bernoulli indipendenti, ciascuna con media E(Xi)=π. Per la proprietà di linearità del valore atteso, la media della somma è la somma delle medie:

Pagine del file: 96-

14. Definire i quantili ed illustrarne la rilevanza statisticaDefinizione: Sia X una variabile quantitativa e p un numero tra 0 e 1. Il quantile di ordine p (xp) è il più piccolo valore del supporto Sx tale che la funzione di ripartizione F(x) raggiunga o superi il valore p: xp=inf{x∈Sx:F(x)≥p}.  Casi particolari: La mediana è il quantile di ordine p=0,5 (divide i dati in due parti uguali). I quartili dividono la distribuzione in quattro parti: Q1 (p=0,25), Q2 (mediana), Q3 (p=0,75).  Rilevanza statistica: I quantili sono indici di posizione robusti che permettono di sintetizzare la distribuzione senza essere influenzati dai valori estremi (outliers), a differenza della media aritmetica. Sono fondamentali per calcolare la differenza interquartilica (Q3−Q1), un'importante misura di variabilità. Pagina del file: 22-23 (definizione e quartili), 25 (confronto con media) e 34 (variabilità). 15. Coefficiente di correlazione: definizione, variabili e significatoDefinizione: Il coefficiente di correlazione lineare (Rho di Pearson) è definito come il rapporto tra la covarianza di X e Y e il prodotto dei loro scarti quadratici medi:  Tipo di variabili: Può essere calcolato solo per variabili quantitative (misurate su scala intervallare o di rapporto), poiché richiede il calcolo di medie e scarti quadratici.  Significato: Misura il grado di interdipendenza lineare tra due variabili. Il valore di ρ è sempre compreso tra -1 e +1: o ρ=+1: perfetta associazione lineare diretta (i punti sono su una retta con pendenza positiva). o ρ=−1: perfetta associazione lineare inversa (i punti sono su una retta con pendenza negativa). o ρ=0: le variabili sono incorrelate linearmente (non esiste un legame di tipo retta, sebbene possa esistere un altro tipo di legame non lineare).  Pagina del file: 68 (covarianza) e 71 (indice Rho).

Rilevanza statistica: Permette di capire se i dati sono molto vicini alla media (bassa varianza) o molto dispersi (alta varianza). Essendo espressa al quadrato, viene spesso utilizzata la sua radice quadrata (scarto quadratico medio) per tornare all'unità di misura originale.  Proprietà: Pagina del file: 34-

19. Il Teorema del Limite Centrale e sua importanza Il Teorema del Limite Centrale è un pilastro della statistica inferenziale. Esso afferma che, data una successione di variabili casuali indipendenti e identicamente distribuite con media e varianza finite, la distribuzione della loro somma (o della loro media campionaria) tende a una distribuzione Normale all'aumentare della numerosità campionaria (n), indipendentemente dalla forma della distribuzione originale della popolazione. Importanza: Questo teorema giustifica l'uso della curva normale per compiere inferenze sulla popolazione anche quando non conosciamo la distribuzione del fenomeno studiato. Grazie a questo teorema, sappiamo che per campioni sufficientemente grandi (solitamente n> 30 ), la media campionaria si comporterà come una variabile normale, permettendoci di calcolare intervalli di confidenza e test di ipotesi con estrema precisione. Pagina del file: 134, 139 **20. Consistenza e dimostrazione della media campionaria (Chebichev)

  1. Determinare la varianza delle medie campionarie e illustrane l'importanza** La varianza della media campionaria è un indice che misura la precisione dello stimatore media campionaria rispetto al parametro incognito della popolazione. Se consideriamo un campione casuale

di ampiezza n estratto da una popolazione con varianza σ2, la varianza della media campionaria (Xˉ) è data dal rapporto: Importanza: Questa formula è cruciale per l'inferenza statistica per due motivi principali:

  1. Precisione e ampiezza campionaria: Indica che la variabilità della media campionaria diminuisce all'aumentare della dimensione del campione n. Più dati raccogliamo, più le medie campionarie tenderanno a concentrarsi attorno alla vera media della popolazione (μ), rendendo la stima più affidabile.
  2. Efficienza dello stimatore: Dimostra che la media campionaria è uno stimatore più preciso (ovvero con varianza inferiore) rispetto a una singola osservazione campionaria. Questo concetto è alla base della costruzione degli intervalli di confidenza e della determinazione dell'errore standard. Pagina del file: 139 22. Proprietà statistiche della media campionaria nel caso di campionamento bernoulliano Il campionamento bernoulliano (casuale semplice con ripetizione) garantisce che ogni unità della popolazione abbia la stessa probabilità di essere estratta e che le estrazioni siano indipendenti. In questo contesto, lo stimatore media campionaria gode di proprietà ottimali:
  3. Correttezza (Non distorsione): Il valore atteso della media campionaria è uguale alla media della popolazione: E(Xˉ)=μ. Questo significa che lo stimatore non commette errori sistematici.
  4. Varianza: La varianza è pari a V(Xˉ)=σ2/n. Come visto, essa decresce al crescere di n.
  5. Distribuzione campionaria: Grazie al Teorema del Limite Centrale, se l'ampiezza del campione è sufficientemente grande, la distribuzione della media campionaria tende a una distribuzione Normale, indipendentemente dalla forma della distribuzione della popolazione di origine. Pagina del file: 139 23. Proprietà statistiche della media campionaria nel caso di campionamento casuale con ripetizione (Nota: Questa risposta coincide sostanzialmente con la precedente, poiché il campionamento bernoulliano è, per definizione, un campionamento casuale con ripetizione). Le proprietà fondamentali rimangono la correttezza (lo stimatore "punta" al centro del parametro vero μ) e la consistenza (la precisione aumenta con n). In un campionamento con ripetizione, le variabili campionarie sono indipendenti e identicamente distribuite (i.i.d.). Questo permette di calcolare la varianza dello stimatore senza dover applicare il fattore di correzione per popolazioni finite (tipico

Poiché la media condizionata E(Y∣xi) risulta uguale alla media marginale E(Y) per qualunque valore di xi, le medie condizionate sono tutte uguali tra loro. Questo dimostra che non vi è dipendenza in media. Pertanto, l'indipendenza assoluta è una condizione più forte che implica necessariamente l'indipendenza in media. Pagina del file: 60-61, 70-

26. Elementi incompatibili e eventi indipendenti: definizioni e dimostrazione In probabilità, è fondamentale non confondere l'incompatibilità con l'indipendenza.  Eventi Incompatibili: Due eventi A e B si dicono incompatibili se il loro verificarsi simultaneo è impossibile, ovvero se la loro intersezione è l'insieme vuoto (A∩B=∅). In questo caso, P(A∩B)= 0.  Eventi Indipendenti: Due eventi A e B si dicono indipendenti se il verificarsi di uno non altera la probabilità del verificarsi dell'altro. Matematicamente: P(A∩B)=P(A)⋅P(B). Pagina del file: 81, 86 27. Illustrare l'utilità che comporta l'uso di stimatori corretti

Pagina del file: 134-

**28. Giustificare l'uso degli stimatori corretti

  1. Definire la mediana e indicare quando dovrebbe essere scelta come valore medio** La mediana è un indice di posizione che divide la distribuzione dei dati ordinati in due parti uguali. Formalmente, si definisce come il più piccolo valore del supporto per il quale la funzione di ripartizione raggiunge o supera per la prima volta il valore 0,5. È quindi il quantile di ordine 0,5, ovvero quel valore sotto il quale ricade il 50% delle osservazioni e sopra il quale ricade il restante 50%. Quando sceglierla come valore medio: La mediana dovrebbe essere scelta come valore medio preferibile alla media aritmetica in due circostanze principali:
    1. Presenza di Outliers (Valori Anomali): La mediana è un indice robusto , il che significa che non risente dei valori estremi. Se in un collettivo sono presenti dati eccezionalmente alti o bassi (o addirittura errori di inserimento), la media aritmetica ne verrebbe pesantemente influenzata e distorta, mentre la mediana rimarrebbe invariata, fornendo una rappresentazione più veritiera del "centro" della distribuzione.
    2. Distribuzioni fortemente asimmetriche: Quando i dati non si distribuiscono in modo simmetrico attorno al centro (ad esempio nella distribuzione del reddito, dove molti hanno poco e pochissimi hanno moltissimo), la mediana descrive meglio la situazione dell'unità statistica "tipica" rispetto alla media.

32. Illustrare il concetto di media secondo CHISINI. Secondo la definizione di Oscar Chisini , la media è un valore M che, sostituito a ciascuna delle modalità osservate xi di una distribuzione, lascia inalterata una determinata funzione g di tali valori. Definizione formale: Data una successione di numeri x1,x2,…,xn e una funzione g, il valore M è la media dei numeri rispetto alla funzione g se soddisfa la condizione di invarianza : g(x1,x2,…,xn)=g(M,M,…,M) In base alla scelta della funzione g, si ottengono le diverse medie note:  Se g è la somma (∑xi), M è la media aritmetica.  Se g è il prodotto (∏xi), M è la media geometrica.  Se g è la somma dei reciproci, M è la media armonica. Pagina del file: 32-

  1. Giustificare l'uso degli intervalli di confidenza ed illustrarne la costruzione per stimare la media di una popolazione normale. L'uso degli intervalli di confidenza è giustificato dalla necessità di fornire non solo una stima puntuale del parametro (che potrebbe essere errata a causa della variabilità campionaria), ma un intervallo di valori che abbia un'alta probabilità (detta livello di confidenza 1 −α) di contenere il vero valore del parametro incognito della popolazione. Costruzione per la media di una popolazione normale: Se la popolazione X è distribuita come una Normale con varianza σ2 nota, lo stimatore di riferimento è la media campionaria xˉ. Grazie alle proprietà della distribuzione normale, l'intervallo si costruisce aggiungendo e sottraendo alla media campionaria un margine di errore pari al prodotto tra il valore critico delle tavole (zα/2) e lo scarto quadratico medio dello stimatore Questa procedura permette di controllare il rischio di errore fissando a priori il livello di significatività α. Pagina del file: 137 (popolazione normale e parametri oggetto di ipotesi) e 139 (strategia di Neyman- Pearson e fissazione di α).

34. Dimostrare che l'indipendenza assoluta comporta in correlazione. L' indipendenza assoluta (o in distribuzione) tra due variabili X e Y è una condizione molto più forte dell'incorrelazione. Se due variabili sono indipendenti, allora sono necessariamente incorrelate (ovvero la loro covarianza è pari a zero). Dimostrazione: La covarianza è definita come Cov(X,Y)=E[XY]−E[X]E[Y]. Se le variabili sono indipendenti in distribuzione, la frequenza relativa congiunta Pij è pari al prodotto delle frequenze marginali Pi.⋅P.j. Sviluppando il valore atteso del prodotto E[XY] nel caso di indipendenza: Possiamo separare le sommatorie: Sostituendo questo risultato nella formula della covarianza otteniamo: Cov(X,Y)=E[X]E[Y]−E[X]E[Y]= 0 Questo dimostra che l'indipendenza implica covarianza nulla (incorrelazione). Il viceversa non è sempre vero: due variabili possono essere incorrelate ma non indipendenti (es. se esiste un legame non lineare). Pagina del file: 70 (dimostrazione formale) e 52 (definizione di indipendenza). 35 Giustificare perché il coefficiente di correlazione è un indice che misura l'intensità della dipendenza lineare tra 2 caratteri. Il coefficiente di correlazione ρ (rho) è un indice che misura la forza e la direzione del legame lineare tra due variabili quantitative per i seguenti motivi: 1. Normalizzazione: Deriva dal rapporto tra la covarianza e il prodotto degli scarti quadratici medi. Questo annulla l'unità di misura delle variabili, rendendo l'indice un numero puro (adimensionale) confrontabile tra diversi fenomeni. 2. Limitazione: Grazie alla disuguaglianza di Cauchy-Schwarz, il valore di ρ è sempre compreso tra -1 e +1. 3. Interpretazione geometrica: o Se ∣ρ∣= 1 , i punti nello spazio sono perfettamente allineati su una retta. L'intensità è massima. o Se ∣ρ∣ è vicino a 1, la "nuvola" di punti è molto stretta attorno a una retta (forte dipendenza lineare). o Se ρ= 0 , non esiste alcun legame di tipo lineare (le variabili sono incorrelate), indicando che la conoscenza di una non permette di prevedere l'altra tramite una funzione di primo grado.

38. Mutua variabilità e variabilità da un centro: aspetti comuni e specifici Questi due approcci rappresentano le due modalità principali per analizzare la dispersione di una distribuzione.  Variabilità da un centro: Misura quanto i valori della variabile si discostino da un punto focale di sintesi (solitamente la media o la mediana). L'indice più comune è la varianza , che calcola la media degli scarti al quadrato dalla media aritmetica.  Mutua variabilità: Analizza quanto le unità statistiche differiscano tra loro, senza riferirsi a un centro fisso. Si basa sul confronto a coppie di tutte le modalità osservate. L'indice tipico è la differenza semplice media.  Aspetti comuni: Entrambi servono a verificare la capacità di sintesi di un indice di posizione. In entrambi i casi, valori bassi indicano una distribuzione molto concentrata (buona sintesi), mentre valori alti indicano forte dispersione (scarsa sintesi).  Aspetti specifici: Mentre la variabilità da un centro è legata a una specifica funzione obiettivo (es. minimi quadrati per la media), la mutua variabilità è un concetto più globale di diversità interna al collettivo. Pagine del file: 34- 39. Il campionamento: indicare per quale motivo si effettuano rilevazioni campionarie; illustrare come si ottengono campioni rappresentativi. Il campionamento è il processo di estrazione di un sottoinsieme di unità (campione) da una popolazione più vasta (universo) al fine di compiere inferenze sul totale.  Motivi delle rilevazioni campionarie: Si ricorre al campione principalmente per motivi di efficienza: una rilevazione totale (censimento) risulta spesso troppo costosa in termini di tempo, denaro e risorse umane. Inoltre, in alcuni casi (test distruttivi), il campionamento è l'unica via possibile.  Campioni rappresentativi: Un campione è rappresentativo quando riproduce fedelmente, in scala ridotta, le caratteristiche della popolazione da cui è estratto. Per ottenerlo, è fondamentale utilizzare tecniche di selezione casuale (campionamento probabilistico), come il campionamento bernoulliano (estrazioni indipendenti e con ripetizione), che garantiscono a ogni unità della popolazione la stessa probabilità di entrare a far parte del campione. Pagine del file: 137-

  1. Sapendo che A e B son due eventi stocasticamente indipendenti, accertare se l'evento complementare A è stocasticamente indipendente dall'evento B. Se due eventi A e B sono statisticamente indipendenti, allora anche l'evento complementare di A (indicato con A∗) è indipendente da B. Dimostrazione: Per l'indipendenza di A e B, sappiamo che P(A∩B)=P(A)⋅P(B). L'evento B può essere scritto come l'unione dei due eventi incompatibili (A∩B) e (A∗∩B). Per l'assioma di additività: Sostituendo la condizione di indipendenza: Risolvendo rispetto all'intersezione con il complementare: Pagina del file: 83 (Axioms) e 86 (Independence logic) 41. Sia A un evento di un certo sperimento, usando gli assiomi del calcolo della probabilità dimostrare che P(A) = 1- P(A). Pagina del file:* 83