






















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Un'introduzione completa ai concetti fondamentali della statistica descrittiva, esplorando la variabilità dei dati e le relazioni tra fenomeni. Esempi pratici e formule per calcolare la media, la varianza, la deviazione standard e altri indicatori statistici. Inoltre, vengono approfonditi i concetti di connessione, dipendenza e indipendenza in media, con esempi di diagrammi a dispersione e coefficienti di correlazione lineare. Un'ottima risorsa per studenti universitari e chiunque desideri approfondire la comprensione della statistica descrittiva.
Tipologia: Appunti
1 / 30
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!























COS’È? insieme di metodologie e di strumenti formali per la trattazione quantitativa dei fenomeni osservabili nella realtà sociale.
TRATTAZIONE QUANTITATIVA realizzazione del processo logico di :
osservazione → analisi → comprensione. Questo processo si realizza tramite la rilevazione dei dati, l’elaborazione e la trasformazione dei dati in informazioni
FENOMENI DI INTERESSE : FENOMENI STATISTICI che si presentano con una molteplicità di manifestazioni. I supporti fisici o teorici delle diverse manifestazioni del fenomeno statistico sono dette unità statistiche. L’insieme delle unità statistiche è chiamato POPOLAZIONE STATISTICA O UNIVERSO.
la lettera U (maiuscolo) per denotare la popolazione o universo statistico le lettere latine maiuscole ( tranne la U) per indicare i fenomeni statistici le lettere minuscole per indicare ogni singola manifestazione del fenomeno indicato con la corrispondente lettera maiuscola. In linguaggio tecnico parleremo di modalità o valori del fenomeno. Esempio:
Y: secolarizzazione U: insieme di soggetti y: licenza media o diploma o laurea ecc.
La statistica ha la funzione di descrivere il comportamento di X su U. gli strumenti di analisi statistica adeguati a questo scopo formano LA STATISTICA DESCRITTIVA, che si classifica a sua volta in:
MONOVARIATA che ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione sintetica del suo comportamento su U; BIVARIATA, quando l'oggetto è una coppia di fenomeni congiuntamente rilevati sulla stessa U e l'obiettivo è l'individuazione e lo studio delle relazioni fra i due; MULTIVARIATA, se i fenomeni rilevati sulla stessa U sono più di due e l'obiettivo è descriverne il comportamento congiunto e studiarne le relazioni, congiuntamente (tutti insieme) e per loro sottoinsiemi ( coppie, terne ecc.).
INFERENZA STATISTICA: induzione del particolare (campione) al generale (U).
STATISTICA INFERENZIALE: strumenti di analisi adeguati a fare inferenza
FENOMENI QUALITATIVI: si manifestano nella popolazione osservata attraverso attributi o categorie, qualità appunto.
FENOMENI QUANTITATIVI: si manifestano nella popolazione osservata attraverso numeri, quantità appunto.
Per certi tipi di analisi statistica è necessario che le manifestazioni del fenomeno analizzato possono essere ordinate. Le manifestazioni dei fenomeni quantitativi possono essere sempre ordinate poiché fra i numeri esiste una relazione d'ordine naturale. Per i fenomeni qualitativi invece è importante la sotto-classificazione. Fenomeni qualitativi ordinali → sono i fenomeni che pur essendo qualitativi, si manifestano con attributi e categorie che si possono ordinare secondo un qualche criterio oggettivo e convenzionalmente accertato.
Fenomeni qualitativi categoriali → sono tutti i fenomeni qualitativi per i quali non abbiamo un criterio oggettivo (ma solo personale e variabile) per ordinare le categorie con cui si manifesta.
Fra i fenomeni quantitativi facciamo una distinzione fra i fenomeni DISCRETI e CONTINUI.
FENOMENI QUANTITATIVI DISCRETI sono i fenomeni quantitativi che possiamo enumerare.
FENOMENI QUANTITATIVI CONTINUI sono i fenomeni quantitativi che si possono misurare, una volta scelta un’opportuna unità di misura e con la disponibilità del corretto strumento di misurazione.
Per quanto riguarda la rilevazione, l’insieme delle caselline previste per ogni domanda costituisce la scala delle modalità o scala di rilevazione.
Le caratteristiche principali della scala delle modalità sono: esaustività e mutua esclusività.
ESAUSTIVITÀ la scala delle modalità con cui si effettua la rilevazione deve essere esaustiva, deve cioè prevedere tutte le possibili manifestazioni di X che si possono osservare su U.
MUTUA ESCLUSIVITÀ la scala con cui si effettua la rilevazione deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizione.
Nelle qualitative ci sono 2 sotto-gruppi:
SCALA QUALITATIVA ORDINALE è una scala qualitativa nella quale gli attributi o le categorie di cui consta possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato. Relazioni di =; ≠; >uguale ;<uguale
Le frequenze assolute non sono confrontabili fra popolazioni di numerosità diversa.
Se lo si volesse fare occorre depurare le frequenze assolute dall’influenza di N costruendo le frequenze relative.
FREQUENZE RELATIVE associata alla modalità xi è il rapporto (divisione) fra le frequenza assoluta di xi e la numerosità N di U. indicheremo la frequenza relativa con pi. In formule e più brevemente che a parole pi=fi/N
Le frequenze relative pi sono rapporti particolari con il denominatore che rappresenta il totale del numeratore. Risultano perciò sempre comprese fra 0 e 1 e la loro somma è pari a 1. formula in sintesi: 1/N x N= N/N = 1
FREQUENZE CUMULATE quando il fenomeno di interesse è almeno ordinale possiamo aumentare il livello di analisi e costruire un ulteriore tipo di distribuzione con frequenze. In questo caso è buona pratica costruire la v.s ordinando in senso crescente le modalità osservate partendo dal minimo x1 e arrivando al massimo xk: x1<x2<...<xk-1 < xk.
Si tratta di sommare (cumulare) le frequenze associate alle modalità inferiori di xi costruendo le frequenze cumulate. Indicheremo con Fi le frequenze cumulate assolute e useremo la lettera greca “phi” maiuscolo per indicare le frequenze cumulate relative.
Limitiamo la nostra attenzione ai fenomeni quantitativi continui. Se X è continuo le modalità xi sono intervalli.
Siamo di fronte ad una mancanza di informazioni. Ogni volta che ci troviamo in una situazione di questo tipo, per superare l'ostacolo si ricorre all'emissione di ipotesi in sostituzione delle informazioni ignote. L'ipotesi adottata deve essere ragionevole cioè argomentabile sostenibile e convincente. Due sono le ipotesi comunemente emesse :
(esempio pag.33) Con questa ipotesi si attua una sostanziale discretizzazione della v.s. : si supera il problema dell'ignota distribuzione ma si perde la natura continua rappresentata dagli intervalli.
Con le distribuzioni di frequenze si possono costruire i grafici. La forma grafica è preferibile a quella tabellare in fase di interpretazione e comunicazione dei risultati dell’analisi statistica. Per i fenomeni qualitativi il grafico è un semplice disegno che affianca o sostituisce la tabella. Per i fenomeni quantitativi, quando le xi sono numeri si costruiscono veri e propri diagrammi cartesiani. Le xi poste sulle ascisse e le fi poste sulle ordinate. Quando X è discreto un diagramma efficace è a bastoncini.
Sappiamo che adottare l'ipotesi del valore centrale si traduce nella discretizzazione della v.s. attraverso i valori centrali x*i degli intervalli. Una volta ricondotti al caso discreto si può procedere alla rappresentazione grafica prevista nel caso discreto, cioè a bastoncini. Se invece si adotta l'ipotesi della distribuzione uniforme, si presenta la natura continua del fenomeno e l'obiettivo di associare la frequenza a tutti gli infiniti punti dell'intervallo, in modo che sia uniformemente distribuita, si raggiunge rappresentando la frequenza come un'area. Per rappresentare la distribuzione di frequenze assolute, sotto l'ipotesi di una distribuzione uniforme, si pongono gli intervalli xi:xl|- xL sulle ascisse e le densità di frequenza phi piccolo sulle ordinate
Il diagramma che si ottiene è a rettangoli accostati e prende il nome di istogramma o diagramma areale. In un istogramma le frequenze sono rappresentate come aree.
L'area totale sottesa all'istogramma è:
pari a N se si rappresentano le frequenze assolute fi (phi sulle ordinate). Pari a 1 se si rappresentano le frequenze relative pi(phi/N sulle ordinate).
COS’È IL VALORE MEDIO? è un unico valore che da solo ci da un’idea del comportamento di X su U e del suo ordine di grandezza. Si tratta di passare da un’intera distribuzione a un singolo valore, il valore medio appunto.
→ la somma di tutti i valori di X su tutte le N unità osservate prende il nome di totale di X. In formule: sommatoria che va da i=1 a k di xifi = totale di X (su U)
inoltre dividendo il totale di X per N si ottiene la media aritmetica di X. Il totale di X può anche essere dato dalla media moltiplicata per N che, a sua volta, è la somma delle frequenze fi.
VARIABILITÀ attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti.
La variabilità è ciò che rende necessario il ricorso alla strumentazione statistica per l’analisi e la comprensione del comportamento del fenomeno su U. la variabilità di X quantitativo è l’aspetto essenziale nella descrizione statistica del suo comportamento su U.
Una misura della variabilità di X è un indice sintetico con le seguenti caratteristiche:
propriet à di un indice di variabilità :
I. assume valore 0 in assenza di variabilità , cioè nella situazione in cui X si manifesta con un’unica modalità , generando una v.s. costante; II. assume valori positivi quando X si manifesta con modalit à molteplici e differenti, cioè in caso di variabilità III. assume valori positivi e via via più grandi all’aumentare della variabilità
la più semplice misura di variabilità che chiamiamo RANGE, si ottiene confrontando la più piccola e la più grande fra le modalità osservate.
RANGE DI X= XMAX – XMIN questa misura ha tutte le caratteristiche sopra elencate
Il range è basato solo su 2 fra le k osservate, cioè quelle estreme, mentre il resto della v.s. è ignorato.
Per migliorare le cose possiamo prendere la differenza fra i due quartili, superiore e inferiore, di X. Così otteniamo un’altra misura di variabilità chiamata DIFFERENZA INTERQUARTILE. Questa è il range della metà centrale delle osservazioni.
DEVIAZIONE STANDARD DI X è una misura più raffinata, che utilizza tutta la v.s. ha come notazione standard “”.
Formula di “” :
la forma deriva da :
ogni modalità xi è confrontata con la media aritmetica che essendo un valore sintesi della v.s. funziona bene come polo di confronto. La differenza (xi – x con trattino) può risultare positiva o negativa a seconda che xi sia una modalità sopra o sotto media. Ai nostri fini il segno dello scarto è ininfluente: quello che ci interessa è se xi è vicina o lontana dal polo di confronto (ovvero la media aritmetica); dunque ci interessa la distanza di xi dalla media aritmetica. Per eliminare l'influenza del segno, si considerano gli scarti quadratici , cioè elevati al quadrato. (xi – x con trattino)^2. Per ragioni di semplicità il quadrato è preferibile al valore assoluto in quanto è più semplice da trattare matematicamente e ha l'effetto di enfatizzare le distanze. Gli scarti quadratici vengono poi ponderati con le frequenze. Si tiene cioè conto del fatto che la modalità xi si presenta in U fi volte (xi – x con trattino)^2 fi. Se si sommano tutti gli scarti ponderati non al quadrato ma con il loro segno si ottiene sempre 0. poiché di scarti quadratici ne abbiamo k (tanti quante sono le modalità osservate), li sintetizziamo tutti in una media sommando e dividendo poi per N infine si ristabilisce l'ordine di grandezza e l'unità di misura (alterati dall'elevamento al quadrato) prendendo la radice quadrata.
La deviazione standard misura la variabilità di X considerando la dispersione dei suoi valori intorno al suo valore medio. Essa ci dice che X si manifesta su U con valori che in media distano dalla media aritmetica per più o meno .
Facendo riferimento al si definiscono altre 2 misure di variabilità di X su U chiamate VARIANZA e DEVIANZA. La deviazione standard elevata al quadrato è la varianza di X:
σ ^2 = 1/N sommatoria che va da i=1 a k (xi – x con trattino)^2 fi
La varianza moltiplicata per N definisce la devianza di X:
N σ^2 = sommatoria che va da i =1 a k (xi – x con trattino)^2 fi
Fissando l’attenzione sulle singole righe o sulle singole colonne separatamente, si costruiscono le v.s. condizionate da Y|xi e X|yj.
Sulle v.s. condizionate si costruiscono le frequenze condizionate che vengono chiamate PERCENTUALI DI RIGA E PERCENTUALI DI COLONNA.
Se fra X e Y non c’è nessuna relazione statistica, allora X e Y sono statisticamente INDIPENDENTI. Il modo per stabilire se siano o meno indipendenti è confrontare le frequenze condizionate con le frequenze marginali. Bada bene che le frequenze marginali si riferiscono all’intera U di numerosità N e le frequenze condizionate si riferiscono a sotto-popolazioni di numerosità fi.
Le frequenze marginali relative si ottengono dalle frequenze marginali assolute dividendo per N.
FREQUENZE TEORICHE DI INDIPENDENZA STATISTICA sono quelle frequenze che si ottengono facendo un semplice passaggio algebrico sulla condizione di indipendenza statistica
TABELLA TEORICA DI INDIPENDENZA STATISTICA si compila mantenendo fisse le marginali e sostituendo le frequenze congiunte osservate con le frequenze teoriche di indipendenza statistica.
Il concetto di indipendenza statistica è SIMMETRICO si dice che fra X e Y esiste indipendenza statistica, intendendo che Y è indipendente da X e che X è indipendente da Y.
Per stabilire che X e Y sono indipendenti si utilizzano solo frequenze. Se si conclude che X e Y sono statisticamente indipendenti, l’analisi bivariata è terminata.
Se si conclude che i due fenomeni non sono indipendenti allora fra X e Y esiste una relazione statistica. Diremo che X e Y sono CONNESSI e indicheremo con il termine CONNESSIONE una generica relazione statisticamente rilevabile in una coppia di fenomeni osservati sulla U di interesse. Bisogna poi misurare il grado di connessione, che è tanto più elevata quanto più la tabella osservata è lontana dalla tabella teorica di indipendenza.
INDICE DI CONNESSIONE χ = sommatoria che va da i=1 a k sommatoria che va da j=1 a h (fij -fij)^2/fij
Perché con questa formula si misura la connessione? Se tutte le differenze fij – fij sono uguali a 0 , cioè quando X e Y sono statisticamente indipendenti, l'indice di connessione risulta χ ^2 =0 perché sommando tutti 0, divisi per qualunque cosa, si ottiene sempre 0. Quanto più grandi sono le differenze fij – fij tanto più elevato sarà il valore dell'indice χ ^2. Esiste anche una formula alternativa per il calcolo del χ ^
indice di connessione (formula alternativa) →
χ ^2 = N(sommatoria che va da i =1 a k sommatoria che va da j=1 a h f^2uj / fi.f.j -1) (esempio pag.120 + dimostrazione pag.121)
VALORE MASSIMO DEL χ ^ 2 è il valore che l’indice assumerebbe in caso di massima connessione fra i due fenomeni, cioè in caso di una relazione
statistica perfetta in cui è sufficiente conoscere il comportamento di un fenomeno per sapere già tutto del comportamento dell’altro.
Valore massimo del χ ^2. → èil valore pari a N moltiplicato per il più piccolo fra il numero delle righe (k) e il numero delle colonne (h), meno 1. N x min {k-1,h-1} (dimostrazione pag.122)
Una volta determinato il valore massimo del χ ^2, possiamo normalizzarlo e interpretarlo.
Indice di connessione normalizzato → χ ^2 / N x min {k – 1, h – 1} con il numeratore χ ^2 calcolato sulla tabella osservata.
Il χ ^2 è sempre compreso fra 0 e 1 e moltiplicarlo per 100 è interpretabile come percentuale di connessione. La percentuale di connessione permette la valutazione della connessione.
Con la connessione abbiamo considerato una generica relazione fra i due fenomeni utilizzando la tabella nel suo complesso. Invece, registrando la nostra attenzione su singole coppie di modalità, possiamo analizzare statisticamente una relazione di tipo locale fra singole coppie di modalità xi e yj che chiameremo associazione (locale). Possiamo allora pensare alla connessione come un'associazione globale fra tutte le k modalità di X e le h modalità di Y.
Utilizzando sia le frequenze sia le modalità dei fenomeni è possibile dare un verso alla relazione, cioè stabilire se e quanto X influenza Y oppure Y influenza X.
MEDIE E VARIANZE MARGINALI E CONDIZIONATE Per iniziare assumiamo che Y sia quantitativo e X qualunque e di aver già stabilito che X e Y sono connessi. Tutto ciò vale anche quando o solo X o entrambi i fenomeni sono quantitativi. Se Y è quantitativo, le sue modalità yj sono numeriche e perciò possiamo usare la matematica: sono dunque sintetizzabili con medie e varianze.
Media marginale di Y. → èla media della v.s. marginale di Y y con trattino = 1/N sommatoria che va da j=1 a h yjf.j
Varianza marginale di Y. → èla varianza della v.s. marginale di Y σ^2 = 1/N sommatoria che va da j=1 a h (yj – y con trattino)^2 f.j = = 1/N sommatoria che va da j=1 a h y^2jf.j – y con trattino^
Media condizionata di Y dato xi. → èla media della v.s. condizionata Y|xi che si legge sulla i- esima riga della tabella y con trattino|xi= sommatoria che va da =1 a h yj fij/fi. =1/fi. Sommatoria che va da j=1 a h yjfij (l'indice i è fisso)
Varianza condizionata di Y dato xi. → èla varianza della v.s. condizionata Y|xi che si legge sula i- esima riga della tabella σ^2 = sommatoria che va da j=1 a h (yj-y con trattino xi )^2 fij/fi.
INDIPENDENZA IN MEDIA DI Y DA X partiamo da X e Y connessi. Diciamo che Y dipende da X se tale relazione di connessione si riflette sulle medie condizionate y con trattino |xi che risultano diverse fra loro al variare di X e diverse dalla media marginale. Diremo invece che Y è indipendente in media da X se è sufficiente sintetizzare le distribuzioni condizionate Y| xi nelle medie condizionate y con trattino|xi perché la relazione di connessione scompaia e le medie condizionate y con trattino|xi appaiono tutte uguali fra loro al valore di X e uguali alla media marginale y con trattino.
CONDIZIONE DI INDIPENDENZA IN MEDIA DI Y DA X è data in analogia alla condizione di indipendenza statistica ma analizzando le medie condizionate. Y è indipendente in media da X se tutte le medie condizionate sono uguali fra loro e uguali alla media marginale.
INDICE DI DIPENDENZA DI UN FENOMENO DALL’ALTRO Adesso che conosciamo la condizione di i.m possiamo osservare che, quando Y è i.m da X, allora le k differenze (ycon trattino|xi-y con trattino) sono tutte uguali a zero. Dunque quando Y è i.m da X la varianza FRA vale zero
Indice di dipendenza (di Y da X) → η^2y = σ^2 FRA/σ^2 y
η^2y assume valori compresi fra 0 e 1, cioè è un indice normalizzato che moltiplicato per 100 è interpretabile come percentuale di dipendenza.
Se entrambi i fenomeni X e Y sono quantitativi è possibile trattare matematicamente anche l’intera v.s. bivariata utilizzando le coppie di modalità di entrambi i fenomeni oltre alle frequenze congiunte fij.
Con i concetti monovariati di medie e varianze sulla v.s. bivariata si definiscono una sorta di media bivariata chiamata MOMENTO MISTO e una sorta di MISURA DI VARIABILITÀ CONGIUNTA chiamata COVARIANZA.
Utilizziamo la lettera greca μ per indicare il momento misto e la lettera greca σ per indicare la covarianza; facciamo apparire al deponente entrambi i fenomeni X e Y per ricordare che si tratta di sintesi della v.s. statica doppia; infine è necessario usare somme doppie, cioè rispetto a entrambi gli indici i e j, il che significa sommare sia per riga sia per colonna.
Momento misto → μxy = 1/N sommatoria da i=1 a k sommatoria da j=1 a h xiyjfij Covarianza → σxy=1/N sommatoria da i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj-y con trattino) fij
DIAGRAMMA A DISPERSIONE (SCATTER PLOT) è uno strumento grafico utile per visualizzare il tipo di relazione esistente fra due fenomeni X e Y quantitativi. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sul diagramma come una nuvola di kxh punti.
COSA CI FA VEDERE IL DIAGRAMMA A DISPERSIONE? ci fa vedere se fra X e Y c’è relazione statistica e, se c’è, di quale tipologia. Se c’è relazione statistica, la nuvola di punti si presenta strutturata, cioè i punti si dispongono secondo una qualche struttura e appaiono più
concentrati in particolari zone del diagramma. La struttura con cui si presentano dà indicazione circa il tipo di relazione esistente, cioè la sua FORMULAZIONE MATEMATICA.
Quando invece X e Y sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma senza nessuna struttura evidente. La relazione più semplice è quella lineare.
COVARIANZA σxy=1/N sommatoria i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj- y con trattino) fij
Dopo averle dato un’interpretazione geometrica, possiamo stabilire i vari tipi di covarianza in funzione del tipo di grafico:
Positiva σxy > 0 , cioè i punti sono concentrati in questa zona del diagramma, poiché gli scarti positivi prevalgono su quelli negativi. Negativa σxy < 0 , cioè i punti sono concentrati in questa zona del diagramma, poichè gli scarti negativi prevalgono su quelli positivi. Nulla σxy = 0 , cioè i punti sono disposti in modo che gli scarti positivi e negativi si compensino. Ciò accade quando i punti sono sparpagliati sul diagramma a dispersione senza struttura alcuna, cioè in caso di indipendenza statistica. Succede anche quando i punti sono strutturati secondo una relazione diversa e lontana da quella lineare, come quella quadratica.
CORRELAZIONE LINEARE la relazione statistica lineare fra X e Y è chiamata in questo modo.
Quando la covarianza è positiva allora X e Y sono positivamente correlati, cioè al crescere dell’uno cresce anche l’altro.
Quando la covarianza è negativa allora X e Y sono negativamente correlati, cioè al crescere dell’uno decresce l’altro.
Quando σxy = 0 allora X e Y sono incorrelati, cio è non esiste relazione di tipo lineare. Al massimo può esistere una relazione di tipo diverso e lontano da quella lineare, o anche nessuna relazione perch é sono statisticamente indipendenti.
Una volta scoperto che X e Y sono correlati ci interessa misurarne il grado, cioè stabilirne se la correlazione è forte o debole. La più nota misura della correlazione fra X e Y è detta COEFFICIENTE DI CORRELAZIONE LINEARE e la indicheremo con la lettera greca ρ. Si dimostra che:
-sotto radice σ^2xσ^2y < o = σ^2xy < o = sotto radice σ^2xσ^2y
COEFFICIENTE DI CORRELAZIONE LINEARE ρxy = σxy / sotto radice σ^2x σ^2y
Ρxy assume valori fra -1 e +1 e ci dà indicazioni sia sul verso sia sull’intensità della correlazione fra X e Y:
Infine, ci serve il concetto di realizzazione di un evento casuale che è un concetto a posteriori, cioè dopo aver eseguito l’esperimento casuale. Un evento E è realizzato se a posteriori è risultato uno degli eventi elementari che lo compongono.
COS’È LA PROBABILITÀ? la probabilità di un evento casuale E è un numero associato a E che ne quantifica a priori il grado di incertezza, ovvero la possibilità di realizzazione. La probabilità di E è il rapporto fra i casi favorevoli a E e il numero di casi possibili.
DEFINIZIONE STATISTICA questa si basa sulla legge empirica del caso, cioè una regola che non si può dimostrare matematicamente. L’evento E è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni.
lim n → infinito di f/N
VARIABILE CASUALE è una funzione con dominio (è l’insieme da cui la funzione prende ciascun elemento) nello spazio campionario e codominio (la funzione lo trasforma in elemento di un altro insieme) nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di .
FUNZIONE DI PROBABILITÀ DI X è associata a una v.c. discreta, ne descrive le probabilità e ha sempre somma 1
MEDIA O VALORE ATTESO è definita e calcolata come per la v.s. ma usando le probabilità al posto delle frequenze. Il simbolo per indicare la media di una v.c. X è standard e fa riferimento all’inglese expectation
E(X) = ∑ (con sotto x)x per P(X=x) E(X) si legge “E di X” e significa “media della v.c. X”(in particolare la formula vale per le v.c. discrete)
VARIANZA è una misura della variabilità di X, cioè della dispersione dei suoi valori intorno al suo valore atteso, ponderata con le probabilità
DEVIAZIONE STANDARD la varianza è elevata al quadrato. Quando serve ripristinare ordine di grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard. Useremo il simbolo SD (standard deviation)
Per fare inferenza statistica si usano alcune v.c. speciali. Una speciale v.c. discreta molto utile nella ricerca sociale ed economica è la V.C. BINOMIALE
La v.c. binomiale serve per modellare situazioni casuali che hanno 3 caratteristiche:
P(successo) = p, 0 < p < 1 → P(insuccesso) = 1 – p 0 = successo 1-p = insuccesso
VARIABILE STANDARD CONTINUA per fare inferenza statistica sui fenomeni statistici continui, cioè quelli che non si possono contare ma solo misurare, servono le v.c. continue.
Le v.c. continue assumono infiniti valori, dispongono della funzione di densità che serve per calcolare la probabilità di intervalli di valori di una v.c. X continua.
Una speciale v.c. continua è la v.c. normale.
VARIABILE CASUALE NORMALE la v.c. binomiale diventa sempre più simile ad una v.c. normale quando il parametro n è molto grande, fino a confondersi con una normale quando n
La Normale funziona bene quando il fenomeno ha le seguenti caratteristiche:
tende a manifestarsi con un valore sistematico prevalente (μ); i valori più probabili sono vicini a tale valore prevalente ( area intorno a μ); i valori lontani da μ sono rari e poco probabili
VARIABILE CASUALE NORMALE STANDARD(IZZATA)
Standardizzando una v.c. normale si ottiene la v.c. normale standardizzata, indicata con Z. calcolare la probabilità di intervalli di questa v.c. normale standard è molto complesso, perciò qualcuno ha prodotto delle tavole.
COME SI LEGGONO LE TAVOLE?
La prima colonna a sinistra della tavola riporta i valori z della Z~N (0,1); la prima riga riporta la seconda cifra decimale dei valori z; all’interno della tavola si legge la probabilità che Z assuma valori inferiori o uguali a quel valore z.
CAMPIONAMENTO ED ERRORE CAMPIONARIO il campione è un sottoinsieme dell’intera popolazione U su cui ci interessa studiare il fenomeno X.
controllare in termini di probabilità se e quanto la sostituzione è affidabile e accurata
i 3 parametri ignoti più semplici sono:
o la MEDIA del fenomeno in U, che corrisponde alla media μ di X o la VARIANZA del fenomeno in U, che corrisponde alla varianza σ^2 di X o una PERCENTUALE di valori di X d’interesse, che indicheremo con p
STIMATORE per controllare l’errore di stima dobbiamo tener conto di tutti i possibili risultati ottenibili da tutti i possibili campioni. Lo stimatore è la stessa funzione che definisce la stima, ma applicata alle v.c. estrazioni campionarie.
Dunque, la stima è un numero, ottenuto sul campione estratto e l’unico a disposizione. Lo stimatore è una variabile casuale, che tiene conto di tutte le possibili stime ottenibili su tutti i possibili campioni estraibili.
MEDIA CAMPIONARIA serve a stimare l’ignota media μ di U. la indicheremo con x con trattino che si legge “x sopra-segnato” o anche “x medio”.
Media campionaria (stima) → x con trattino= 1/n sommatoria che va da i= a n xi
Media campionaria (stimatore) → X con trattino= 1/n sommatoria da i=1 a n Xi
NON DISTORSIONE uno stimatore non è distorto se il suo valore atteso coincide con il parametro oggetto di stima. Se questo non succede, lo stimatore è distorto quest’ultimo tende alla sotto-stima o alla sovra-stima.
La non distorsione non basta come proprietà, è necessario definirne altre.
Per farlo abbiamo bisogno di una nuova sintesi statistica di uno stimatore L’ERRORE QUADRATICO MEDIO.
ERRORE QUADRATICO MEDIO è un modo per esprimere in formule l’errore campionario associato all’inferenza nel processo di stima, cioè l’ERRORE DI STIMA. Misura quanto lo stimatore è preciso, quanto è vicino all’ignoto parametro che si vuole stimare. L’errore è quadratico perché basato sul quadrato delle differenze fra lo stimatore e ciò che si vuole stimare; è medio perché considera il valore atteso di tutte le possibili differenze su tutti i possibili campioni.
È una quantità teorica che misura la dispersione dei valori dello stimatore intorno all’oggetto della stima.
MSE della media campionaria → MSE (X con trattino)= E(X con trattino – μ)^2=V(X con trattino)
Varianza della medie campionaria → V(X con trattino)= σ^2/n dove σ^2 indica la varianza del fenomeno in U e n è l'ampiezza campionaria.
La varianza della media campionaria è dunque anche il suo MSE (errore quadratico medio) perché è stimatore non distorto.
PROPRIETÀ DEGLI STIMATORI: CONSISTENZA è una proprietà molto importante perché è il minimo che si possa richiedere a uno stimatore. La definizione di stimatore consistente è però matematicamente complessa e coinvolge l’operazione di limite. Tecnicamente si parla di proprietà ASINTOTICA.
CONSISTENZA DELLA MEDIA CAMPIONARIA la media campionaria è consistente per μ perché per il corrispondente stimatore X con trattino valgono le due condizioni seguenti:
EFFICIENZA RELATIVA è un criterio di scelta quando si dispone di due o più diversi stimatori per lo stesso ignoto parametro. Lo stimatore con MSE (errore quadratico medio) inferiore è detto il più efficiente fra i due o più a disposizione ed è pertanto quello preferibile.
EFFICIENZA DELLA MEDIA CAMPIONARIA lo stimatore X con trattino è il più efficiente fra tutti i possibili stimatori non distorti per μ.
STIMA DELLA VARIANZA (^) σ^2 1/n sommatoria da i=1 a n (xi – x con trattino)^
Si può considerare che il corrispondente stimatore è distorto per (^) σ^2 , cioè ha valore atteso che non coincide con ciò che si vuole stimare e ha tendenza a sotto-stimare. Ottenere uno stimatore non distorto è semplice: basta dividere per (n-1) anziché per n nel calcolo della varianza del campione.
Chiameremo questa stima VARIANZA CAMPIONARIA CORRETTA e la indicheremo con s^2.
VARIANZA CAMPIONARIA CORRETTA s^2=1/n-1 sommatoria da i=1 a n (xi
La quantità (n-1) che va posta al denominatore della stima s^2 per garantirne la non distorsione, è chiamata GRADI DI LIBERTÀ.
Si può dimostrare che la varianza campionaria corretta è non distorta per (^) σ^2. È anche consistente , cioè l’errore di stima che si commette stimando (^) σ^2 con s^2 diminuisce al crescere dell’ampiezza campionaria. Questa diminuzione è più lenta rispetto a quella della media campionaria e per ottenere stime sufficientemente precise occorrono campioni più grandi. Se poi l’obiettivo è stimare la deviazione standard del fenomeno in U, bisogna ricordare che √s^2 in generale è distorta per σ.
STIMA DELLA PRECISIONE DI UNO STIMATORE: STANDARD ERROR per stimare l’errore campionario associato a un qualunque stimatore useremo la media campionaria come caso- guida. La precisione dello stimatore dipende da n e da σ^2. Vediamo come usare la varianza campionaria corretta s^2 per stimare l’errore campionario associato a