Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Descrittiva: Concetti Base e Analisi della Variabilità, Appunti di Statistica

Un'introduzione completa ai concetti fondamentali della statistica descrittiva, esplorando la variabilità dei dati e le relazioni tra fenomeni. Esempi pratici e formule per calcolare la media, la varianza, la deviazione standard e altri indicatori statistici. Inoltre, vengono approfonditi i concetti di connessione, dipendenza e indipendenza in media, con esempi di diagrammi a dispersione e coefficienti di correlazione lineare. Un'ottima risorsa per studenti universitari e chiunque desideri approfondire la comprensione della statistica descrittiva.

Tipologia: Appunti

2022/2023

Caricato il 02/12/2024

emma-pisciella
emma-pisciella 🇮🇹

5 documenti

1 / 30

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
COS’È?
insieme di metodologie e di strumenti formali per la
trattazione
quantitativa
dei fenomeni osservabili nella realt sociale.
TRATTAZIONE QUANTITATIVA
realizzazione del processo logico di :
osservazione → analisi → comprensione. Questo processo si realizza tramite
la rilevazione dei dati, l’elaborazione e la trasformazione dei dati in
informazioni
FENOMENI DI INTERESSE : FENOMENI STATISTICI che si presentano con
una molteplicit di manifestazioni. I supporti fisici o teorici delle diverse
manifestazioni del fenomeno statistico sono dette unit statistiche. L’insieme
delle unit statistiche è chiamato POPOLAZIONE STATISTICA O UNIVERSO.
la lettera U (maiuscolo) per denotare la popolazione o universo statistico
le lettere latine maiuscole ( tranne la U) per indicare i fenomeni
statistici
le lettere minuscole per indicare ogni singola manifestazione del
fenomeno indicato con la corrispondente lettera maiuscola. In
linguaggio tecnico parleremo di
modalit
o
valori
del fenomeno.
Esempio:
Y: secolarizzazione
U: insieme di soggetti
y: licenza media o diploma o laurea ecc.
La statistica ha la funzione di descrivere il comportamento di X su U. gli
strumenti di analisi statistica adeguati a questo scopo formano LA
STATISTICA DESCRITTIVA, che si classifica a sua volta in:
MONOVARIATA che ha per oggetto un solo fenomeno singolarmente
rilevato e come obiettivo la descrizione sintetica del suo comportamento
su U;
BIVARIATA, quando l'oggetto è una coppia di fenomeni congiuntamente
rilevati sulla stessa U e l'obiettivo è l'individuazione e lo studio delle
relazioni fra i due;
MULTIVARIATA, se i fenomeni rilevati sulla stessa U sono pi: di due e
l'obiettivo è descriverne il comportamento congiunto e studiarne le
relazioni, congiuntamente (tutti insieme) e per loro sottoinsiemi
( coppie, terne ecc.).
INFERENZA STATISTICA: induzione del particolare (campione) al generale
(U).
STATISTICA INFERENZIALE: strumenti di analisi adeguati a fare inferenza
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Anteprima parziale del testo

Scarica Statistica Descrittiva: Concetti Base e Analisi della Variabilità e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

COS’È?  insieme di metodologie e di strumenti formali per la trattazione quantitativa dei fenomeni osservabili nella realtà sociale.

TRATTAZIONE QUANTITATIVA  realizzazione del processo logico di :

osservazione → analisi → comprensione. Questo processo si realizza tramite la rilevazione dei dati, l’elaborazione e la trasformazione dei dati in informazioni

FENOMENI DI INTERESSE : FENOMENI STATISTICI che si presentano con una molteplicità di manifestazioni. I supporti fisici o teorici delle diverse manifestazioni del fenomeno statistico sono dette unità statistiche. L’insieme delle unità statistiche è chiamato POPOLAZIONE STATISTICA O UNIVERSO.

 la lettera U (maiuscolo) per denotare la popolazione o universo statistico  le lettere latine maiuscole ( tranne la U) per indicare i fenomeni statistici  le lettere minuscole per indicare ogni singola manifestazione del fenomeno indicato con la corrispondente lettera maiuscola. In linguaggio tecnico parleremo di modalità o valori del fenomeno. Esempio:

Y: secolarizzazione U: insieme di soggetti y: licenza media o diploma o laurea ecc.

La statistica ha la funzione di descrivere il comportamento di X su U. gli strumenti di analisi statistica adeguati a questo scopo formano LA STATISTICA DESCRITTIVA, che si classifica a sua volta in:

 MONOVARIATA  che ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione sintetica del suo comportamento su U;  BIVARIATA, quando l'oggetto è una coppia di fenomeni congiuntamente rilevati sulla stessa U e l'obiettivo è l'individuazione e lo studio delle relazioni fra i due;  MULTIVARIATA, se i fenomeni rilevati sulla stessa U sono più di due e l'obiettivo è descriverne il comportamento congiunto e studiarne le relazioni, congiuntamente (tutti insieme) e per loro sottoinsiemi ( coppie, terne ecc.).

INFERENZA STATISTICA: induzione del particolare (campione) al generale (U).

STATISTICA INFERENZIALE: strumenti di analisi adeguati a fare inferenza

FENOMENI QUALITATIVI: si manifestano nella popolazione osservata attraverso attributi o categorie, qualità appunto.

FENOMENI QUANTITATIVI: si manifestano nella popolazione osservata attraverso numeri, quantità appunto.

Per certi tipi di analisi statistica è necessario che le manifestazioni del fenomeno analizzato possono essere ordinate. Le manifestazioni dei fenomeni quantitativi possono essere sempre ordinate poiché fra i numeri esiste una relazione d'ordine naturale. Per i fenomeni qualitativi invece è importante la sotto-classificazione. Fenomeni qualitativi ordinali → sono i fenomeni che pur essendo qualitativi, si manifestano con attributi e categorie che si possono ordinare secondo un qualche criterio oggettivo e convenzionalmente accertato.

Fenomeni qualitativi categoriali → sono tutti i fenomeni qualitativi per i quali non abbiamo un criterio oggettivo (ma solo personale e variabile) per ordinare le categorie con cui si manifesta.

Fra i fenomeni quantitativi facciamo una distinzione fra i fenomeni DISCRETI e CONTINUI.

FENOMENI QUANTITATIVI DISCRETI  sono i fenomeni quantitativi che possiamo enumerare.

FENOMENI QUANTITATIVI CONTINUI  sono i fenomeni quantitativi che si possono misurare, una volta scelta un’opportuna unità di misura e con la disponibilità del corretto strumento di misurazione.

Per quanto riguarda la rilevazione, l’insieme delle caselline previste per ogni domanda costituisce la scala delle modalità o scala di rilevazione.

Le caratteristiche principali della scala delle modalità sono: esaustività e mutua esclusività.

ESAUSTIVITÀ  la scala delle modalità con cui si effettua la rilevazione deve essere esaustiva, deve cioè prevedere tutte le possibili manifestazioni di X che si possono osservare su U.

MUTUA ESCLUSIVITÀ  la scala con cui si effettua la rilevazione deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizione.

Nelle qualitative ci sono 2 sotto-gruppi:

 SCALA QUALITATIVA ORDINALE  è una scala qualitativa nella quale gli attributi o le categorie di cui consta possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato. Relazioni di =; ≠; >uguale ;<uguale

Le frequenze assolute non sono confrontabili fra popolazioni di numerosità diversa.

Se lo si volesse fare occorre depurare le frequenze assolute dall’influenza di N costruendo le frequenze relative.

FREQUENZE RELATIVE  associata alla modalità xi è il rapporto (divisione) fra le frequenza assoluta di xi e la numerosità N di U. indicheremo la frequenza relativa con pi. In formule e più brevemente che a parole  pi=fi/N

Le frequenze relative pi sono rapporti particolari con il denominatore che rappresenta il totale del numeratore. Risultano perciò sempre comprese fra 0 e 1 e la loro somma è pari a 1. formula in sintesi: 1/N x N= N/N = 1

FREQUENZE CUMULATE  quando il fenomeno di interesse è almeno ordinale possiamo aumentare il livello di analisi e costruire un ulteriore tipo di distribuzione con frequenze. In questo caso è buona pratica costruire la v.s ordinando in senso crescente le modalità osservate partendo dal minimo x1 e arrivando al massimo xk: x1<x2<...<xk-1 < xk.

Si tratta di sommare (cumulare) le frequenze associate alle modalità inferiori di xi costruendo le frequenze cumulate. Indicheremo con Fi le frequenze cumulate assolute e useremo la lettera greca “phi” maiuscolo per indicare le frequenze cumulate relative.

PROPRIETÀ DELLE FREQUENZE CUMULATE:

  1. Le frequenze cumulare assolute sono numeri interi compresi fra 0 e N mentre quelle relative sono comprese fra 0 e 1. la prima frequenza cumulata coincide con la frequenza della modalità più piccola; l'ultima frequenza cumulata coincide con la numerosità N di U se parliamo di freq. Cumulate assolute, coincide con 1 se parliamo di freq. Cumulate relative. Il fenomeno X è almeno ordinale e le modalità xi sono ordinate, dunque xi è la più piccola e xk è la più grande
  2. Fra le frequenze assolute e relative e le corrispondenti frequenze cumulate esiste una corrispondenza biunivoca: se conosciamo le frequenze assolute o relative possiamo ottenere le cumulate sommando, se conosciamo le cumulate possiamo ottenere le frequenze sottraendo

DENSITÀ DI FREQUENZA

Limitiamo la nostra attenzione ai fenomeni quantitativi continui. Se X è continuo le modalità xi sono intervalli.

Siamo di fronte ad una mancanza di informazioni. Ogni volta che ci troviamo in una situazione di questo tipo, per superare l'ostacolo si ricorre all'emissione di ipotesi in sostituzione delle informazioni ignote. L'ipotesi adottata deve essere ragionevole cioè argomentabile sostenibile e convincente. Due sono le ipotesi comunemente emesse :

  1. ipotesi del valore centrale. L'obiettivo è di assegnare a ciascuna delle fi unità statistiche un unico punto interno all'intervallo stesso. Il principale adottato è in medio stat virtus. Il metodo consiste nell'associare tutte le fi al valore centrale dell'intervallo. Il valore centrale è la semisomma dei suoi estremi. Indicheremo il valore centrale di un intervallo con l'asterisco: xi*= xl+xL/

(esempio pag.33) Con questa ipotesi si attua una sostanziale discretizzazione della v.s. : si supera il problema dell'ignota distribuzione ma si perde la natura continua rappresentata dagli intervalli.

  1. Ipotesi di distribuzione uniforme. Consiste nel considerare alla pari ogni possibilità. Se non sappiamo niente circa dove si posizionano esattamente le fi, allora le distribuiamo in modo uniforme ed equidistante lungo tutto l'intervallo

Con le distribuzioni di frequenze si possono costruire i grafici. La forma grafica è preferibile a quella tabellare in fase di interpretazione e comunicazione dei risultati dell’analisi statistica. Per i fenomeni qualitativi il grafico è un semplice disegno che affianca o sostituisce la tabella. Per i fenomeni quantitativi, quando le xi sono numeri si costruiscono veri e propri diagrammi cartesiani. Le xi poste sulle ascisse e le fi poste sulle ordinate. Quando X è discreto un diagramma efficace è a bastoncini.

Sappiamo che adottare l'ipotesi del valore centrale si traduce nella discretizzazione della v.s. attraverso i valori centrali x*i degli intervalli. Una volta ricondotti al caso discreto si può procedere alla rappresentazione grafica prevista nel caso discreto, cioè a bastoncini. Se invece si adotta l'ipotesi della distribuzione uniforme, si presenta la natura continua del fenomeno e l'obiettivo di associare la frequenza a tutti gli infiniti punti dell'intervallo, in modo che sia uniformemente distribuita, si raggiunge rappresentando la frequenza come un'area. Per rappresentare la distribuzione di frequenze assolute, sotto l'ipotesi di una distribuzione uniforme, si pongono gli intervalli xi:xl|- xL sulle ascisse e le densità di frequenza phi piccolo sulle ordinate

Il diagramma che si ottiene è a rettangoli accostati e prende il nome di istogramma o diagramma areale. In un istogramma le frequenze sono rappresentate come aree.

L'area totale sottesa all'istogramma è:

 pari a N se si rappresentano le frequenze assolute fi (phi sulle ordinate).  Pari a 1 se si rappresentano le frequenze relative pi(phi/N sulle ordinate).

COS’È IL VALORE MEDIO?  è un unico valore che da solo ci da un’idea del comportamento di X su U e del suo ordine di grandezza. Si tratta di passare da un’intera distribuzione a un singolo valore, il valore medio appunto.

PROPRIETÀ DI MANTENIMENTO E DI EQUIDISTRIBUZIONE DEL TOTALE

→ la somma di tutti i valori di X su tutte le N unità osservate prende il nome di totale di X. In formule: sommatoria che va da i=1 a k di xifi = totale di X (su U)

inoltre dividendo il totale di X per N si ottiene la media aritmetica di X. Il totale di X può anche essere dato dalla media moltiplicata per N che, a sua volta, è la somma delle frequenze fi.

VARIABILITÀ  attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti.

La variabilità è ciò che rende necessario il ricorso alla strumentazione statistica per l’analisi e la comprensione del comportamento del fenomeno su U. la variabilità di X quantitativo è l’aspetto essenziale nella descrizione statistica del suo comportamento su U.

Una misura della variabilità di X è un indice sintetico con le seguenti caratteristiche:

propriet à di un indice di variabilità :

I. assume valore 0 in assenza di variabilità , cioè nella situazione in cui X si manifesta con un’unica modalità , generando una v.s. costante; II. assume valori positivi quando X si manifesta con modalit à molteplici e differenti, cioè in caso di variabilità III. assume valori positivi e via via più grandi all’aumentare della variabilità

la più semplice misura di variabilità che chiamiamo RANGE, si ottiene confrontando la più piccola e la più grande fra le modalità osservate.

RANGE DI X= XMAX – XMIN  questa misura ha tutte le caratteristiche sopra elencate

Il range è basato solo su 2 fra le k osservate, cioè quelle estreme, mentre il resto della v.s. è ignorato.

Per migliorare le cose possiamo prendere la differenza fra i due quartili, superiore e inferiore, di X. Così otteniamo un’altra misura di variabilità chiamata DIFFERENZA INTERQUARTILE. Questa è il range della metà centrale delle osservazioni.

DEVIAZIONE STANDARD DI X  è una misura più raffinata, che utilizza tutta la v.s. ha come notazione standard “”.

Formula di “” :

la forma deriva da :

 ogni modalità xi è confrontata con la media aritmetica che essendo un valore sintesi della v.s. funziona bene come polo di confronto.  La differenza (xi – x con trattino) può risultare positiva o negativa a seconda che xi sia una modalità sopra o sotto media. Ai nostri fini il segno dello scarto è ininfluente: quello che ci interessa è se xi è vicina o lontana dal polo di confronto (ovvero la media aritmetica); dunque ci interessa la distanza di xi dalla media aritmetica. Per eliminare l'influenza del segno, si considerano gli scarti quadratici , cioè elevati al quadrato. (xi – x con trattino)^2. Per ragioni di semplicità il quadrato è preferibile al valore assoluto in quanto è più semplice da trattare matematicamente e ha l'effetto di enfatizzare le distanze.  Gli scarti quadratici vengono poi ponderati con le frequenze. Si tiene cioè conto del fatto che la modalità xi si presenta in U fi volte (xi – x con trattino)^2 fi. Se si sommano tutti gli scarti ponderati non al quadrato ma con il loro segno si ottiene sempre 0.  poiché di scarti quadratici ne abbiamo k (tanti quante sono le modalità osservate), li sintetizziamo tutti in una media sommando e dividendo poi per N  infine si ristabilisce l'ordine di grandezza e l'unità di misura (alterati dall'elevamento al quadrato) prendendo la radice quadrata.

La deviazione standard misura la variabilità di X considerando la dispersione dei suoi valori intorno al suo valore medio. Essa ci dice che X si manifesta su U con valori che in media distano dalla media aritmetica per più o meno .

Facendo riferimento al  si definiscono altre 2 misure di variabilità di X su U chiamate VARIANZA e DEVIANZA. La deviazione standard elevata al quadrato è la varianza di X:

σ ^2 = 1/N sommatoria che va da i=1 a k (xi – x con trattino)^2 fi

La varianza moltiplicata per N definisce la devianza di X:

N σ^2 = sommatoria che va da i =1 a k (xi – x con trattino)^2 fi

Fissando l’attenzione sulle singole righe o sulle singole colonne separatamente, si costruiscono le v.s. condizionate da Y|xi e X|yj.

Sulle v.s. condizionate si costruiscono le frequenze condizionate che vengono chiamate PERCENTUALI DI RIGA E PERCENTUALI DI COLONNA.

Se fra X e Y non c’è nessuna relazione statistica, allora X e Y sono statisticamente INDIPENDENTI. Il modo per stabilire se siano o meno indipendenti è confrontare le frequenze condizionate con le frequenze marginali. Bada bene che le frequenze marginali si riferiscono all’intera U di numerosità N e le frequenze condizionate si riferiscono a sotto-popolazioni di numerosità fi.

Le frequenze marginali relative si ottengono dalle frequenze marginali assolute dividendo per N.

FREQUENZE TEORICHE DI INDIPENDENZA STATISTICA  sono quelle frequenze che si ottengono facendo un semplice passaggio algebrico sulla condizione di indipendenza statistica

TABELLA TEORICA DI INDIPENDENZA STATISTICA  si compila mantenendo fisse le marginali e sostituendo le frequenze congiunte osservate con le frequenze teoriche di indipendenza statistica.

Il concetto di indipendenza statistica è SIMMETRICO  si dice che fra X e Y esiste indipendenza statistica, intendendo che Y è indipendente da X e che X è indipendente da Y.

Per stabilire che X e Y sono indipendenti si utilizzano solo frequenze. Se si conclude che X e Y sono statisticamente indipendenti, l’analisi bivariata è terminata.

Se si conclude che i due fenomeni non sono indipendenti allora fra X e Y esiste una relazione statistica. Diremo che X e Y sono CONNESSI e indicheremo con il termine CONNESSIONE una generica relazione statisticamente rilevabile in una coppia di fenomeni osservati sulla U di interesse. Bisogna poi misurare il grado di connessione, che è tanto più elevata quanto più la tabella osservata è lontana dalla tabella teorica di indipendenza.

INDICE DI CONNESSIONE  χ = sommatoria che va da i=1 a k sommatoria che va da j=1 a h (fij -fij)^2/fij

Perché con questa formula si misura la connessione? Se tutte le differenze fij – fij sono uguali a 0 , cioè quando X e Y sono statisticamente indipendenti, l'indice di connessione risulta χ ^2 =0 perché sommando tutti 0, divisi per qualunque cosa, si ottiene sempre 0. Quanto più grandi sono le differenze fij – fij tanto più elevato sarà il valore dell'indice χ ^2. Esiste anche una formula alternativa per il calcolo del χ ^

indice di connessione (formula alternativa) →

χ ^2 = N(sommatoria che va da i =1 a k sommatoria che va da j=1 a h f^2uj / fi.f.j -1) (esempio pag.120 + dimostrazione pag.121)

VALORE MASSIMO DEL χ ^ 2  è il valore che l’indice assumerebbe in caso di massima connessione fra i due fenomeni, cioè in caso di una relazione

statistica perfetta in cui è sufficiente conoscere il comportamento di un fenomeno per sapere già tutto del comportamento dell’altro.

Valore massimo del χ ^2. → èil valore pari a N moltiplicato per il più piccolo fra il numero delle righe (k) e il numero delle colonne (h), meno 1. N x min {k-1,h-1} (dimostrazione pag.122)

Una volta determinato il valore massimo del χ ^2, possiamo normalizzarlo e interpretarlo.

Indice di connessione normalizzato → χ ^2 / N x min {k – 1, h – 1} con il numeratore χ ^2 calcolato sulla tabella osservata.

Il χ ^2 è sempre compreso fra 0 e 1 e moltiplicarlo per 100 è interpretabile come percentuale di connessione. La percentuale di connessione permette la valutazione della connessione.

Con la connessione abbiamo considerato una generica relazione fra i due fenomeni utilizzando la tabella nel suo complesso. Invece, registrando la nostra attenzione su singole coppie di modalità, possiamo analizzare statisticamente una relazione di tipo locale fra singole coppie di modalità xi e yj che chiameremo associazione (locale). Possiamo allora pensare alla connessione come un'associazione globale fra tutte le k modalità di X e le h modalità di Y.

Utilizzando sia le frequenze sia le modalità dei fenomeni è possibile dare un verso alla relazione, cioè stabilire se e quanto X influenza Y oppure Y influenza X.

MEDIE E VARIANZE MARGINALI E CONDIZIONATE  Per iniziare assumiamo che Y sia quantitativo e X qualunque e di aver già stabilito che X e Y sono connessi. Tutto ciò vale anche quando o solo X o entrambi i fenomeni sono quantitativi. Se Y è quantitativo, le sue modalità yj sono numeriche e perciò possiamo usare la matematica: sono dunque sintetizzabili con medie e varianze.

Media marginale di Y. → èla media della v.s. marginale di Y y con trattino = 1/N sommatoria che va da j=1 a h yjf.j

Varianza marginale di Y. → èla varianza della v.s. marginale di Y σ^2 = 1/N sommatoria che va da j=1 a h (yj – y con trattino)^2 f.j = = 1/N sommatoria che va da j=1 a h y^2jf.j – y con trattino^

Media condizionata di Y dato xi. → èla media della v.s. condizionata Y|xi che si legge sulla i- esima riga della tabella y con trattino|xi= sommatoria che va da =1 a h yj fij/fi. =1/fi. Sommatoria che va da j=1 a h yjfij (l'indice i è fisso)

Varianza condizionata di Y dato xi. → èla varianza della v.s. condizionata Y|xi che si legge sula i- esima riga della tabella σ^2 = sommatoria che va da j=1 a h (yj-y con trattino xi )^2 fij/fi.

INDIPENDENZA IN MEDIA DI Y DA X  partiamo da X e Y connessi. Diciamo che Y dipende da X se tale relazione di connessione si riflette sulle medie condizionate y con trattino |xi che risultano diverse fra loro al variare di X e diverse dalla media marginale. Diremo invece che Y è indipendente in media da X se è sufficiente sintetizzare le distribuzioni condizionate Y| xi nelle medie condizionate y con trattino|xi perché la relazione di connessione scompaia e le medie condizionate y con trattino|xi appaiono tutte uguali fra loro al valore di X e uguali alla media marginale y con trattino.

CONDIZIONE DI INDIPENDENZA IN MEDIA DI Y DA X  è data in analogia alla condizione di indipendenza statistica ma analizzando le medie condizionate. Y è indipendente in media da X se tutte le medie condizionate sono uguali fra loro e uguali alla media marginale.

INDICE DI DIPENDENZA DI UN FENOMENO DALL’ALTRO  Adesso che conosciamo la condizione di i.m possiamo osservare che, quando Y è i.m da X, allora le k differenze (ycon trattino|xi-y con trattino) sono tutte uguali a zero. Dunque quando Y è i.m da X la varianza FRA vale zero

Indice di dipendenza (di Y da X) → η^2y = σ^2 FRA/σ^2 y

η^2y assume valori compresi fra 0 e 1, cioè è un indice normalizzato che moltiplicato per 100 è interpretabile come percentuale di dipendenza.

Se entrambi i fenomeni X e Y sono quantitativi è possibile trattare matematicamente anche l’intera v.s. bivariata utilizzando le coppie di modalità di entrambi i fenomeni oltre alle frequenze congiunte fij.

Con i concetti monovariati di medie e varianze sulla v.s. bivariata si definiscono una sorta di media bivariata chiamata MOMENTO MISTO e una sorta di MISURA DI VARIABILITÀ CONGIUNTA chiamata COVARIANZA.

Utilizziamo la lettera greca μ per indicare il momento misto e la lettera greca σ per indicare la covarianza; facciamo apparire al deponente entrambi i fenomeni X e Y per ricordare che si tratta di sintesi della v.s. statica doppia; infine è necessario usare somme doppie, cioè rispetto a entrambi gli indici i e j, il che significa sommare sia per riga sia per colonna.

Momento misto → μxy = 1/N sommatoria da i=1 a k sommatoria da j=1 a h xiyjfij Covarianza → σxy=1/N sommatoria da i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj-y con trattino) fij

DIAGRAMMA A DISPERSIONE (SCATTER PLOT)  è uno strumento grafico utile per visualizzare il tipo di relazione esistente fra due fenomeni X e Y quantitativi. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sul diagramma come una nuvola di kxh punti.

COSA CI FA VEDERE IL DIAGRAMMA A DISPERSIONE?  ci fa vedere se fra X e Y c’è relazione statistica e, se c’è, di quale tipologia. Se c’è relazione statistica, la nuvola di punti si presenta strutturata, cioè i punti si dispongono secondo una qualche struttura e appaiono più

concentrati in particolari zone del diagramma. La struttura con cui si presentano dà indicazione circa il tipo di relazione esistente, cioè la sua FORMULAZIONE MATEMATICA.

Quando invece X e Y sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma senza nessuna struttura evidente. La relazione più semplice è quella lineare.

COVARIANZA  σxy=1/N sommatoria i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj- y con trattino) fij

Dopo averle dato un’interpretazione geometrica, possiamo stabilire i vari tipi di covarianza in funzione del tipo di grafico:

Positiva σxy > 0 , cioè i punti sono concentrati in questa zona del diagramma, poiché gli scarti positivi prevalgono su quelli negativi.  Negativa σxy < 0 , cioè i punti sono concentrati in questa zona del diagramma, poichè gli scarti negativi prevalgono su quelli positivi.  Nulla σxy = 0 , cioè i punti sono disposti in modo che gli scarti positivi e negativi si compensino. Ciò accade quando i punti sono sparpagliati sul diagramma a dispersione senza struttura alcuna, cioè in caso di indipendenza statistica. Succede anche quando i punti sono strutturati secondo una relazione diversa e lontana da quella lineare, come quella quadratica.

CORRELAZIONE LINEARE  la relazione statistica lineare fra X e Y è chiamata in questo modo.

Quando la covarianza è positiva allora X e Y sono positivamente correlati, cioè al crescere dell’uno cresce anche l’altro.

Quando la covarianza è negativa allora X e Y sono negativamente correlati, cioè al crescere dell’uno decresce l’altro.

Quando σxy = 0 allora X e Y sono incorrelati, cio è non esiste relazione di tipo lineare. Al massimo può esistere una relazione di tipo diverso e lontano da quella lineare, o anche nessuna relazione perch é sono statisticamente indipendenti.

Una volta scoperto che X e Y sono correlati ci interessa misurarne il grado, cioè stabilirne se la correlazione è forte o debole. La più nota misura della correlazione fra X e Y è detta COEFFICIENTE DI CORRELAZIONE LINEARE e la indicheremo con la lettera greca ρ. Si dimostra che:

-sotto radice σ^2xσ^2y < o = σ^2xy < o = sotto radice σ^2xσ^2y

COEFFICIENTE DI CORRELAZIONE LINEARE  ρxy = σxy / sotto radice σ^2x σ^2y

Ρxy assume valori fra -1 e +1 e ci dà indicazioni sia sul verso sia sull’intensità della correlazione fra X e Y:

  1. EVENTO CASUALE  è un sottoinsieme dello spazio campionario  e questo è un concetto più generale del concetto di evento elementare. La sua notazione è E sottoinsieme di 

Infine, ci serve il concetto di realizzazione di un evento casuale che è un concetto a posteriori, cioè dopo aver eseguito l’esperimento casuale. Un evento E è realizzato se a posteriori è risultato uno degli eventi elementari che lo compongono.

COS’È LA PROBABILITÀ?  la probabilità di un evento casuale E è un numero associato a E che ne quantifica a priori il grado di incertezza, ovvero la possibilità di realizzazione. La probabilità di E è il rapporto fra i casi favorevoli a E e il numero di casi possibili.

DEFINIZIONE STATISTICA  questa si basa sulla legge empirica del caso, cioè una regola che non si può dimostrare matematicamente. L’evento E è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni.

lim n → infinito di f/N

VARIABILE CASUALE  è una funzione con dominio (è l’insieme da cui la funzione prende ciascun elemento) nello spazio campionario  e codominio (la funzione lo trasforma in elemento di un altro insieme) nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di .

FUNZIONE DI PROBABILITÀ DI X  è associata a una v.c. discreta, ne descrive le probabilità e ha sempre somma 1

MEDIA O VALORE ATTESO  è definita e calcolata come per la v.s. ma usando le probabilità al posto delle frequenze. Il simbolo per indicare la media di una v.c. X è standard e fa riferimento all’inglese expectation

E(X) = ∑ (con sotto x)x per P(X=x) E(X) si legge “E di X” e significa “media della v.c. X”(in particolare la formula vale per le v.c. discrete)

VARIANZA  è una misura della variabilità di X, cioè della dispersione dei suoi valori intorno al suo valore atteso, ponderata con le probabilità

DEVIAZIONE STANDARD  la varianza è elevata al quadrato. Quando serve ripristinare ordine di grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard. Useremo il simbolo SD (standard deviation)

Per fare inferenza statistica si usano alcune v.c. speciali. Una speciale v.c. discreta molto utile nella ricerca sociale ed economica è la V.C. BINOMIALE

La v.c. binomiale serve per modellare situazioni casuali che hanno 3 caratteristiche:

  1. L’esperimento casuale consiste nell’esecuzione di n prove indipendenti, cioè in cui l’esito di ciascuna prova non influenza l’esito della prova successiva.
  2. Chiamiamo questi eventi SUCCESSO e INSUCCESSO. In questo modo si possono modellare i fenomeni dicotomici, cioè i fenomeni statistici che si manifestano con si/no, vero/falso
  1. La prova del successo è nota e costante. Poiché p è una probabilità, è un numero compreso fra 0 e 1, è nota anche la probabilità dell’insuccesso.

P(successo) = p, 0 < p < 1 → P(insuccesso) = 1 – p  0 = successo 1-p = insuccesso

VARIABILE STANDARD CONTINUA  per fare inferenza statistica sui fenomeni statistici continui, cioè quelli che non si possono contare ma solo misurare, servono le v.c. continue.

Le v.c. continue assumono infiniti valori, dispongono della funzione di densità che serve per calcolare la probabilità di intervalli di valori di una v.c. X continua.

Una speciale v.c. continua è la v.c. normale.

VARIABILE CASUALE NORMALE  la v.c. binomiale diventa sempre più simile ad una v.c. normale quando il parametro n è molto grande, fino a confondersi con una normale quando n

  1. Ha la funzione di densità φ(x). L’area sottesa al grafico della φ(x) in un certo intervallo rappresenta la probabilità che la v.c. X assuma valori di quell’intervallo. La rappresentazione grafica è la famosa curva a campana centrata sul valore .
  2. L’area totale sottesa all’intera curva corrisponde alla probabilità dell’intero intervallo ed è pari a 1
  3.  è anche la sua moda, cioè il valore più probabile

La Normale funziona bene quando il fenomeno ha le seguenti caratteristiche:

 tende a manifestarsi con un valore sistematico prevalente (μ);  i valori più probabili sono vicini a tale valore prevalente ( area intorno a μ);  i valori lontani da μ sono rari e poco probabili

VARIABILE CASUALE NORMALE STANDARD(IZZATA)

Standardizzando una v.c. normale si ottiene la v.c. normale standardizzata, indicata con Z. calcolare la probabilità di intervalli di questa v.c. normale standard è molto complesso, perciò qualcuno ha prodotto delle tavole.

COME SI LEGGONO LE TAVOLE?

La prima colonna a sinistra della tavola riporta i valori z della Z~N (0,1); la prima riga riporta la seconda cifra decimale dei valori z; all’interno della tavola si legge la probabilità che Z assuma valori inferiori o uguali a quel valore z.

CAMPIONAMENTO ED ERRORE CAMPIONARIO  il campione è un sottoinsieme dell’intera popolazione U su cui ci interessa studiare il fenomeno X.

 controllare in termini di probabilità se e quanto la sostituzione è affidabile e accurata

i 3 parametri ignoti più semplici sono:

o la MEDIA del fenomeno in U, che corrisponde alla media μ di X o la VARIANZA del fenomeno in U, che corrisponde alla varianza σ^2 di X o una PERCENTUALE di valori di X d’interesse, che indicheremo con p

STIMATORE  per controllare l’errore di stima dobbiamo tener conto di tutti i possibili risultati ottenibili da tutti i possibili campioni. Lo stimatore è la stessa funzione che definisce la stima, ma applicata alle v.c. estrazioni campionarie.

Dunque, la stima è un numero, ottenuto sul campione estratto e l’unico a disposizione. Lo stimatore è una variabile casuale, che tiene conto di tutte le possibili stime ottenibili su tutti i possibili campioni estraibili.

MEDIA CAMPIONARIA  serve a stimare l’ignota media μ di U. la indicheremo con x con trattino che si legge “x sopra-segnato” o anche “x medio”.

Media campionaria (stima) → x con trattino= 1/n sommatoria che va da i= a n xi

Media campionaria (stimatore) → X con trattino= 1/n sommatoria da i=1 a n Xi

NON DISTORSIONE  uno stimatore non è distorto se il suo valore atteso coincide con il parametro oggetto di stima. Se questo non succede, lo stimatore è distorto  quest’ultimo tende alla sotto-stima o alla sovra-stima.

La non distorsione non basta come proprietà, è necessario definirne altre.

Per farlo abbiamo bisogno di una nuova sintesi statistica di uno stimatore  L’ERRORE QUADRATICO MEDIO.

ERRORE QUADRATICO MEDIO  è un modo per esprimere in formule l’errore campionario associato all’inferenza nel processo di stima, cioè l’ERRORE DI STIMA. Misura quanto lo stimatore è preciso, quanto è vicino all’ignoto parametro che si vuole stimare. L’errore è quadratico perché basato sul quadrato delle differenze fra lo stimatore e ciò che si vuole stimare; è medio perché considera il valore atteso di tutte le possibili differenze su tutti i possibili campioni.

È una quantità teorica che misura la dispersione dei valori dello stimatore intorno all’oggetto della stima.

MSE della media campionaria → MSE (X con trattino)= E(X con trattino – μ)^2=V(X con trattino)

Varianza della medie campionaria → V(X con trattino)= σ^2/n dove σ^2 indica la varianza del fenomeno in U e n è l'ampiezza campionaria.

La varianza della media campionaria è dunque anche il suo MSE (errore quadratico medio) perché è stimatore non distorto.

PROPRIETÀ DEGLI STIMATORI: CONSISTENZA  è una proprietà molto importante perché è il minimo che si possa richiedere a uno stimatore. La definizione di stimatore consistente è però matematicamente complessa e coinvolge l’operazione di limite. Tecnicamente si parla di proprietà ASINTOTICA.

CONSISTENZA DELLA MEDIA CAMPIONARIA  la media campionaria è consistente per μ perché per il corrispondente stimatore X con trattino valgono le due condizioni seguenti:

  1. X con trattino è non distorto, cioè E(X con trattino)= μ 2. La sua varianza diventa sempre più piccola all’aumentare dell’ampiezza campionaria, in formule lim n → ∞ V(X con trattino) = 0

EFFICIENZA RELATIVA  è un criterio di scelta quando si dispone di due o più diversi stimatori per lo stesso ignoto parametro. Lo stimatore con MSE (errore quadratico medio) inferiore è detto il più efficiente fra i due o più a disposizione ed è pertanto quello preferibile.

EFFICIENZA DELLA MEDIA CAMPIONARIA  lo stimatore X con trattino è il più efficiente fra tutti i possibili stimatori non distorti per μ.

STIMA DELLA VARIANZA (^) σ^2  1/n sommatoria da i=1 a n (xi – x con trattino)^

Si può considerare che il corrispondente stimatore è distorto per (^) σ^2 , cioè ha valore atteso che non coincide con ciò che si vuole stimare e ha tendenza a sotto-stimare. Ottenere uno stimatore non distorto è semplice: basta dividere per (n-1) anziché per n nel calcolo della varianza del campione.

Chiameremo questa stima VARIANZA CAMPIONARIA CORRETTA e la indicheremo con s^2.

VARIANZA CAMPIONARIA CORRETTA  s^2=1/n-1 sommatoria da i=1 a n (xi

  • x con trattino)^2  questa varianza è una funzione dei dati campionari un po’ più complessa.

La quantità (n-1) che va posta al denominatore della stima s^2 per garantirne la non distorsione, è chiamata GRADI DI LIBERTÀ.

Si può dimostrare che la varianza campionaria corretta è non distorta per (^) σ^2. È anche consistente , cioè l’errore di stima che si commette stimando (^) σ^2 con s^2 diminuisce al crescere dell’ampiezza campionaria. Questa diminuzione è più lenta rispetto a quella della media campionaria e per ottenere stime sufficientemente precise occorrono campioni più grandi. Se poi l’obiettivo è stimare la deviazione standard del fenomeno in U, bisogna ricordare che √s^2 in generale è distorta per σ.

STIMA DELLA PRECISIONE DI UNO STIMATORE: STANDARD ERROR  per stimare l’errore campionario associato a un qualunque stimatore useremo la media campionaria come caso- guida. La precisione dello stimatore dipende da n e da σ^2. Vediamo come usare la varianza campionaria corretta s^2 per stimare l’errore campionario associato a