Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Statistica Descrittiva: Concetti Base e Analisi della Variabilità, Appunti di Statistica

Università degli Studi di Milano-Bicocca (UNIMIB)Statistica

Un'introduzione completa ai concetti fondamentali della statistica descrittiva, esplorando la variabilità dei dati e le relazioni tra fenomeni. Esempi pratici e formule per calcolare la media, la varianza, la deviazione standard e altri indicatori statistici. Inoltre, vengono approfonditi i concetti di connessione, dipendenza e indipendenza in media, con esempi di diagrammi a dispersione e coefficienti di correlazione lineare. Un'ottima risorsa per studenti universitari e chiunque desideri approfondire la comprensione della statistica descrittiva.

Tipologia: Appunti

2022/2023

Caricato il 02/12/2024

emma-pisciella 🇮🇹

5 documenti

1 / 30

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

STATISTICA

COS’È?

 insieme di metodologie e di strumenti formali per la

trattazione

quantitativa

dei fenomeni osservabili nella realt sociale.

TRATTAZIONE QUANTITATIVA 

realizzazione del processo logico di :

osservazione → analisi → comprensione. Questo processo si realizza tramite

la rilevazione dei dati, l’elaborazione e la trasformazione dei dati in

informazioni

FENOMENI DI INTERESSE : FENOMENI STATISTICI che si presentano con

una molteplicit di manifestazioni. I supporti fisici o teorici delle diverse

manifestazioni del fenomeno statistico sono dette unit statistiche. L’insieme

delle unit statistiche è chiamato POPOLAZIONE STATISTICA O UNIVERSO.

la lettera U (maiuscolo) per denotare la popolazione o universo statistico

le lettere latine maiuscole ( tranne la U) per indicare i fenomeni

statistici

le lettere minuscole per indicare ogni singola manifestazione del

fenomeno indicato con la corrispondente lettera maiuscola. In

linguaggio tecnico parleremo di

modalit

valori

del fenomeno.

Esempio:

Y: secolarizzazione

U: insieme di soggetti

y: licenza media o diploma o laurea ecc.

La statistica ha la funzione di descrivere il comportamento di X su U. gli

strumenti di analisi statistica adeguati a questo scopo formano LA

STATISTICA DESCRITTIVA, che si classifica a sua volta in:

MONOVARIATA  che ha per oggetto un solo fenomeno singolarmente

rilevato e come obiettivo la descrizione sintetica del suo comportamento

su U;

BIVARIATA, quando l'oggetto è una coppia di fenomeni congiuntamente

rilevati sulla stessa U e l'obiettivo è l'individuazione e lo studio delle

relazioni fra i due;

MULTIVARIATA, se i fenomeni rilevati sulla stessa U sono pi: di due e

l'obiettivo è descriverne il comportamento congiunto e studiarne le

relazioni, congiuntamente (tutti insieme) e per loro sottoinsiemi

( coppie, terne ecc.).

INFERENZA STATISTICA: induzione del particolare (campione) al generale

(U).

STATISTICA INFERENZIALE: strumenti di analisi adeguati a fare inferenza

Scopri Appunti di Statistica Università degli Studi di Milano-Bicocca (UNIMIB)

Documenti correlati

Variabilità - Statistica descrittiva

Statistica descrittiva e variabilità

Elementi di Statistica Descrittiva: Variabilità e Distribuzioni

Esercitazioni di Statistica Descrittiva: Distribuzioni, Medie e Variabilità

Formule di Statistica Descrittiva: Medie, Variabilità, Relazioni e Regressione

Introduzione alla Statistica Descrittiva: Frequenze, Variabilità e Distribuzioni

Statistica descrittiva: indici di posizione e variabilità

Statistica Descrittiva: Indici Posizione, Tendenza Centrale, Variabilità, Dispersione

Formulario di statistica descrittiva

Formulario di Statistica Descrittiva: Medie, Variabilità e Connessione

(1)

Esercizi di Statistica Descrittiva: Quantili e Variabilità

Statistica Descrittiva: Concetti Chiave e Misure di Variabilità

Anteprima parziale del testo

Scarica Statistica Descrittiva: Concetti Base e Analisi della Variabilità e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

COS’È?  insieme di metodologie e di strumenti formali per la trattazione quantitativa dei fenomeni osservabili nella realtà sociale.

TRATTAZIONE QUANTITATIVA  realizzazione del processo logico di :

osservazione → analisi → comprensione. Questo processo si realizza tramite la rilevazione dei dati, l’elaborazione e la trasformazione dei dati in informazioni

FENOMENI DI INTERESSE : FENOMENI STATISTICI che si presentano con una molteplicità di manifestazioni. I supporti fisici o teorici delle diverse manifestazioni del fenomeno statistico sono dette unità statistiche. L’insieme delle unità statistiche è chiamato POPOLAZIONE STATISTICA O UNIVERSO.

 la lettera U (maiuscolo) per denotare la popolazione o universo statistico  le lettere latine maiuscole ( tranne la U) per indicare i fenomeni statistici  le lettere minuscole per indicare ogni singola manifestazione del fenomeno indicato con la corrispondente lettera maiuscola. In linguaggio tecnico parleremo di modalità o valori del fenomeno. Esempio:

Y: secolarizzazione U: insieme di soggetti y: licenza media o diploma o laurea ecc.

La statistica ha la funzione di descrivere il comportamento di X su U. gli strumenti di analisi statistica adeguati a questo scopo formano LA STATISTICA DESCRITTIVA, che si classifica a sua volta in:

 MONOVARIATA  che ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione sintetica del suo comportamento su U;  BIVARIATA, quando l'oggetto è una coppia di fenomeni congiuntamente rilevati sulla stessa U e l'obiettivo è l'individuazione e lo studio delle relazioni fra i due;  MULTIVARIATA, se i fenomeni rilevati sulla stessa U sono più di due e l'obiettivo è descriverne il comportamento congiunto e studiarne le relazioni, congiuntamente (tutti insieme) e per loro sottoinsiemi ( coppie, terne ecc.).

INFERENZA STATISTICA: induzione del particolare (campione) al generale (U).

STATISTICA INFERENZIALE: strumenti di analisi adeguati a fare inferenza

FENOMENI QUALITATIVI: si manifestano nella popolazione osservata attraverso attributi o categorie, qualità appunto.

FENOMENI QUANTITATIVI: si manifestano nella popolazione osservata attraverso numeri, quantità appunto.

Per certi tipi di analisi statistica è necessario che le manifestazioni del fenomeno analizzato possono essere ordinate. Le manifestazioni dei fenomeni quantitativi possono essere sempre ordinate poiché fra i numeri esiste una relazione d'ordine naturale. Per i fenomeni qualitativi invece è importante la sotto-classificazione. Fenomeni qualitativi ordinali → sono i fenomeni che pur essendo qualitativi, si manifestano con attributi e categorie che si possono ordinare secondo un qualche criterio oggettivo e convenzionalmente accertato.

Fenomeni qualitativi categoriali → sono tutti i fenomeni qualitativi per i quali non abbiamo un criterio oggettivo (ma solo personale e variabile) per ordinare le categorie con cui si manifesta.

Fra i fenomeni quantitativi facciamo una distinzione fra i fenomeni DISCRETI e CONTINUI.

FENOMENI QUANTITATIVI DISCRETI  sono i fenomeni quantitativi che possiamo enumerare.

FENOMENI QUANTITATIVI CONTINUI  sono i fenomeni quantitativi che si possono misurare, una volta scelta un’opportuna unità di misura e con la disponibilità del corretto strumento di misurazione.

Per quanto riguarda la rilevazione, l’insieme delle caselline previste per ogni domanda costituisce la scala delle modalità o scala di rilevazione.

Le caratteristiche principali della scala delle modalità sono: esaustività e mutua esclusività.

ESAUSTIVITÀ  la scala delle modalità con cui si effettua la rilevazione deve essere esaustiva, deve cioè prevedere tutte le possibili manifestazioni di X che si possono osservare su U.

MUTUA ESCLUSIVITÀ  la scala con cui si effettua la rilevazione deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizione.

Nelle qualitative ci sono 2 sotto-gruppi:

 SCALA QUALITATIVA ORDINALE  è una scala qualitativa nella quale gli attributi o le categorie di cui consta possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato. Relazioni di =; ≠; >uguale ;<uguale

Le frequenze assolute non sono confrontabili fra popolazioni di numerosità diversa.

Se lo si volesse fare occorre depurare le frequenze assolute dall’influenza di N costruendo le frequenze relative.

FREQUENZE RELATIVE  associata alla modalità xi è il rapporto (divisione) fra le frequenza assoluta di xi e la numerosità N di U. indicheremo la frequenza relativa con pi. In formule e più brevemente che a parole  pi=fi/N

Le frequenze relative pi sono rapporti particolari con il denominatore che rappresenta il totale del numeratore. Risultano perciò sempre comprese fra 0 e 1 e la loro somma è pari a 1. formula in sintesi: 1/N x N= N/N = 1

FREQUENZE CUMULATE  quando il fenomeno di interesse è almeno ordinale possiamo aumentare il livello di analisi e costruire un ulteriore tipo di distribuzione con frequenze. In questo caso è buona pratica costruire la v.s ordinando in senso crescente le modalità osservate partendo dal minimo x1 e arrivando al massimo xk: x1<x2<...<xk-1 < xk.

Si tratta di sommare (cumulare) le frequenze associate alle modalità inferiori di xi costruendo le frequenze cumulate. Indicheremo con Fi le frequenze cumulate assolute e useremo la lettera greca “phi” maiuscolo per indicare le frequenze cumulate relative.

PROPRIETÀ DELLE FREQUENZE CUMULATE:

Le frequenze cumulare assolute sono numeri interi compresi fra 0 e N mentre quelle relative sono comprese fra 0 e 1. la prima frequenza cumulata coincide con la frequenza della modalità più piccola; l'ultima frequenza cumulata coincide con la numerosità N di U se parliamo di freq. Cumulate assolute, coincide con 1 se parliamo di freq. Cumulate relative. Il fenomeno X è almeno ordinale e le modalità xi sono ordinate, dunque xi è la più piccola e xk è la più grande
Fra le frequenze assolute e relative e le corrispondenti frequenze cumulate esiste una corrispondenza biunivoca: se conosciamo le frequenze assolute o relative possiamo ottenere le cumulate sommando, se conosciamo le cumulate possiamo ottenere le frequenze sottraendo

DENSITÀ DI FREQUENZA

Limitiamo la nostra attenzione ai fenomeni quantitativi continui. Se X è continuo le modalità xi sono intervalli.

Siamo di fronte ad una mancanza di informazioni. Ogni volta che ci troviamo in una situazione di questo tipo, per superare l'ostacolo si ricorre all'emissione di ipotesi in sostituzione delle informazioni ignote. L'ipotesi adottata deve essere ragionevole cioè argomentabile sostenibile e convincente. Due sono le ipotesi comunemente emesse :

ipotesi del valore centrale. L'obiettivo è di assegnare a ciascuna delle fi unità statistiche un unico punto interno all'intervallo stesso. Il principale adottato è in medio stat virtus. Il metodo consiste nell'associare tutte le fi al valore centrale dell'intervallo. Il valore centrale è la semisomma dei suoi estremi. Indicheremo il valore centrale di un intervallo con l'asterisco: xi*= xl+xL/

(esempio pag.33) Con questa ipotesi si attua una sostanziale discretizzazione della v.s. : si supera il problema dell'ignota distribuzione ma si perde la natura continua rappresentata dagli intervalli.

Ipotesi di distribuzione uniforme. Consiste nel considerare alla pari ogni possibilità. Se non sappiamo niente circa dove si posizionano esattamente le fi, allora le distribuiamo in modo uniforme ed equidistante lungo tutto l'intervallo

Con le distribuzioni di frequenze si possono costruire i grafici. La forma grafica è preferibile a quella tabellare in fase di interpretazione e comunicazione dei risultati dell’analisi statistica. Per i fenomeni qualitativi il grafico è un semplice disegno che affianca o sostituisce la tabella. Per i fenomeni quantitativi, quando le xi sono numeri si costruiscono veri e propri diagrammi cartesiani. Le xi poste sulle ascisse e le fi poste sulle ordinate. Quando X è discreto un diagramma efficace è a bastoncini.

Sappiamo che adottare l'ipotesi del valore centrale si traduce nella discretizzazione della v.s. attraverso i valori centrali x*i degli intervalli. Una volta ricondotti al caso discreto si può procedere alla rappresentazione grafica prevista nel caso discreto, cioè a bastoncini. Se invece si adotta l'ipotesi della distribuzione uniforme, si presenta la natura continua del fenomeno e l'obiettivo di associare la frequenza a tutti gli infiniti punti dell'intervallo, in modo che sia uniformemente distribuita, si raggiunge rappresentando la frequenza come un'area. Per rappresentare la distribuzione di frequenze assolute, sotto l'ipotesi di una distribuzione uniforme, si pongono gli intervalli xi:xl|- xL sulle ascisse e le densità di frequenza phi piccolo sulle ordinate

Il diagramma che si ottiene è a rettangoli accostati e prende il nome di istogramma o diagramma areale. In un istogramma le frequenze sono rappresentate come aree.

L'area totale sottesa all'istogramma è:

 pari a N se si rappresentano le frequenze assolute fi (phi sulle ordinate).  Pari a 1 se si rappresentano le frequenze relative pi(phi/N sulle ordinate).

COS’È IL VALORE MEDIO?  è un unico valore che da solo ci da un’idea del comportamento di X su U e del suo ordine di grandezza. Si tratta di passare da un’intera distribuzione a un singolo valore, il valore medio appunto.

PROPRIETÀ DI MANTENIMENTO E DI EQUIDISTRIBUZIONE DEL TOTALE

→ la somma di tutti i valori di X su tutte le N unità osservate prende il nome di totale di X. In formule: sommatoria che va da i=1 a k di xifi = totale di X (su U)

inoltre dividendo il totale di X per N si ottiene la media aritmetica di X. Il totale di X può anche essere dato dalla media moltiplicata per N che, a sua volta, è la somma delle frequenze fi.

VARIABILITÀ  attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti.

La variabilità è ciò che rende necessario il ricorso alla strumentazione statistica per l’analisi e la comprensione del comportamento del fenomeno su U. la variabilità di X quantitativo è l’aspetto essenziale nella descrizione statistica del suo comportamento su U.

Una misura della variabilità di X è un indice sintetico con le seguenti caratteristiche:

propriet à di un indice di variabilità :

I. assume valore 0 in assenza di variabilità , cioè nella situazione in cui X si manifesta con un’unica modalità , generando una v.s. costante; II. assume valori positivi quando X si manifesta con modalit à molteplici e differenti, cioè in caso di variabilità III. assume valori positivi e via via più grandi all’aumentare della variabilità

la più semplice misura di variabilità che chiamiamo RANGE, si ottiene confrontando la più piccola e la più grande fra le modalità osservate.

RANGE DI X= XMAX – XMIN  questa misura ha tutte le caratteristiche sopra elencate

Il range è basato solo su 2 fra le k osservate, cioè quelle estreme, mentre il resto della v.s. è ignorato.

Per migliorare le cose possiamo prendere la differenza fra i due quartili, superiore e inferiore, di X. Così otteniamo un’altra misura di variabilità chiamata DIFFERENZA INTERQUARTILE. Questa è il range della metà centrale delle osservazioni.

DEVIAZIONE STANDARD DI X  è una misura più raffinata, che utilizza tutta la v.s. ha come notazione standard “”.

Formula di “” :

la forma deriva da :

 ogni modalità xi è confrontata con la media aritmetica che essendo un valore sintesi della v.s. funziona bene come polo di confronto.  La differenza (xi – x con trattino) può risultare positiva o negativa a seconda che xi sia una modalità sopra o sotto media. Ai nostri fini il segno dello scarto è ininfluente: quello che ci interessa è se xi è vicina o lontana dal polo di confronto (ovvero la media aritmetica); dunque ci interessa la distanza di xi dalla media aritmetica. Per eliminare l'influenza del segno, si considerano gli scarti quadratici , cioè elevati al quadrato. (xi – x con trattino)^2. Per ragioni di semplicità il quadrato è preferibile al valore assoluto in quanto è più semplice da trattare matematicamente e ha l'effetto di enfatizzare le distanze.  Gli scarti quadratici vengono poi ponderati con le frequenze. Si tiene cioè conto del fatto che la modalità xi si presenta in U fi volte (xi – x con trattino)^2 fi. Se si sommano tutti gli scarti ponderati non al quadrato ma con il loro segno si ottiene sempre 0.  poiché di scarti quadratici ne abbiamo k (tanti quante sono le modalità osservate), li sintetizziamo tutti in una media sommando e dividendo poi per N  infine si ristabilisce l'ordine di grandezza e l'unità di misura (alterati dall'elevamento al quadrato) prendendo la radice quadrata.

La deviazione standard misura la variabilità di X considerando la dispersione dei suoi valori intorno al suo valore medio. Essa ci dice che X si manifesta su U con valori che in media distano dalla media aritmetica per più o meno .

Facendo riferimento al  si definiscono altre 2 misure di variabilità di X su U chiamate VARIANZA e DEVIANZA. La deviazione standard elevata al quadrato è la varianza di X:

σ ^2 = 1/N sommatoria che va da i=1 a k (xi – x con trattino)^2 fi

La varianza moltiplicata per N definisce la devianza di X:

N σ^2 = sommatoria che va da i =1 a k (xi – x con trattino)^2 fi

Fissando l’attenzione sulle singole righe o sulle singole colonne separatamente, si costruiscono le v.s. condizionate da Y|xi e X|yj.

Sulle v.s. condizionate si costruiscono le frequenze condizionate che vengono chiamate PERCENTUALI DI RIGA E PERCENTUALI DI COLONNA.

Se fra X e Y non c’è nessuna relazione statistica, allora X e Y sono statisticamente INDIPENDENTI. Il modo per stabilire se siano o meno indipendenti è confrontare le frequenze condizionate con le frequenze marginali. Bada bene che le frequenze marginali si riferiscono all’intera U di numerosità N e le frequenze condizionate si riferiscono a sotto-popolazioni di numerosità fi.

Le frequenze marginali relative si ottengono dalle frequenze marginali assolute dividendo per N.

FREQUENZE TEORICHE DI INDIPENDENZA STATISTICA  sono quelle frequenze che si ottengono facendo un semplice passaggio algebrico sulla condizione di indipendenza statistica

TABELLA TEORICA DI INDIPENDENZA STATISTICA  si compila mantenendo fisse le marginali e sostituendo le frequenze congiunte osservate con le frequenze teoriche di indipendenza statistica.

Il concetto di indipendenza statistica è SIMMETRICO  si dice che fra X e Y esiste indipendenza statistica, intendendo che Y è indipendente da X e che X è indipendente da Y.

Per stabilire che X e Y sono indipendenti si utilizzano solo frequenze. Se si conclude che X e Y sono statisticamente indipendenti, l’analisi bivariata è terminata.

Se si conclude che i due fenomeni non sono indipendenti allora fra X e Y esiste una relazione statistica. Diremo che X e Y sono CONNESSI e indicheremo con il termine CONNESSIONE una generica relazione statisticamente rilevabile in una coppia di fenomeni osservati sulla U di interesse. Bisogna poi misurare il grado di connessione, che è tanto più elevata quanto più la tabella osservata è lontana dalla tabella teorica di indipendenza.

INDICE DI CONNESSIONE  χ = sommatoria che va da i=1 a k sommatoria che va da j=1 a h (fij -fij)^2/fij

Perché con questa formula si misura la connessione? Se tutte le differenze fij – fij sono uguali a 0 , cioè quando X e Y sono statisticamente indipendenti, l'indice di connessione risulta χ ^2 =0 perché sommando tutti 0, divisi per qualunque cosa, si ottiene sempre 0. Quanto più grandi sono le differenze fij – fij tanto più elevato sarà il valore dell'indice χ ^2. Esiste anche una formula alternativa per il calcolo del χ ^

indice di connessione (formula alternativa) →

χ ^2 = N(sommatoria che va da i =1 a k sommatoria che va da j=1 a h f^2uj / fi.f.j -1) (esempio pag.120 + dimostrazione pag.121)

VALORE MASSIMO DEL χ ^ 2  è il valore che l’indice assumerebbe in caso di massima connessione fra i due fenomeni, cioè in caso di una relazione

statistica perfetta in cui è sufficiente conoscere il comportamento di un fenomeno per sapere già tutto del comportamento dell’altro.

Valore massimo del χ ^2. → èil valore pari a N moltiplicato per il più piccolo fra il numero delle righe (k) e il numero delle colonne (h), meno 1. N x min {k-1,h-1} (dimostrazione pag.122)

Una volta determinato il valore massimo del χ ^2, possiamo normalizzarlo e interpretarlo.

Indice di connessione normalizzato → χ ^2 / N x min {k – 1, h – 1} con il numeratore χ ^2 calcolato sulla tabella osservata.

Il χ ^2 è sempre compreso fra 0 e 1 e moltiplicarlo per 100 è interpretabile come percentuale di connessione. La percentuale di connessione permette la valutazione della connessione.

Con la connessione abbiamo considerato una generica relazione fra i due fenomeni utilizzando la tabella nel suo complesso. Invece, registrando la nostra attenzione su singole coppie di modalità, possiamo analizzare statisticamente una relazione di tipo locale fra singole coppie di modalità xi e yj che chiameremo associazione (locale). Possiamo allora pensare alla connessione come un'associazione globale fra tutte le k modalità di X e le h modalità di Y.

Utilizzando sia le frequenze sia le modalità dei fenomeni è possibile dare un verso alla relazione, cioè stabilire se e quanto X influenza Y oppure Y influenza X.

MEDIE E VARIANZE MARGINALI E CONDIZIONATE  Per iniziare assumiamo che Y sia quantitativo e X qualunque e di aver già stabilito che X e Y sono connessi. Tutto ciò vale anche quando o solo X o entrambi i fenomeni sono quantitativi. Se Y è quantitativo, le sue modalità yj sono numeriche e perciò possiamo usare la matematica: sono dunque sintetizzabili con medie e varianze.

Media marginale di Y. → èla media della v.s. marginale di Y y con trattino = 1/N sommatoria che va da j=1 a h yjf.j

Varianza marginale di Y. → èla varianza della v.s. marginale di Y σ^2 = 1/N sommatoria che va da j=1 a h (yj – y con trattino)^2 f.j = = 1/N sommatoria che va da j=1 a h y^2jf.j – y con trattino^

Media condizionata di Y dato xi. → èla media della v.s. condizionata Y|xi che si legge sulla i- esima riga della tabella y con trattino|xi= sommatoria che va da =1 a h yj fij/fi. =1/fi. Sommatoria che va da j=1 a h yjfij (l'indice i è fisso)

Varianza condizionata di Y dato xi. → èla varianza della v.s. condizionata Y|xi che si legge sula i- esima riga della tabella σ^2 = sommatoria che va da j=1 a h (yj-y con trattino xi )^2 fij/fi.

INDIPENDENZA IN MEDIA DI Y DA X  partiamo da X e Y connessi. Diciamo che Y dipende da X se tale relazione di connessione si riflette sulle medie condizionate y con trattino |xi che risultano diverse fra loro al variare di X e diverse dalla media marginale. Diremo invece che Y è indipendente in media da X se è sufficiente sintetizzare le distribuzioni condizionate Y| xi nelle medie condizionate y con trattino|xi perché la relazione di connessione scompaia e le medie condizionate y con trattino|xi appaiono tutte uguali fra loro al valore di X e uguali alla media marginale y con trattino.

CONDIZIONE DI INDIPENDENZA IN MEDIA DI Y DA X  è data in analogia alla condizione di indipendenza statistica ma analizzando le medie condizionate. Y è indipendente in media da X se tutte le medie condizionate sono uguali fra loro e uguali alla media marginale.

INDICE DI DIPENDENZA DI UN FENOMENO DALL’ALTRO  Adesso che conosciamo la condizione di i.m possiamo osservare che, quando Y è i.m da X, allora le k differenze (ycon trattino|xi-y con trattino) sono tutte uguali a zero. Dunque quando Y è i.m da X la varianza FRA vale zero

Indice di dipendenza (di Y da X) → η^2y = σ^2 FRA/σ^2 y

η^2y assume valori compresi fra 0 e 1, cioè è un indice normalizzato che moltiplicato per 100 è interpretabile come percentuale di dipendenza.

Se entrambi i fenomeni X e Y sono quantitativi è possibile trattare matematicamente anche l’intera v.s. bivariata utilizzando le coppie di modalità di entrambi i fenomeni oltre alle frequenze congiunte fij.

Con i concetti monovariati di medie e varianze sulla v.s. bivariata si definiscono una sorta di media bivariata chiamata MOMENTO MISTO e una sorta di MISURA DI VARIABILITÀ CONGIUNTA chiamata COVARIANZA.

Utilizziamo la lettera greca μ per indicare il momento misto e la lettera greca σ per indicare la covarianza; facciamo apparire al deponente entrambi i fenomeni X e Y per ricordare che si tratta di sintesi della v.s. statica doppia; infine è necessario usare somme doppie, cioè rispetto a entrambi gli indici i e j, il che significa sommare sia per riga sia per colonna.

Momento misto → μxy = 1/N sommatoria da i=1 a k sommatoria da j=1 a h xiyjfij Covarianza → σxy=1/N sommatoria da i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj-y con trattino) fij

DIAGRAMMA A DISPERSIONE (SCATTER PLOT)  è uno strumento grafico utile per visualizzare il tipo di relazione esistente fra due fenomeni X e Y quantitativi. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sul diagramma come una nuvola di kxh punti.

COSA CI FA VEDERE IL DIAGRAMMA A DISPERSIONE?  ci fa vedere se fra X e Y c’è relazione statistica e, se c’è, di quale tipologia. Se c’è relazione statistica, la nuvola di punti si presenta strutturata, cioè i punti si dispongono secondo una qualche struttura e appaiono più

concentrati in particolari zone del diagramma. La struttura con cui si presentano dà indicazione circa il tipo di relazione esistente, cioè la sua FORMULAZIONE MATEMATICA.

Quando invece X e Y sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma senza nessuna struttura evidente. La relazione più semplice è quella lineare.

COVARIANZA  σxy=1/N sommatoria i=1 a k sommatoria da j=1 a h (xi- x con trattino) (yj- y con trattino) fij

Dopo averle dato un’interpretazione geometrica, possiamo stabilire i vari tipi di covarianza in funzione del tipo di grafico:

 Positiva σxy > 0 , cioè i punti sono concentrati in questa zona del diagramma, poiché gli scarti positivi prevalgono su quelli negativi.  Negativa σxy < 0 , cioè i punti sono concentrati in questa zona del diagramma, poichè gli scarti negativi prevalgono su quelli positivi.  Nulla σxy = 0 , cioè i punti sono disposti in modo che gli scarti positivi e negativi si compensino. Ciò accade quando i punti sono sparpagliati sul diagramma a dispersione senza struttura alcuna, cioè in caso di indipendenza statistica. Succede anche quando i punti sono strutturati secondo una relazione diversa e lontana da quella lineare, come quella quadratica.

CORRELAZIONE LINEARE  la relazione statistica lineare fra X e Y è chiamata in questo modo.

Quando la covarianza è positiva allora X e Y sono positivamente correlati, cioè al crescere dell’uno cresce anche l’altro.

Quando la covarianza è negativa allora X e Y sono negativamente correlati, cioè al crescere dell’uno decresce l’altro.

Quando σxy = 0 allora X e Y sono incorrelati, cio è non esiste relazione di tipo lineare. Al massimo può esistere una relazione di tipo diverso e lontano da quella lineare, o anche nessuna relazione perch é sono statisticamente indipendenti.

Una volta scoperto che X e Y sono correlati ci interessa misurarne il grado, cioè stabilirne se la correlazione è forte o debole. La più nota misura della correlazione fra X e Y è detta COEFFICIENTE DI CORRELAZIONE LINEARE e la indicheremo con la lettera greca ρ. Si dimostra che:

-sotto radice σ^2xσ^2y < o = σ^2xy < o = sotto radice σ^2xσ^2y

COEFFICIENTE DI CORRELAZIONE LINEARE  ρxy = σxy / sotto radice σ^2x σ^2y

Ρxy assume valori fra -1 e +1 e ci dà indicazioni sia sul verso sia sull’intensità della correlazione fra X e Y:

EVENTO CASUALE  è un sottoinsieme dello spazio campionario  e questo è un concetto più generale del concetto di evento elementare. La sua notazione è E sottoinsieme di 

Infine, ci serve il concetto di realizzazione di un evento casuale che è un concetto a posteriori, cioè dopo aver eseguito l’esperimento casuale. Un evento E è realizzato se a posteriori è risultato uno degli eventi elementari che lo compongono.

COS’È LA PROBABILITÀ?  la probabilità di un evento casuale E è un numero associato a E che ne quantifica a priori il grado di incertezza, ovvero la possibilità di realizzazione. La probabilità di E è il rapporto fra i casi favorevoli a E e il numero di casi possibili.

DEFINIZIONE STATISTICA  questa si basa sulla legge empirica del caso, cioè una regola che non si può dimostrare matematicamente. L’evento E è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni.

lim n → infinito di f/N

VARIABILE CASUALE  è una funzione con dominio (è l’insieme da cui la funzione prende ciascun elemento) nello spazio campionario  e codominio (la funzione lo trasforma in elemento di un altro insieme) nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di .

FUNZIONE DI PROBABILITÀ DI X  è associata a una v.c. discreta, ne descrive le probabilità e ha sempre somma 1

MEDIA O VALORE ATTESO  è definita e calcolata come per la v.s. ma usando le probabilità al posto delle frequenze. Il simbolo per indicare la media di una v.c. X è standard e fa riferimento all’inglese expectation

E(X) = ∑ (con sotto x)x per P(X=x) E(X) si legge “E di X” e significa “media della v.c. X”(in particolare la formula vale per le v.c. discrete)

VARIANZA  è una misura della variabilità di X, cioè della dispersione dei suoi valori intorno al suo valore atteso, ponderata con le probabilità

DEVIAZIONE STANDARD  la varianza è elevata al quadrato. Quando serve ripristinare ordine di grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard. Useremo il simbolo SD (standard deviation)

Per fare inferenza statistica si usano alcune v.c. speciali. Una speciale v.c. discreta molto utile nella ricerca sociale ed economica è la V.C. BINOMIALE

La v.c. binomiale serve per modellare situazioni casuali che hanno 3 caratteristiche:

L’esperimento casuale consiste nell’esecuzione di n prove indipendenti, cioè in cui l’esito di ciascuna prova non influenza l’esito della prova successiva.
Chiamiamo questi eventi SUCCESSO e INSUCCESSO. In questo modo si possono modellare i fenomeni dicotomici, cioè i fenomeni statistici che si manifestano con si/no, vero/falso

La prova del successo è nota e costante. Poiché p è una probabilità, è un numero compreso fra 0 e 1, è nota anche la probabilità dell’insuccesso.

P(successo) = p, 0 < p < 1 → P(insuccesso) = 1 – p  0 = successo 1-p = insuccesso

VARIABILE STANDARD CONTINUA  per fare inferenza statistica sui fenomeni statistici continui, cioè quelli che non si possono contare ma solo misurare, servono le v.c. continue.

Le v.c. continue assumono infiniti valori, dispongono della funzione di densità che serve per calcolare la probabilità di intervalli di valori di una v.c. X continua.

Una speciale v.c. continua è la v.c. normale.

VARIABILE CASUALE NORMALE  la v.c. binomiale diventa sempre più simile ad una v.c. normale quando il parametro n è molto grande, fino a confondersi con una normale quando n

Ha la funzione di densità φ(x). L’area sottesa al grafico della φ(x) in un certo intervallo rappresenta la probabilità che la v.c. X assuma valori di quell’intervallo. La rappresentazione grafica è la famosa curva a campana centrata sul valore .
L’area totale sottesa all’intera curva corrisponde alla probabilità dell’intero intervallo ed è pari a 1
 è anche la sua moda, cioè il valore più probabile

La Normale funziona bene quando il fenomeno ha le seguenti caratteristiche:

 tende a manifestarsi con un valore sistematico prevalente (μ);  i valori più probabili sono vicini a tale valore prevalente ( area intorno a μ);  i valori lontani da μ sono rari e poco probabili

VARIABILE CASUALE NORMALE STANDARD(IZZATA)

Standardizzando una v.c. normale si ottiene la v.c. normale standardizzata, indicata con Z. calcolare la probabilità di intervalli di questa v.c. normale standard è molto complesso, perciò qualcuno ha prodotto delle tavole.

COME SI LEGGONO LE TAVOLE?

La prima colonna a sinistra della tavola riporta i valori z della Z~N (0,1); la prima riga riporta la seconda cifra decimale dei valori z; all’interno della tavola si legge la probabilità che Z assuma valori inferiori o uguali a quel valore z.

CAMPIONAMENTO ED ERRORE CAMPIONARIO  il campione è un sottoinsieme dell’intera popolazione U su cui ci interessa studiare il fenomeno X.

 controllare in termini di probabilità se e quanto la sostituzione è affidabile e accurata

i 3 parametri ignoti più semplici sono:

o la MEDIA del fenomeno in U, che corrisponde alla media μ di X o la VARIANZA del fenomeno in U, che corrisponde alla varianza σ^2 di X o una PERCENTUALE di valori di X d’interesse, che indicheremo con p

STIMATORE  per controllare l’errore di stima dobbiamo tener conto di tutti i possibili risultati ottenibili da tutti i possibili campioni. Lo stimatore è la stessa funzione che definisce la stima, ma applicata alle v.c. estrazioni campionarie.

Dunque, la stima è un numero, ottenuto sul campione estratto e l’unico a disposizione. Lo stimatore è una variabile casuale, che tiene conto di tutte le possibili stime ottenibili su tutti i possibili campioni estraibili.

MEDIA CAMPIONARIA  serve a stimare l’ignota media μ di U. la indicheremo con x con trattino che si legge “x sopra-segnato” o anche “x medio”.

Media campionaria (stima) → x con trattino= 1/n sommatoria che va da i= a n xi

Media campionaria (stimatore) → X con trattino= 1/n sommatoria da i=1 a n Xi

NON DISTORSIONE  uno stimatore non è distorto se il suo valore atteso coincide con il parametro oggetto di stima. Se questo non succede, lo stimatore è distorto  quest’ultimo tende alla sotto-stima o alla sovra-stima.

La non distorsione non basta come proprietà, è necessario definirne altre.

Per farlo abbiamo bisogno di una nuova sintesi statistica di uno stimatore  L’ERRORE QUADRATICO MEDIO.

ERRORE QUADRATICO MEDIO  è un modo per esprimere in formule l’errore campionario associato all’inferenza nel processo di stima, cioè l’ERRORE DI STIMA. Misura quanto lo stimatore è preciso, quanto è vicino all’ignoto parametro che si vuole stimare. L’errore è quadratico perché basato sul quadrato delle differenze fra lo stimatore e ciò che si vuole stimare; è medio perché considera il valore atteso di tutte le possibili differenze su tutti i possibili campioni.

È una quantità teorica che misura la dispersione dei valori dello stimatore intorno all’oggetto della stima.

MSE della media campionaria → MSE (X con trattino)= E(X con trattino – μ)^2=V(X con trattino)

Varianza della medie campionaria → V(X con trattino)= σ^2/n dove σ^2 indica la varianza del fenomeno in U e n è l'ampiezza campionaria.

La varianza della media campionaria è dunque anche il suo MSE (errore quadratico medio) perché è stimatore non distorto.

PROPRIETÀ DEGLI STIMATORI: CONSISTENZA  è una proprietà molto importante perché è il minimo che si possa richiedere a uno stimatore. La definizione di stimatore consistente è però matematicamente complessa e coinvolge l’operazione di limite. Tecnicamente si parla di proprietà ASINTOTICA.

CONSISTENZA DELLA MEDIA CAMPIONARIA  la media campionaria è consistente per μ perché per il corrispondente stimatore X con trattino valgono le due condizioni seguenti:

X con trattino è non distorto, cioè E(X con trattino)= μ 2. La sua varianza diventa sempre più piccola all’aumentare dell’ampiezza campionaria, in formule lim n → ∞ V(X con trattino) = 0

EFFICIENZA RELATIVA  è un criterio di scelta quando si dispone di due o più diversi stimatori per lo stesso ignoto parametro. Lo stimatore con MSE (errore quadratico medio) inferiore è detto il più efficiente fra i due o più a disposizione ed è pertanto quello preferibile.

EFFICIENZA DELLA MEDIA CAMPIONARIA  lo stimatore X con trattino è il più efficiente fra tutti i possibili stimatori non distorti per μ.

STIMA DELLA VARIANZA (^) σ^2  1/n sommatoria da i=1 a n (xi – x con trattino)^

Si può considerare che il corrispondente stimatore è distorto per (^) σ^2 , cioè ha valore atteso che non coincide con ciò che si vuole stimare e ha tendenza a sotto-stimare. Ottenere uno stimatore non distorto è semplice: basta dividere per (n-1) anziché per n nel calcolo della varianza del campione.

Chiameremo questa stima VARIANZA CAMPIONARIA CORRETTA e la indicheremo con s^2.

VARIANZA CAMPIONARIA CORRETTA  s^2=1/n-1 sommatoria da i=1 a n (xi

x con trattino)^2  questa varianza è una funzione dei dati campionari un po’ più complessa.

La quantità (n-1) che va posta al denominatore della stima s^2 per garantirne la non distorsione, è chiamata GRADI DI LIBERTÀ.

Si può dimostrare che la varianza campionaria corretta è non distorta per (^) σ^2. È anche consistente , cioè l’errore di stima che si commette stimando (^) σ^2 con s^2 diminuisce al crescere dell’ampiezza campionaria. Questa diminuzione è più lenta rispetto a quella della media campionaria e per ottenere stime sufficientemente precise occorrono campioni più grandi. Se poi l’obiettivo è stimare la deviazione standard del fenomeno in U, bisogna ricordare che √s^2 in generale è distorta per σ.

STIMA DELLA PRECISIONE DI UNO STIMATORE: STANDARD ERROR  per stimare l’errore campionario associato a un qualunque stimatore useremo la media campionaria come caso- guida. La precisione dello stimatore dipende da n e da σ^2. Vediamo come usare la varianza campionaria corretta s^2 per stimare l’errore campionario associato a