






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Esercizi di statistica riguardanti l'analisi delle associazioni tra due variabili quantitative: il reddito familiare e il rendimento scolastico. Le esercitazioni coprono la rappresentazione grafica delle distribuzioni marginali, l'indipendenza in distribuzione, il calcolo dell'indice chi-quadrato e dell'indice di cramér-von mises per valutare l'associazione tra le variabili.
Tipologia: Esercizi
1 / 10
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Anno 2018/
Si vuole verificare l’associazione tra il reddito familiare e il rendimento scolastico. Vengono inter- vistate 180 famiglie e i dati vengono raccolti nella seguente tabella di contingenza.
Reddito familiare Rendimento Alto Medio Basso Ottimo 12 23 30 Sufficiente 6 11 12 Basso 18 28 40
Ottenete e rappresentate graficamente la distribuzione marginale di riga e quella di colonna e commentate. La distribuzione marginale di riga e (0. 36 , 0. 16 , 0 .48) e quella di colonnae (0. 20 , 0. 34 , 0 .46). La rappresentazione grafica pu`o essere fatta sia con il diagramma a torta che con quello a barre.
Rendimento
Ottimo Sufficiente
Bsso Reddito Familiare
Alto Medio Basso
Spiegate il concetto di associazione tra due variabili.
Definizione. Si parla di indipendenza in distribuzione tra due caratteri quando le modalit`a assunte dalla X non modificano la distribuzione di Y. Ovvero
f (Y |X = x) = f (Y ) per ogni livello di Y,
dove f rappresenta la frequenza relativa. Dalla definizione segue che sotto l’ipotesi di indipendenza in distribuzione si ha nˆij ni·
n·j n
In modo analogo: f (X|Y = y) = f (X) per ogni livello di X.
E’ possibile dimostrare che se il carattere Y e indipendente dal carattere X, allora vale anche la relazione contraria: anche il carattere X sara indipendente dal carattere Y.
Esempio: Dalla seguente tabella ricavare le frequenze assolute sotto l’ipotesi d’indipendenza.
Table 1: Tabella delle ˆnij Reddito familiare Rendimento Alto Medio Basso Ottimo 13.00 22.39 29. Sufficiente 5.80 9.99 13. Basso 17.20 29.62 39.
Ricaviamo l’indice:
X^2 =
L’indice indica che le frequenze teoriche sono molto simili, vicine alle frequenze osservate (tanto piue alto il valore tanto piue improbabile che la differenza sia casuale).
Calcoliamo anche l’indice di contingenza media quadratica
φ^2 =
n
che elimina la dipendenza di X^2 dal numero n delle unita’ statistiche considerate, e l’indice di Cram´er
V =
min(c − 1 , r − 1) × n
L’indice V puo’ variare tra zero ed uno, e sara pari a zero nel caso di indipendenza, mentre assumera valore 1 nel caso di massima dipendenza.
Se usiamo la formula “ridotta” costruendo la Tabella 2
Table 2: Tabella
n^2 ij ni·n·j Reddito familiare Rendimento Alto Medio Basso Ottimo 0.06153846 0.13126551 0. Sufficiente 0.03448276 0.06729700 0. Basso 0.10465116 0.14703676 0.
si ottiene
n
∑^ c
i=
∑^ r
j=
n^2 ij ni·n·j
approssimativamento lo stesso risultato. La differenza `e dovuta all’arrotondamento.
2 Esercizio.
Si vuole studiare la serie storica dal 2000 al 2014 dell’indebitamento netto Italiano (flusso annuo), conosciuto pi`u genericamente come “deficit pubblico” (DP), calcolato in base agli accordi europei.
x = Anni 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 y = DP 105 104 103 100 99 100 101 102 98 101 111 120 125 130 132
i
xi = 30105
i
yi = 1631
i
xiyi = 3273987
i
x^2 i = 60421015
i
y^2 i = 179331
calcolate la retta dei minimi quadrati, disegnatela sul diagramma di dispersione e commentate i coefficienti.
3 Esercizio
L’unione Europea vuole studiare la qualit`a della distribuzioni degli investimenti di uno stato mem- bro rispetto a diversi settori produttivi.
Settore Produttivo numero di aziende (in migliaia) investimenti medi per azienda(in migliaia) Agricoltura 1677 5 Allevamento 145 3 Pesca 548 1. Edilizia 508 9 Manifatturiero 387 2 Attivita professionali, scientifiche e tecniche 734 1 Sanita 1291 12 Commercio 1105 1. Istruzione 31 1.
Rappresentate la spezzata di Lorentz e commentate.
Settori ni xi Fi Qi 1 Attivita Prof 734 1 0.1142 0. 2 Istruzione 31 1.1 0.119 0. 3 Pesca 548 1.5 0.2043 0. 4 Commercio 1105 1.8 0.3763 0. 5 Manifatturiero 387 2 0.4365 0. 6 Allevamento 145 3 0.4591 0. 7 Agricoltura 1677 5 0.72 0. 8 Edilizia 508 9 0.7991 0. 9 Sanita 1291 12 1 1
l ll
l
l l
l
l
l
l
0.0 0.2 0.4 0.6 0.8 1.
Fi
Qi
Calcolate in rapporto di concentrazione utilizzando il metodo dei trapezi.
Rappresentate mediante il boxplot la distribuzione dei costi dei prodotti americani. Per rappresentare il boxplot si devono calcolare min, primo quartile, mediana, terzo quartile, massimo. La procedura da seguire per calcolare il primo quartile consiste nel considerare la prima meta’ delle osservazioni (escludendo la mediana se n e’ dispari) e calcolare la mediana di questo sottoinsieme. Per calcolare il terzo quartile si consideri la seconda meta’ delle osservazioni (escludendo la mediana se n e’ dispari) e si calcoli il valore mediano di questo sottoinsieme.