Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esercitazioni di Statistica: Analisi delle associazioni tra variabili quantitative - Prof., Esercizi di Statistica

Esercizi di statistica riguardanti l'analisi delle associazioni tra due variabili quantitative: il reddito familiare e il rendimento scolastico. Le esercitazioni coprono la rappresentazione grafica delle distribuzioni marginali, l'indipendenza in distribuzione, il calcolo dell'indice chi-quadrato e dell'indice di cramér-von mises per valutare l'associazione tra le variabili.

Tipologia: Esercizi

2018/2019

Caricato il 06/09/2019

Marym91
Marym91 🇮🇹

5

(1)

25 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Esercitazioni di Statistica
Antonino Abbruzzo
Anno 2018/2019
1 Esercizio
Si vuole verificare l’associazione tra il reddito familiare e il rendimento scolastico. Vengono inter-
vistate 180 famiglie e i dati vengono raccolti nella seguente tabella di contingenza.
Reddito familiare
Rendimento Alto Medio Basso
Ottimo 12 23 30
Sufficiente 6 11 12
Basso 18 28 40
Ottenete e rappresentate graficamente le distribuzioni marginali di riga e di colonna e com-
mentate.
Spiegate il concetto di associazione tra due variabili.
Verificare l’associazione tra le variabili.
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Esercitazioni di Statistica: Analisi delle associazioni tra variabili quantitative - Prof. e più Esercizi in PDF di Statistica solo su Docsity!

Esercitazioni di Statistica

Antonino Abbruzzo

Anno 2018/

1 Esercizio

Si vuole verificare l’associazione tra il reddito familiare e il rendimento scolastico. Vengono inter- vistate 180 famiglie e i dati vengono raccolti nella seguente tabella di contingenza.

Reddito familiare Rendimento Alto Medio Basso Ottimo 12 23 30 Sufficiente 6 11 12 Basso 18 28 40

  • Ottenete e rappresentate graficamente le distribuzioni marginali di riga e di colonna e com- mentate.
  • Spiegate il concetto di associazione tra due variabili.
  • Verificare l’associazione tra le variabili.

Ottenete e rappresentate graficamente la distribuzione marginale di riga e quella di colonna e commentate. La distribuzione marginale di riga e (0. 36 , 0. 16 , 0 .48) e quella di colonnae (0. 20 , 0. 34 , 0 .46). La rappresentazione grafica pu`o essere fatta sia con il diagramma a torta che con quello a barre.

Rendimento

Ottimo Sufficiente

Bsso Reddito Familiare

Alto Medio Basso

Spiegate il concetto di associazione tra due variabili.

Definizione. Si parla di indipendenza in distribuzione tra due caratteri quando le modalit`a assunte dalla X non modificano la distribuzione di Y. Ovvero

f (Y |X = x) = f (Y ) per ogni livello di Y,

dove f rappresenta la frequenza relativa. Dalla definizione segue che sotto l’ipotesi di indipendenza in distribuzione si ha nˆij ni·

n·j n

In modo analogo: f (X|Y = y) = f (X) per ogni livello di X.

E’ possibile dimostrare che se il carattere Y e indipendente dal carattere X, allora vale anche la relazione contraria: anche il carattere X sara indipendente dal carattere Y.

Esempio: Dalla seguente tabella ricavare le frequenze assolute sotto l’ipotesi d’indipendenza.

Table 1: Tabella delle ˆnij Reddito familiare Rendimento Alto Medio Basso Ottimo 13.00 22.39 29. Sufficiente 5.80 9.99 13. Basso 17.20 29.62 39.

Ricaviamo l’indice:

X^2 =

(12 − 13)^2

(23 − 22 .39)^2

(40 − 39 .18)^2

L’indice indica che le frequenze teoriche sono molto simili, vicine alle frequenze osservate (tanto piue alto il valore tanto piue improbabile che la differenza sia casuale).

Calcoliamo anche l’indice di contingenza media quadratica

φ^2 =

X^2

n

che elimina la dipendenza di X^2 dal numero n delle unita’ statistiche considerate, e l’indice di Cram´er

V =

X^2

min(c − 1 , r − 1) × n

L’indice V puo’ variare tra zero ed uno, e sara pari a zero nel caso di indipendenza, mentre assumera valore 1 nel caso di massima dipendenza.

Se usiamo la formula “ridotta” costruendo la Tabella 2

Table 2: Tabella

n^2 ij ni·n·j Reddito familiare Rendimento Alto Medio Basso Ottimo 0.06153846 0.13126551 0. Sufficiente 0.03448276 0.06729700 0. Basso 0.10465116 0.14703676 0.

si ottiene

n

∑^ c

i=

∑^ r

j=

n^2 ij ni·n·j

approssimativamento lo stesso risultato. La differenza `e dovuta all’arrotondamento.

2 Esercizio.

Si vuole studiare la serie storica dal 2000 al 2014 dell’indebitamento netto Italiano (flusso annuo), conosciuto pi`u genericamente come “deficit pubblico” (DP), calcolato in base agli accordi europei.

x = Anni 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 y = DP 105 104 103 100 99 100 101 102 98 101 111 120 125 130 132

  • Costruite il grafico di dispersione delle variabili anni e DP. Valutate se esiste una relazione lineare mediante il coefficiente di correlazione e commentate.
  • Date le seguenti quantita’ ∑

i

xi = 30105

i

yi = 1631

i

xiyi = 3273987

i

x^2 i = 60421015

i

y^2 i = 179331

calcolate la retta dei minimi quadrati, disegnatela sul diagramma di dispersione e commentate i coefficienti.

  • Stabilite se il modello ben si adatta ai dati e commentate il diverso significato fra indice di correlazione e di determinazione.
  • Qual `e il DP medio atteso per l’anno 2015?

3 Esercizio

L’unione Europea vuole studiare la qualit`a della distribuzioni degli investimenti di uno stato mem- bro rispetto a diversi settori produttivi.

Settore Produttivo numero di aziende (in migliaia) investimenti medi per azienda(in migliaia) Agricoltura 1677 5 Allevamento 145 3 Pesca 548 1. Edilizia 508 9 Manifatturiero 387 2 Attivita professionali, scientifiche e tecniche 734 1 Sanita 1291 12 Commercio 1105 1. Istruzione 31 1.

  • Rappresentate la spezzata di Lorentz e commentate.
  • Calcolate in rapporto di concentrazione utilizzando il metodo dei trapezi.
  • L’unione Europea vuole proporre una manovra per avvicinare gli investimenti nei settori pro- duttivi verso l’equidistribuzione. Qual `e la misura che suggerireste? Giustificare la risposta.

Rappresentate la spezzata di Lorentz e commentate.

Settori ni xi Fi Qi 1 Attivita Prof 734 1 0.1142 0. 2 Istruzione 31 1.1 0.119 0. 3 Pesca 548 1.5 0.2043 0. 4 Commercio 1105 1.8 0.3763 0. 5 Manifatturiero 387 2 0.4365 0. 6 Allevamento 145 3 0.4591 0. 7 Agricoltura 1677 5 0.72 0. 8 Edilizia 508 9 0.7991 0. 9 Sanita 1291 12 1 1

l ll

l

l l

l

l

l

l

0.0 0.2 0.4 0.6 0.8 1.

Fi

Qi

Calcolate in rapporto di concentrazione utilizzando il metodo dei trapezi.

Rappresentate mediante il boxplot la distribuzione dei costi dei prodotti americani. Per rappresentare il boxplot si devono calcolare min, primo quartile, mediana, terzo quartile, massimo. La procedura da seguire per calcolare il primo quartile consiste nel considerare la prima meta’ delle osservazioni (escludendo la mediana se n e’ dispari) e calcolare la mediana di questo sottoinsieme. Per calcolare il terzo quartile si consideri la seconda meta’ delle osservazioni (escludendo la mediana se n e’ dispari) e si calcoli il valore mediano di questo sottoinsieme.