Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ex estadistica, Apuntes de Estadística Aplicada

Asignatura: Estadística aplicada, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UOC

Tipo: Apuntes

2013/2014

Subido el 25/10/2014

rosa.p1
rosa.p1 🇻🇪

3.8

(36)

5 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Proposta Examen 1 - Estadística Aplicada - 2012/2013 1r semestre
Pregunta 1.
Descriviu els dos passos a seguir en la construcció d'un indicador sintètic.
Solució:
1er pas: Normalització
Els indicadors sintètics es basen en dades que vénen representades en diferents unitats de
mesura. Per aquest motiu, és necessari normalitzar totes les dades perquè els valors siguin
independents de les unitats de mesura.
2n pas: Agregació
Consisteix a agregar tota la informació de les dades per obtenir un únic índex unidimensional.
Hi ha moltes maneres diferents de realitzar l'agregació, sent les més habituals la mitjana
ponderada i la mitjana no ponderada de les dades normalitzades.
Pregunta 2.
Suposem que el gràfic de línies d'una sèrie temporal presenta fluctuacions, on l'amplada de la
fluctuació varia amb la tendència (augmenta en créixer la tendència). Es desitja
desestacionalitzar la sèrie temporal després d'haver obtingut l'índex de variació estacional.
Quina operació s'haurà de realitzar? Per què? Quin esquema segueix la sèrie?
Solució:
Per intentar determinar els criteris de composició de les sèries temporals hem de fixar-nos en el
gràfic que tinguem, en les fluctuacions de la sèrie. Si al llarg de la sèrie són més o menys
regulars, l'esquema serà additiu. En canvi, si l'amplada de la fluctuació varia amb la tendència
(augmenta en créixer la tendència o disminueix en decréixer), l'esquema serà multiplicatiu.
Per tant, la nostra sèrie segueix un esquema multiplicatiu (Yt = Tt * St * Ct * It). Així, per
desestacionalitzar la sèrie haurem de dividir els valors de la sèrie per l'índex de variació
estacional (Yt/IVE).
Pregunta 3.
Una empresa automobilística ha realitzat un estudi sobre el preu dels vehicles al mercat a partir
d'una mostra de 113 vehicles. La sortida de Minitab mostra el model de regressió estimat per
explicar el preu en funció del pes, la potència, la velocitat i el consum.
The regression equation is
PREU = - 21873 - 633 CONSUM + 14.1 VELOCITAT + 19,4 PES + 167 POTENCIA
Predictor Coef ES Coef T P
Constant -21873 10069 -2.17 0.032
CONSUM -633.5 350.0 -1.81 0.073
VELOCITAT 14.11 75.24 0.19 0.852
PES 19.4 2.233 8.69 0.000
POTENCIA 166.53 46.48 3.58 0.001
S = 6255 R-Sq = ???
Analysis of Variance
Source DF SS MS F P
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga ex estadistica y más Apuntes en PDF de Estadística Aplicada solo en Docsity!

Proposta Examen 1 - Estadística Aplicada - 2012/2013 1r semestre

Pregunta 1.

Descriviu els dos passos a seguir en la construcció d'un indicador sintètic.

Solució:

1er pas: Normalització

Els indicadors sintètics es basen en dades que vénen representades en diferents unitats de

mesura. Per aquest motiu, és necessari normalitzar totes les dades perquè els valors siguin

independents de les unitats de mesura.

2n pas: Agregació

Consisteix a agregar tota la informació de les dades per obtenir un únic índex unidimensional.

Hi ha moltes maneres diferents de realitzar l'agregació, sent les més habituals la mitjana

ponderada i la mitjana no ponderada de les dades normalitzades.

Pregunta 2.

Suposem que el gràfic de línies d'una sèrie temporal presenta fluctuacions, on l'amplada de la

fluctuació varia amb la tendència (augmenta en créixer la tendència). Es desitja

desestacionalitzar la sèrie temporal després d'haver obtingut l'índex de variació estacional.

Quina operació s'haurà de realitzar? Per què? Quin esquema segueix la sèrie?

Solució:

Per intentar determinar els criteris de composició de les sèries temporals hem de fixar-nos en el

gràfic que tinguem, en les fluctuacions de la sèrie. Si al llarg de la sèrie són més o menys

regulars, l'esquema serà additiu. En canvi, si l'amplada de la fluctuació varia amb la tendència

(augmenta en créixer la tendència o disminueix en decréixer), l'esquema serà multiplicatiu.

Per tant, la nostra sèrie segueix un esquema multiplicatiu (Yt = Tt * St * Ct * It). Així, per

desestacionalitzar la sèrie haurem de dividir els valors de la sèrie per l'índex de variació

estacional (Yt/IVE).

Pregunta 3.

Una empresa automobilística ha realitzat un estudi sobre el preu dels vehicles al mercat a partir

d'una mostra de 113 vehicles. La sortida de Minitab mostra el model de regressió estimat per

explicar el preu en funció del pes, la potència, la velocitat i el consum.

The regression equation is PREU = - 21873 - 633 CONSUM + 14.1 VELOCITAT + 19,4 PES + 167 POTENCIA

Predictor Coef ES Coef T P Constant -21873 10069 -2.17 0. CONSUM -633.5 350.0 -1.81 0. VELOCITAT 14.11 75.24 0.19 0. PES 19.4 2.233 8.69 0. POTENCIA 166.53 46.48 3.58 0.

S = 6255 R-Sq = ???

Analysis of Variance

Source DF SS MS F P

Regression 4 1204940 301235 76.99 0. Residual Error 108 422591 3913 Total 112 1627531

Valoreu la bondat de l'ajust del model.

Solució:

La mesura de la bondat de l'ajust del model és el coeficient de determinació, R^2. A partir de les

dades proporcionades en la sortida de Minitab:

Atès que el coeficient R 2 pren valor 74,04%, podem concloure que el 74% de la variació total de

la variable preu de l'automòbil es pot explicar amb les variables considerades en el model. El

26% de la variació es deu a altres variables no considerades.

Pregunta 4.

Es desitja conèixer si les notes dels estudiants depenen de la classe a la qual pertanyen.

Donada la següent sortida de Minitab, què podem dir sobre aquest tema?

One-way ANOVA: NOTA versus CLASSE

Source DF SS MS F P DEPARTAM 3 6211659 2070553 Error 117 287336369 2455866 Total 120 293548028

S = 1567 R-Sq = 2,12% R-Sq(adj) = 0,00%

Level N Pixen StDev GRUP A 32 1634 1774 GRUP B 33 2169 1931 GRUP C 41 1995 1132 GRUP D 15 1617 1172

Individual 95% CIs For Pixen Based on Pooled StDev Level ----+---------+---------+---------+----- GRUP A (--------------------) GRUP B (-------------------) GRUP C (------------------) GRUP D (------------------------------) ----+---------+---------+---------+----- 1000 1500 2000 2500 Pooled StDev = 1567 Nota: el valor crític per a una distribució que deixa el 10% en la cua és 2.13.

Solució:

Es tracta de contrastar si les notes mitjanes dels quatre grups són estadísticament iguals

mitjançant un contrast ANOVA.

La hipòtesi nul·la és.

L'estadístic de contrast F s'obté a partir de les dades de la sortida de Minitab:

a. Interpreteu el signe del paràmetre estimat associat a la variable ES.

b. Analitzeu la significació individual de la variable PR.

c. Analitzeu la significació global del model.

d. Valoreu la bondat de l'ajust realitzat.

Nota: Indiqueu la hipòtesi nul·la i alternativa dels contrastos i com es pren la decisió al nivell de

significació del 10%.

Solució:

a. El signe del paràmetre associat a la variable ES és negatiu, la qual cosa indica que a

major nivell d'estudis, menor quantitat de cigarrets fumats.

b. Per analitzar la significació individual del coeficient estimat ( β 3 ) associat a la variable

PR necessitem obtenir l'estadístic t que no ha estat proporcionat en la taula. Hauríem

de contrastar si:

H 0 : β 3 =

H 1 : β 3 ≠ 0

L'estadístic t de contrast que segueix una distribució t(n-k=807-4) és:

El valor crític per a t(803, alfa/2=0.05)= 1.9629 i, per tant, l'estadístic t està a la regió de

no rebuig. Podem concloure que el preu de la caixa de cigarrets no afecta al nombre de

cigarrets fumats.

c. L'estadístic F de contrast de la hipòtesi nul·la pren valor 2.15 amb un p-valor de 0.092.

El model és globalment significatiu ja que l'estadístic F està a la regió de rebuig al 10%

d. Globalment, malgrat que el model és estadísticament significatiu, observem com té

poca capacitat explicativa (el coeficient de determinació és només del 58%). Si bé el

salari i el nivell d'estudis semblen tenir efecte en el nombre de cigarrets fumats, aquest

efecte és molt poc important. Per tant, s'ha de pensar que hi ha altres factors o

variables no considerats en aquest model que incideixen en la decisió de fumar més o

menys.

Problema 2.

A més de les variables del problema anterior, també es disposa de l'edat de cada individu (ED).

I sobre dita conjunta de variables (CI, PR, ED, SA, ÉS) s'ha aplicat la tècnica dels components

principals com pot observar-se en la següent sortida de Minitab:

Principal Component Analysis: CI; PR; ED; SA; ES Eigenanalysis of the Correlation Matrix

Eigenvalue 1.4134 1.0426 1.0026 0.9146 0. Proportion 0.283 0.209 0.201 0.183 0.

Variable PC1 PC2 PC CI 0.037 0.590 0. PR 0.094 -0.657 0. ED -0.388 -0.447 0. SA 0.621 -0.107 0. ES 0.674 -0.099 -0.

a. Quina utilitat té la tècnica utilitzada? Quina capacitat explicativa tenen les tres primeres

components? Com interpretaries les variables “CP1”, “CP2” i “CP3”? Raona la teva

resposta.

b. Per complementar l'anàlisi anterior, s'ha analitzat també si el fet que algun dels pares

de l'individu fumi genera una major predisposició a fumar i, per fer-ho, s'ha calculat

(amb el Minitab) la taula de contingència de les variables FUMA (0, si no fuma i 1, si

fuma) i FA (0, si no fuma cap dels pares; 1, si fuma un d'ells i 2, si fumen ambdós

progenitors).

Tabulated Statistics: FUMA; FA

Rows: FUMA Columns: FA

0 1 2 All

All 608 170 29 807 75.34 21.07 3.59 100. 100.00 100.00 100.00 100. 75.34 21.07 3.59 100.

Chi-Square = 75.730; DF = 2; P-Value = 0.

Cell Contents -- Count % of Row % of Col % of Tbl

A partir d'aquests resultats, contrasta estadísticament si existeix una major predisposició a

fumar entre aquells que tenen algun progenitor que fuma. Explica el contrast que utilitzes i

raona la teva resposta.

Solució:

a. S'està utilitzant la tècnica coneguda com de components principals que serveix per

reduir la dimensionalitat d'un conjunt de variables sense perdre molta informació.

En aquest cas s'han calculat només les 3 primeres components i es pot observar

que la primera acumula el 28,3% de la variabilitat observada, la segona el 20,9% i

la tercera el 20,1% de manera que les tres conjuntament permeten recollir el 69,2%

de la informació (=28,3% + 20,9% + 20,1%).

• La primera component està relacionada sobretot amb les variables SA i ES, és

a dir, amb el salari i el nivell d'estudis, recollint l'estatus social de l'individu.

• La segona component està relacionada amb les variables CI, PR i ED, és a dir,

amb el nombre de cigarrets fumats, amb el preu i l'edat. Mentre la relació amb

els cigarrets fumats és de signe positiu, la relació amb l'edat i el preu és inversa

ja que, en general, a major edat menys es fuma i, com més gran sigui el preu,

també es fuma menys.