¡Descarga practica estadistica y más Ejercicios en PDF de Estadística solo en Docsity!
ESTADÍSTICA
PRÀCTIQUES PRESENCIALS
Universitat de Barcelona
Facultat de Psicologia
Departament de Psicologia Social i Psicologia Quantitativa
Secció Psicologia Quantitativa
Curs 2016 – 2017
SITUACIÓ A TREBALLAR
El tabaquisme continua sent actualment la primera causa de morbi-mortalitat en el
mon. Es conegut que el consum de tabac està relacionat amb patologies de tipus físic,
però també amb trastorns mentals de l’eix I (trastorns de l’estat de l’ànim, trastorns
d’ansietat, trastorns per l’ús de substàncies, trastorns psicòtics,...) i trastorns de
personalitat de eix II, però en aquest últim cas encara no hi ha gaire recerca al
respecte. És per aquest motiu que en el present treball es vol estudiar la relació entre
trastorns de personalitat i l’abstinència en el consum de tabac desprès d’un programa
per deixar de fumar^1. Per això es va treballar amb una mostra de voluntaris sotmesos
al programa per deixar de fumar. La presència de trastorns de personalitat es va
establir a partir de l’Inventari Clínic Multiaxial de Millon (MCMI-II), es va determinar
com a sí trastorn de personalitat aquelles persones que tenien una puntuació en la
tasa base igual o superior a 85. A continuació es mostra la matriu de dades simulada:
Sexe Trastorn- personalitat Edat
Edat inici fumar
Tipus tabac
Nº cigarretes fumades al dia
Abstinència Grau malestar
Home No 55 15 Negre 25 Sí 1
Home No 45 16 Negre 33 No 7
Home Sí 25 21 Negre 35 No 5
Home Sí 33 18 Ros 29 No 4
Home Sí 34 19 Ros 12 No 7
Home Sí 43 22 Negre 39 Sí 2
Home No 35 16 Negre 42 Sí 1
Home No 54 24 Negre 36 Sí 1
Home No 62 15 Ros 38 No 3
Home No 43 14 Negre 28 Sí 1
Dona Sí 32 17 Ros 32 Sí 2
Dona Sí 27 18 Ros 33 No 2
Dona Sí 61 16 Ros 27 Sí 1
Dona Sí 54 13 Ros 22 Sí 2
Dona Sí 43 14 Negre 18 No 6
Dona Sí 45 25 Ros 12 Sí 2
Dona Sí 39 13 Ros 23 No 7
Dona Sí 42 12 Ros 22 No 3
Dona Sí 43 24 Negre 21 No 5
Dona Sí 65 28 Negre 33 Sí 2
Dona No 57 19 Ros 25 Sí 1
(^1) Fernández, E., López, A., y Becoña, E. (2010). Trastornos de personalidad y abstinencia del consumo de tabaco en un tratamiento
psicológico para dejar de fumar. Psicothema , 22 (3), 357-362.
3. La proporció de persones que pateixen o patiran un trastorn de l’estat de l’ànim al
llarg de la vida és del 0,22 a la població. Tenint en compte aquesta informació
determinar:
a) La probabilitat que en una mostra de 100 persones aquesta proporció sigui
superior a 0,20.
b) La probabilitat que en una mostra de 30 persones aquesta proporció sigui
superior a 0,20.
c) La probabilitat que en una mostra de 35 persones aquesta proporció estigui entre
0,23 i 0,30.
d) La probabilitat que en una mostra de 150 persones aquesta proporció sigui
inferior a 0,23.
e) Entre quins valors estarà la proporció del 99% central de mostres de grandària
4. L’edat en que les persones comencen a fumar es distribueix a la població segons el
model de la llei normal amb mitjana 15 anys i variància 6,25. Tenint en compte
aquesta informació determini:
a) La mitjana d’edat d’inici de començar a fumar que deixa per sota seu el 55%
inferior de mitjanes en mostres de grandària 200.
b) La probabilitat que una aquesta mitjana sigui superior als 12 anys en mostres de
grandària 81.
c) Els valors de mitjanes que limiten el 90% central de la distribució en mostres de
grandària 23.
d) La probabilitat que aquesta mitjana estigui entre 13 i 19 anys en mostres de
grandària 23.
e) La probabilitat que aquesta mitjana estigui entre 16 i 19 anys en mostres de
grandària 64.
UNITATS 3, 4, i 5: INTERVAL DE PROBABILITAT, INTERVAL DE CONFIANÇA I
DETERMINACIÓ DE LA GRANDÀRIA DE MOSTRA.
1. La proporció de persones que pateixen o patiran un trastorn de l’estat de l’ànim al
llarg de la vida és del 0,22 a la població. Tenint en compte aquesta informació
determinar entre quins valors hauria d’estar aquesta proporció a la nostra mostra si
es vol treballar amb un nivell de confiança del 95%. I si fos un nivell de confiança del
99%. Raoni el perquè de la diferent amplitud dels dos intervals obtinguts.
2. L’edat en que les persones comencen a fumar es distribueix a la població segons el
model de la llei normal amb mitjana 15 anys i variància 6,25. Tenint en compte
aquesta informació entre quins valors hauria d’estar aquesta mitjana a la nostra
mostra? Treballi amb un nivell de confiança del 98%.
3. Determini la grandària de mostra necessària per estimar la proporció de dones
fumadores a la població. Treballar amb un nivell de confiança del 95% i del 98%
mantenint sempre la precisió al 3,5%.
4. Tenint en compte les dades de la nostra mostra, entre quins valors hauria d’estar la
mitjana de número de cigarretes fumades al dia a la població origen de la mostra.
Treballar amb un del 4%.
5. La proporció de fumadors a la població és de 0,32. Tenint en compte aquesta
informació, determini entre quins valors hauria d’estar aquesta proporció a la
nostra mostra si es vol treballar amb un del 1%.
6. Tenint en compte les dades de la nostra mostra, determini entre quins valors hauria
d’estar la proporció de persones que fumen tabac negre. Treballi amb un nivell de
confiança del 99%.
7. Determini la grandària de mostra necessària per determinar la mitjana d’edat d’inici
a fumar si es vol treballar amb un del 1% i una precisió de 3 anys.
8. El número de cigarretes fumades al dia es distribueix a la població segons el model
de la llei normal amb mitjana 32 i variància 64. Tenint en compte aquesta
informació entre quins valors hauria d’estar aquesta mitjana a la nostra mostra.
Treballar amb un nivell de confiança del 98%.
9. Tenint en compte les dades de la nostra mostra determini entre quins valors estarà
la proporció de persones que no estarien abstinents al finalitzar el tractament a la
població origen. Treballi amb un del 5%.
10. Tenint en compte les dades de la nostra mostra determini entre quins valors estarà
la mitjana d’edat d’inici a fumar. Treballar amb un nivell de confiança del 95%.
7. Estableixi la bondat de l’ajust a la llei normal de la variable número de cigarretes
fumades al dia a partir de les dades de la nostra mostra.
UNITAT 8: PROVA DE KHI QUADRAT.
1. Tenint en compte la informació que es presenta a continuació determini si existeix
relació estadísticament significativa entre el fet de presentar un trastorn de
personalitat antisocial i el fet de ser fumador. Treballar amb un del 5%.
Fumador
Total
Sí No
Trastorn de
personalitat antisocial
Sí 10 2 12
No 85 125 210
Total 95 127 222
2. A partir de la següent taula de contingència determini si existeix relació
estadísticament significativa entre el fet de presentar un trastorn de personalitat
per dependència i mantenir-se abstinent a l’any desprès de seguir un programa per
deixar de fumar. Treballar amb un del 1%.
Mantenir-se
abstinent Total
Sí No
Trastorn de personalitat
per dependència
Sí 3 38 41
No 16 64 80
Total 19 102 121
3. Determini si existeix relació entre el tipus de trastorn de personalitat i el fet de
mantenir-se abstinent al final del tractament. Treballi amb un del 5%.
Mantenir-se
abstinent Total
Sí No
Tipus de
trastorn de
personalitat
T. antisocial 2 9 11
T. per dependència 11 47 58
Cap trastorn 65 22 87
Total 78 78 156
> .Table # Counts 1 2 1 2 9 2 11 47 3 65 22
> .Test <- chisq.test(.Table, correct=FALSE) > .Test Pearson's Chi-squared test data: .Table X-squared = 48.0522, df = 2, p-value = 3.678e-
> .Test$expected # Expected Counts 1 2 1 5.5 5. 2 29.0 29. 3 43.5 43.
4. Determini si existeix relació estadísticament significativa entre el sexe i el fet de
mantenir-se abstinent al final del tractament. Treballi amb un del 1%.
5. Determini si existeix relació estadísticament significativa entre el sexe i el tipus de
tabac. Treballi amb un del 5%.
6. Determini si existeix relació estadísticament significativa entre el sexe i el fet de
patir un trastorn de personalitat. Treballi amb un del 2%.
7. Determini si existeix relació estadísticament significativa entre el fet de mantenir-se
abstinent al final del tractament i el tipus de tabac. Treballi amb un del 3%.
> .Table <- xtabs(~Abstinència+Tipus_tabac, data=Dades_Pràctiques) > .Table Tipus_tabac Abstinència Negre Ros No 4 7 Sí 6 6
> .Test <- chisq.test(.Table, correct=FALSE) > .Test Pearson's Chi-squared test data: .Table X-squared = 0.4343, df = 1, p-value = 0.
> .Test$expected # Expected Counts Tipus_tabac Abstinència Negre Ros No 4.782609 6. Sí 5.217391 6.
2. Existeix la hipòtesi que els fumadors amb trastorn de personalitat es van iniciar en el
consum de tabac a una edat més primerenca que els fumadors que no tenen
trastorn de personalitat. Les nostres dades confirmen aquesta hipòtesi. Treballar
amb un del 2%.
3. Existeixen diferències estadísticament significatives en el número de cigarretes
fumades al dia entre els homes i les dones? Treballar amb un del 5%.
4. Les nostres dades confirmen la hipòtesi que els que es mantenen abstinents desprès
del tractament fumaven menys cigarretes al dia que els que no es mantenen
abstinents al final de tractament? Treballar amb un del 2%.
> .norm.test # Pruebas de normalidad
Prueba de ajuste a la normal: Anderson-Darling :
DossierPràctiques$Abstinència: No Anderson-Darling normality test data: DossierPràctiques$Nº.cigarretes.fumades.al.dia A = 0.3379, p-value = 0.
DossierPràctiques$Abstinència: Sí Anderson-Darling normality test data: DossierPràctiques$Nº.cigarretes.fumades.al.dia A = 0.1875, p-value = 0.
> tapply(Dades_Pràctiques$Nº.cigarretes.fumades.al.dia, Dades_Pràctiques$Abstinència, var, + na.rm=TRUE) No Sí 66.69091 69.
> var.test(Nº.cigarretes.fumades.al.dia ~ Abstinència, alternative='two.sided', conf.level=.95, + data=Dades_Pràctiques) F test to compare two variances data: Nº.cigarretes.fumades.al.dia by Abstinència F = 0.9591, num df = 10, denom df = 11, p-value = 0. alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2720216 3. sample estimates: ratio of variances
> t.test(Nº.cigarretes.fumades.al.dia~Abstinència, alternative='greater', conf.level=.95, + var.equal=TRUE, data=Dades_Pràctiques) Two Sample t-test data: Nº.cigarretes.fumades.al.dia by Abstinència t = -0.7759, df = 21, p-value = 0. alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: -8.605249 Inf sample estimates: mean in group No mean in group Sí 25.90909 28.
5. Existeixen diferències estadísticament significatives en el número de cigarretes
fumades al dia en funció del tipus de tabac? Treballar amb un del 5%.
> .norm.test # Pruebas de normalidad
Prueba de ajuste a la normal: Anderson-Darling :
DossierPràctiques$Tipus_tabac: Negre Anderson-Darling normality test data: DossierPràctiques$Nº.cigarretes.fumades.al.dia A = 0.2333, p-value = 0.
DossierPràctiques$Tipus_tabac: Ros Anderson-Darling normality test data: DossierPràctiques$Nº.cigarretes.fumades.al.dia A = 0.3263, p-value = 0.
> tapply(Dades_Pràctiques$Nº.cigarretes.fumades.al.dia, Dades_Pràctiques$Tipus_tabac, var, + na.rm=TRUE) Negre Ros 60.88889 56.
> var.test(Nº.cigarretes.fumades.al.dia ~ Tipus_tabac, alternative='two.sided', conf.level=.95, + data=Dades_Pràctiques) F test to compare two variances data: Nº.cigarretes.fumades.al.dia by Tipus_tabac F = 1.0694, num df = 9, denom df = 12, p-value = 0. alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3112564 4. sample estimates: ratio of variances
> t.test(Nº.cigarretes.fumades.al.dia~Tipus_tabac, alternative='two.sided', conf.level=.95, + var.equal=TRUE, data=Dades_Pràctiques) Two Sample t-test data: Nº.cigarretes.fumades.al.dia by Tipus_tabac t = 2.0301, df = 21, p-value = 0. alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.1593824 13. sample estimates: mean in group Negre mean in group Ros 31.00000 24.
6. Tenint en compte les dades que es mostren a continuació determini si s’ha reduït de
forma estadísticament significativa el consum de tabac al mes d’haver iniciat el
tractament? Treballi amb un del 1%.
ID
Nº Cigarretes
dia abans
tractament
Nº cigarretes dia
al mes d’iniciar el
tractament
ID
Nº Cigarretes
dia abans
tractament
Nº cigarretes dia
al mes d’iniciar el
tractament
Prueba U de Mann-Whitney para Grau_malestar por Trastorn.personalitat Wilcoxon rank sum test data: Grau_malestar by Trastorn.personalitat W = 31, p-value = 0. alternative hypothesis: true location shift is less than 0 99 percent confidence interval: -Inf 4.002568e- sample estimates: difference in location
4. Existeixen diferències estadísticament significatives en el grau de malestar amb l’èxit
del tractament i el tipus de tabac? Treballi amb un del 2%.
> UMW # Prueba U de Mann-Whitney para Grau_malestar segun Tipus_tabac Medianas para Grau_malestar segun Tipus_tabac Negre Ros 2 2
Resumen descriptivo por rangos Rango promedio Suma Rangos Negre 11.40 114 Ros 12.46 162
Prueba U de Mann-Whitney para Grau_malestar por Tipus_tabac Wilcoxon rank sum test data: Grau_malestar by Tipus_tabac W = 59, p-value = 0. alternative hypothesis: true location shift is not equal to 0 98 percent confidence interval: -1.999969 3. sample estimates: difference in location -8.972406e-
5. Tenint en compte les dades de la taula següent, determinis si disminueix el grau de
malestar pel fet de fumar al mes d’haver iniciat el tractament en relació al grau de
malestar a l’inici del tractament. Treballi amb un del 5%.
ID
Grau de
Malestar Fumar
Grau de
Malestar Fumar
al mes
ID
Grau de
Malestar Fumar
Grau de
Malestar Fumar
al mes
ID
Grau de
Malestar Fumar
Grau de
Malestar Fumar
al mes
ID
Grau de
Malestar Fumar
Grau de
Malestar Fumar
al mes
UNITATS 12, 13 i 14: COEFICIENTS DE CORRELACIÓ I INTRODUCCIÓ ALS MODELS
ESTADÍSTICS.
1. Determini si existeix relació estadísticament significativa entre l’edat d’inici a fumar i
el número de cigarretes fumades al dia. Treballi amb un del 1%.
2. Determini si existeix relació estadísticament significativa entre l’edat i el grau de
malestar amb l’èxit del tractament. Treballi amb un del 5%.
3. Estableixi la matriu de correlacions entre les diferents variables quantitatives
mesurades com a mínim en escala d’interval de la nostra base de dades.
4. En funció de la matriu anterior, determini quina seria la millor variable per predir el
número de cigarretes fumades al dia. Justifiqui la seva resposta.
El percentatge de persones grans a Espanya representava el 17% en el 2003 i es preveu
que arribi al 30.8% en el 2050. Aquest canvi demogràfic implicarà reformes socials,
econòmiques i polítiques adequades a noves necessitats en relació a les persones
grans. A més a més l’envelliment en entorns rurals es caracteritza per afectar a tota la
comunitat i a una proporció de persones grans molt més elevada que en l’àmbit urbà,
amb una densitat de població baixa i molt disseminada en el territori. Monreal, del
Valle i Tarrés (2009)^2 es proposen un estudi per estudiar aquesta problemàtica, el seu
objectiu va ser contribuir a promoure la autonomia de les persones grans que viuen en
un entorn rural, per això fan la proposta de la creació de serveis i treball en xarxa. A
continuació es mostra una matriu de dades simulada d’algunes de les dades que van
recollir aquests autors en el seu estudi.
(^2) Monreal, P., del Valle, A., i Tarrés, R. (2009). Haciendo visible lo invisible: Peralada, un estudio de
caso. Anuario de Psicología , 40 (3), 391-406.
simple per predir les puntuacions de Barthel (especificació. estimació dels coeficients
i validació del model).
> rcorr.adjust(Dades_Grans[,c("barthel","edat","pfeiffer")], type="pearson", use="pairwise.complete") Pearson correlations: barthel edat pfeiffer barthel 1.0000 0.4788 -0. edat 0.4788 1.0000 -0. pfeiffer -0.9523 -0.4969 1.
Number of observations: 25
Pairwise two-sided p-values: barthel edat pfeiffer barthel 0.0155 <. edat 0.0155 0. pfeiffer <.0001 0.
Adjusted p-values (Holm's method) barthel edat pfeiffer barthel 0.023 0. edat 0.023 0. pfeiffer 0.000 0.
6. Determini si existeixen diferències en l’edat en funció de l’estat civil.
> tapply(Dades_Grans$edat, Dades_Grans$estatcivil, var, na.rm=TRUE) Casat Solter Vidu 58.51515 78.25000 46.
> leveneTest(Dades_Grans$edat, Dades_Grans$estatcivil, center=median) Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 2 0.025 0. 22
> AnovaModel.3 <- aov(edat ~ estatcivil, data=Dades_Grans) > summary(AnovaModel.3) Df Sum Sq Mean Sq F value Pr(>F) estatcivil 2 438 219.01 3.861 0.0365 * Residuals 22 1248 56.
Signif. codes: 0 '' 0.001 '' 0.01 '' 0.05 '.' 0.1 ' ' 1
> numSummary(Dades_Grans$edat , groups=Dades_Grans$estatcivil, statistics=c("mean", "sd")) mean sd data:n Casat 83.83333 7.649520 12 Solter 77.75000 8.845903 4 Vidu 74.77778 6.796650 9
> .Pairs <- glht(AnovaModel.3, linfct = mcp(estatcivil = "Tukey")) > summary(.Pairs) # pairwise tests Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Tukey Contrasts Fit: aov(formula = edat ~ estatcivil, data = Dades_Grans)
Linear Hypotheses: Estimate Std. Error t value Pr(>|t|) Solter - Casat == 0 -6.083 4.348 -1.399 0. Vidu - Casat == 0 -9.056 3.321 -2.727 0.0311 * Vidu - Solter == 0 -2.972 4.526 -0.657 0.
Signif. codes: 0 '' 0.001 '' 0.01 '' 0.05 '.' 0.1 ' ' 1 (Adjusted p values reported -- single-step method)
> confint(.Pairs) # confidence intervals Simultaneous Confidence Intervals Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = edat ~ estatcivil, data = Dades_Grans)
Quantile = 2. 95% family-wise confidence level
Linear Hypotheses: Estimate lwr upr Solter - Casat == 0 -6.0833 -16.9598 4. Vidu - Casat == 0 -9.0556 -17.3626 -0. Vidu - Solter == 0 -2.9722 -14.2928 8.
> cld(.Pairs) # compact letter display Casat Solter Vidu "b" "ab" "a"
-15 -10 -5 0 5
Vidu - Solter
Vidu - Casat
Solter - Casat (
(
(
)
)
)
95% family-wise confidence level
Linear Function