Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Formulari d'Estadística, Ejercicios de Estadística

Asignatura: Estadística, Profesor: Josep Maria Mateo Sanz, Carrera: Bioquímica i Biologia Molecular, Universidad: URV

Tipo: Ejercicios

2015/2016

Subido el 15/01/2016

dukesa1211
dukesa1211 🇪🇸

4

(1)

1 documento

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Formulari Estadística
xi
xi
xi: Valor d’una dada estadística N
N
N: Nombre total de dades.
Freqüència absoluta (ni
ni
ni)Vegades que es repeteix una dada.
Freqüència relativa (fi
fi
fi)
fi=ni
N
Freqüència absoluta acomulada (Ni
Ni
Ni):
N1=n1
Ni=Ni1+ni
Freqüència relativa acomulada (Fi
Fi
Fi):
Fi=Ni
N
Marca de classe (xi
xi
xi)En agrupació de dades, mitjana dels dos extrems del grup.
Amplada (ai
ai
ai)Segons el tipus de variable:
En contínues
Amplada =Valormàx V alormín
Nombre d0intrvals
En discretes
Amplada =Valormàx V alormín +1
Nombre d0intrvals
Mitjana aritmètica (x
x
x):
x=
k
X
i=1
xini
N
Mitjana ponderada Si xi ponderacions wi:
x=
k
X
i=1
xiwi
N
Mediana (Me
Me
Me)Valor de la dada que Fiigual a 0,5
Moda Valor de la dada amb fimàxima.
Quartils (Q1,Q2,Q3,Q4
Q1,Q2,Q3,Q4
Q1,Q2,Q3,Q4)Valors de les dades que tenen Fi, respectivament, 0,25; 0,5; ...
Decils (D1,D2,··· ,D10
D1,D2,·· · ,D10
D1,D2,·· · ,D10 )Valors de les dades que tenen Fi, respectivament, 0,1; 0,2; ...
Percentils (P1,·· · ,P100
P1,·· · ,P100
P1,·· · ,P100 )Valors de les dades que tenen Fi, respectivament, 0,01; 0,02; ...
Segons la variable, es calculen amb les fórmules:
En variables discretes
x(Pi)=i(N1)
100 +1
En variables continues
x(Pi)=Lj1+
i(N1)
100 +1Nj1
nj·aj
Lj1: Extrem inferior de l’interval de la dada.
xj: Aquest interval.
Recorregut Diferència entre el valor màxim i el mínim en una sèrie estadística.
Desviació mitjana (Dx
Dx
Dx):
Dx=
k
X
i=1|xix|·ni
N
Variància (σ2
σ2
σ2)(S’anomena Desviació estàndard,Desviació mitjana oDesviació típica a la seva arrel σ):
σ2=
k
X
i=1
(xix)2·ni
N=
k
X
i=1
xi2·ni
Nx2
1
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Formulari d'Estadística y más Ejercicios en PDF de Estadística solo en Docsity!

Formulari Estadística

x i

x i x i

: Valor d’una dada estadística NNN : Nombre total de dades.

Freqüència absoluta (n i

n i n i ) Vegades que es repeteix una dada.

Freqüència relativa ( f i f i f i

f

i

n

i

N

Freqüència absoluta acomulada (N i

N

i

N

i

N

1

= n

1

N

i

= N

i− 1

+ n

i

Freqüència relativa acomulada (F i

F

i

F

i

F

i

N

i

N

Marca de classe (x i

x i x i ) En agrupació de dades, mitjana dels dos extrems del grup.

Amplada (a i

a i a i ) Segons el tipus de variable:

En contínues

Amplada =

Valor

màx

− Valor

mín

Nombre d

intrvals

En discretes

Amplada =

Valor

màx

− Valor

mín

Nombre d

intrvals

Mitjana aritmètica (xxx) :

x =

k

i= 1

x

i

n

i

N

Mitjana ponderada Si x i

té ponderacions w i

x =

k

i= 1

x

i

w

i

N

Mediana (MeMeMe) Valor de la dada que té F i igual a 0,

Moda Valor de la dada amb f i màxima.

Quartils (Q 1

, Q

2

, Q

3

, Q

4

Q

1

, Q

2

, Q

3

, Q

4

Q

1

, Q

2

, Q

3

, Q

4 ) Valors de les dades que tenen F i , respectivament, 0,25; 0,5; ...

Decils (D 1

, D

2

, · · · , D

10

D

1

, D

2

, · · · , D

10

D

1

, D

2

, · · · , D

10 ) Valors de les dades que tenen F i , respectivament, 0,1; 0,2; ...

Percentils (P 1

, · · · , P

100

P

1

, · · · , P

100

P

1

, · · · , P

100 ) Valors de les dades que tenen F i , respectivament, 0,01; 0,02; ...

Segons la variable, es calculen amb les fórmules:

En variables discretes

x(P

i

i(N − 1)

En variables continues

x(P

i

) = L

j− 1

i(N − 1)

+ 1 − N

j− 1

n

j

· a

j

L

j− 1 : Extrem inferior de l’interval de la dada.

x j

: Aquest interval.

Recorregut Diferència entre el valor màxim i el mínim en una sèrie estadística.

Desviació mitjana (D x

D

x

D

x

D

x

k

i= 1

|x

i

− x| · n

i

N

Variància (σ

2 σ

2

σ

2 ) (S’anomena Desviació estàndard, Desviació mitjana o Desviació típica a la seva arrel σ):

2

k

i= 1

(x

i

− x)

2

· n

i

N

k

i= 1

x

i

2

· n

i

N

− x

2

Variància mostral (s

2 s

2 s

2 ) Si les dades són una mostra:

s

2

k

i= 1

(x

i

− x)

2

N − 1

N

N − 1

2

Coeficient de variació (VVV)

V =

x

Espai mostral (Ω

Ω) Conjunt dels resultats possibles d’un experiment aleatori.

Succés (AAA) (o qualsevol lletra majúscula) Subconjunt de Ω de propietats x.

‖ elemental Conté un sol objecte de l’espai mostral.

Variable aleatòria XXX “Funció”on a cada succés elemental se li assigna un nombre.

Variables discretes Prenen uns valors concrets i comptables.

Funció de probabilitat p (X=x) p (X=x) p (X=x) “Funció”on a X se li assigna la probabilitat de cada succés.

Variables contínues Prenen tots els valors de R.

Funció de densitat f (x)

f (x)

f (x)

“Funció”on s’expressa la variació de P (X)

respecte x.

Probabilitat d’un succés (P (a≤X≤b)

(P )

(a≤X≤b)

(P )

(a≤X≤b)

) En discretes, suma de la Funció de probabilitat dels succesos elementals del conjunt (segons els parèntesis,

incloent o no la probabilitat dels extrems...). En continues, segons la fórmula:

b

a

f

(x)

dx

Esperança matemàtica (E (x)

E o μ (x) E o μ (x)

o μ) Valor mitjà teòric (si realitzem l’experiment infinites vegades, la mitjana dels casos resulta ser E (x)

). Segons la

variable, es calcula amb la fórmula:

Discretes

E

(X)

x

x · p

(x)

Contínues

E

(X)

−∞

x · f

(x)

dx

Variància (σ

2 σ

2

σ

2 ) Segons la variable, es calcula amb la fórmula:

Discretes

Var

(X)

x

[x − E

(X)

]

2

· p

(x)

x

[x

2

· p

(x)

] − [E

(X)

]

2

Continues

Var

(X)

−∞

[x − E

(X)

]

2

· f

(x)

dx =

−∞

[x

2

· f

(x)

]dx − [E

(X)

]

2

Distribució Bernouilli Variables aleatories de només dos valors (0 i 1).

Esperança E (X) = p on p és la probabilitat de 1.

Variància Var (X) = pq amb q probabilitat de 0.

Distribució binominal Variables aleatories consistents en sumar n variables amb distribució bernouilli amb probabilitat p.

Funció de probabilitat

p

(k)

= P

(X=k)

n

k

p

k

(1 − p)

n−k

Esperança

E

(X)

= np

Variància

Var

(X)

= npq

Distribució de Poisson Variables aleatòries que poden prendre qualsevol valor k ∈ N

Funció de probabilitat

p

(k)

= P

(X=k)

= e

−λ

k

k!

Esperança

E

(X)

Variància

Var

(X)

Distribució uniforme discreta v. a. que pot prendre n valors finits i EQUIPROBABLES.

Funció de probabilitat

p

(k)

= P

(X=k)

n

Esperança

E

(X)

n + 1

Variància

Var

(X)

n

2

Hipòtesi Sentència que ens diu una suposada distribució de probabilitats sobre un paràmetre.

Hipòtesi nul·la (H 0

H

0

H

0 ) Hipòtesi que volem contrastar, que es suposa certa, però de la que dubtem (e. g. “la moneda no està trucada”).

Hipòtesi alternativa (H 1

H

1

H

1 ) Hipòtesi que complementa les probabilitats de la nul·la. És la que ens porta a fer el contrast (e. g. “I si la moneda està

trucada?”)

Nota: Ens trobem tres casos (segons com quedin distribuides les probabilitats de H 0

i H 1

): Bilateral, unilateral dreta i unilateral esquerra,

depenent de si volem contrastar diferencia, excés o defecte en el valor de l’estadístic.

Nivell de significació crític o p-valor(α c α c α c ) Donada una mostra, la probabilitat que H 0 sigui certa.(Idea gràfica a les taules).

Variable resposta o observada És la variable(Y) que es vol estudiar si depèn o no de les altres (X 1

, X

2

Factor Condició que afecta el resultat de la Variable resposta (condiciona el valor d’una variable “independent ”).

Nivell Maneres en que es pot expressar un Factor (generaran els diferents valors de la variable “independent”)

Efecte assignable Valor que pren Y en una combinació de nivells del/s factor/s.

Efecte no assignable, residual, aleatori Igual que abans, però no podem considerar que el resultat de Y depengui dels factors escullits.

ANOVA d’un factor Busquem diferencies entre els nivells (1, 2 ,... , k). Per això prenem els estadístics següents:

Mitjana mostral del nivell (x i

x i x i ) Per a cada nivell, es pot trobar la mitjana com una mitjana normal:

Nombre total d’observacions (n n n) Suma de tota la població dels k nivells:

Mitjana mostral general (xxx) :

x

i

n i

j= 1

x

i j

n

i

n =

k

i= 1

n

i

x =

k

i= 1

n i

j= 1

x

i j

n

Procediment (només v.a. ∼ N i amb σ =): Realitzem un contrast a lo bèstia on H 0 és mitjanes iguals (H 0 : μ 1 = μ 2 = · · · = μ k ) i per tant

no hi ha influència del factor en la variable resposta, i H 1 : μ i , μ j per a qualsevol i , j, que significa que hi ha alguna diferència i

per tant algun efecte sobre la mostra.

Zona de taules Utilitzem una F de Fisher (graus de llibertat: k − 1 i n − k ) (ens donen α): Les zones d’acceptació i rebuig seràn,

doncs, (0, F α

) i (F α

, ∞), respectivament.

Estadístic de prova Es troba després de trobar totes les coses següents i és la divisió de

Q e

Q d

≡ F:

Q

t

i, j

x

2

i j

− nx

2

Q

e

i

n

i

x

i

2

− nx

2

Q

d

= Q

t

− Q

e

Q

e

Q

e

k − 1

Q

d

Q

d

n − k

Si a més volguéssim el p-valor: α c

= P(F

k− 1 ,n−k

> F)

ANOVA de dos factors i una dada per nivell Considerem dos factors com a possibles (en una taula, distribuits en files d’un mateix nivell i

columnes d’un altre factor i mateix nivell). A les fórmules s’entenen les següents lletres:

a : n

o nivells factor fila b : n

o nivells factor columna x i· : mitjana fila i

x · j : mitjana columna j x : mitjana general

Procediment És paral·lel al procés de una sola variable, però aquest cop tenim dos contrastos d’hipòtesis (una per al factor fila i una altra

per al factor columna). La resta segueix sent igual (cada contrast té com a H 0 iguals mitjanes i com a H 1 alguna diferent els intervals

de cadascuna també són iguals) el que canvia són els graus de llibertat amb que es fan:

F

m,n

Entre files: F

a− 1 ,(a−1)(b−1)

Entre columnes: F

b− 1 ,(a−1)(b−1)

Ara, a més, tenim 2 sumes de quadrats, que no es calculen igual:

Q

t

i, j

x

2

i j

− abx

2

Q

f

= b

i

x

i

2

− abx

2

Q

c

= a

j

x

·

j

2

− abx

2

Q

r

= Q

t

− Q

f

− Q

c

Q

f

Q

f

a − 1

Q

c

Q

c

b − 1

Q

r

Q

r

(a − 1) · (b − 1)

ANOVA de dos factors i més d’una dada per nivell Considerem 2 factors i a i b nivells, amb una mostra de r individus per combinació (n total

a · b · r). Ara, a part de les dades anteriors, podem fer la mitjana de cada combinació (x i j

Procediment Ara, també farem un contrast per saber si els dos factors tenen interacció (tres contrastos en total).

Canvis respecte l’anterior: Graus de llibertat de la F:

Fila: a − 1 i ab(r − 1)

Columna: b − 1 i ab(r − 1)

Interacció: (a − 1)(b − 1) i ab(r − 1)

Canvis en fórmules: ab per abr ; a per ar ; b per br ; Q r

= · · · − Q

I on:

Q

I

= r

i, j

x

i, j

2

− br

i

x

2

− ar

j

x

· j

2

+ abrx

2

ANOVA amb l’Excel

Recta de regressió mostral Donada una mostra de parelles de dades X i

, Y

i , es pot trobar la recta que defineix millor la dependència de Y respecte

X. La recta estimada serà ˆY i = αˆ +

βX i on α i β es troben:

n

n

i= 1

X

i

Y

i

n

i= 1

X

i

n

i= 1

Y

i

n

n

i= 1

X

2

i

n

i= 1

X

i

2

i αˆ = Y −

βX

Mesures de bondat d’ajustament Dades que ens diuen si la recta és vàlida o no.

Coeficient de correlació (rrr) Relació lineal de la mostra. S’anomena Coeficient de determinació a r

2

r =

n

n

i= 1

X

i

Y

i

n

i= 1

X

i

n

i= 1

Y

i

n

n

i= 1

X

2

i

n

i= 1

X

i

2

n

n

i= 1

Y

2

i

n

i= 1

Y

i

2

− 1 ≤ r ≤ 1 on r té el signe de ˆβ

r ≈ ± 1 → Y és exactament funció lineal de X

r ≈ 0 → No hi ha relació lineal entre X i Y

r

2

≈ 1 → la recta explica la relació

r

2

≈ 0 → no hi ha relació lineal entre X i Y

Error estàndard (S u

S

u

S

u ) Resum de errors individuals:

e

i

= Y

i

Y

i

S

u

n

i= 1

e

i

2

n − 2

Contrast de significativitat És significativa la r? S’apropa al valor po-

blacional ρ? (H 0 : ρ = 0 i H 1 : ρ , 0)

· Utilitzarem una t de Student amb n − 2 graus de llibertat per

trobar: H 0

: (−t α/ 2

, t α/ 2

· Estadístic de prova t =

r

n − 2

1 − r

2

, o utilitzar r de EP i les zones

amb

t α/ 2

t

2

α/ 2

  • n − 2

en comptes de t α/ 2

Intérval de predicció Al intrapolar un nou resultat, hem de acompanyar-lo d’un marge d’error:

Valor particular Y 0

Y

0

Y

0

Y

0

Y

0

± t

α/ 2

S

u

n

X

0

− X

2

n

i= 1

X

2

i

− nX

2

Esperança de Y 0

Y

0

Y

0

Y

0

Y

0

± t

α/ 2

S

u

n

X

0

− X

2

n

i= 1

X

2

i

− nX

2

Regresió no lineal simple Possibles models de relació entre variables que es poden transformar en un model lineal. Per exemple:

Logarítmica En funcions del tipus: e

Y = a · X

b ⇒ Y = ln (a) + b · ln (X) ⇒ Y

′ = α

  • β

′ · X

Exponencial Y = a · X

b ⇒ ln (Y) = ln (a) + b · ln (X) ⇒ Y

′ = α

  • β

′ · X

Inversa Y = a +

b

X

⇒ Y

′ = α

  • β

′ · X

Regresió lineal múltiple Model que expressa una variable (Y) en funció de més d’una variable (X 1

, · · · , X

k

): Y = β 0

  • β 1

· X

1

  • · · · + β k

· X

k

Mesures de bondat: Canvis respecte el simple Petites diferències que hem de tindre en compte un cop tinguem feta la regressió lineal (tot i que

mai en farem a mà, les múltiples).