



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística, Profesor: Josep Maria Mateo Sanz, Carrera: Bioquímica i Biologia Molecular, Universidad: URV
Tipo: Ejercicios
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




x i
x i x i
: Valor d’una dada estadística NNN : Nombre total de dades.
Freqüència absoluta (n i
n i n i ) Vegades que es repeteix una dada.
Freqüència relativa ( f i f i f i
i
i
Freqüència absoluta acomulada (N i
i
i
1
1
i
i− 1
i
Freqüència relativa acomulada (F i
i
i
i
i
Marca de classe (x i
x i x i ) En agrupació de dades, mitjana dels dos extrems del grup.
Amplada (a i
a i a i ) Segons el tipus de variable:
En contínues
màx
mín
′
En discretes
màx
mín
′
Mitjana aritmètica (xxx) :
k
i= 1
i
i
Mitjana ponderada Si x i
té ponderacions w i
k
i= 1
i
i
Mediana (MeMeMe) Valor de la dada que té F i igual a 0,
Moda Valor de la dada amb f i màxima.
Quartils (Q 1
2
3
4
1
2
3
4
1
2
3
4 ) Valors de les dades que tenen F i , respectivament, 0,25; 0,5; ...
Decils (D 1
2
10
1
2
10
1
2
10 ) Valors de les dades que tenen F i , respectivament, 0,1; 0,2; ...
Percentils (P 1
100
1
100
1
100 ) Valors de les dades que tenen F i , respectivament, 0,01; 0,02; ...
Segons la variable, es calculen amb les fórmules:
En variables discretes
i
En variables continues
i
j− 1
j− 1
j
j
j− 1 : Extrem inferior de l’interval de la dada.
x j
: Aquest interval.
Recorregut Diferència entre el valor màxim i el mínim en una sèrie estadística.
Desviació mitjana (D x
x
x
x
k
i= 1
i
i
Variància (σ
2 σ
2
σ
2 ) (S’anomena Desviació estàndard, Desviació mitjana o Desviació típica a la seva arrel σ):
2
k
i= 1
i
2
i
k
i= 1
i
2
i
2
Variància mostral (s
2 s
2 s
2 ) Si les dades són una mostra:
2
k
i= 1
i
2
2
Coeficient de variació (VVV)
Espai mostral (Ω
Ω) Conjunt dels resultats possibles d’un experiment aleatori.
Succés (AAA) (o qualsevol lletra majúscula) Subconjunt de Ω de propietats x.
‖ elemental Conté un sol objecte de l’espai mostral.
Variable aleatòria XXX “Funció”on a cada succés elemental se li assigna un nombre.
Variables discretes Prenen uns valors concrets i comptables.
Funció de probabilitat p (X=x) p (X=x) p (X=x) “Funció”on a X se li assigna la probabilitat de cada succés.
Variables contínues Prenen tots els valors de R.
Funció de densitat f (x)
f (x)
f (x)
“Funció”on s’expressa la variació de P (X)
respecte x.
Probabilitat d’un succés (P (a≤X≤b)
(a≤X≤b)
(a≤X≤b)
) En discretes, suma de la Funció de probabilitat dels succesos elementals del conjunt (segons els parèntesis,
incloent o no la probabilitat dels extrems...). En continues, segons la fórmula:
b
a
(x)
Esperança matemàtica (E (x)
E o μ (x) E o μ (x)
o μ) Valor mitjà teòric (si realitzem l’experiment infinites vegades, la mitjana dels casos resulta ser E (x)
). Segons la
variable, es calcula amb la fórmula:
Discretes
(X)
x
(x)
Contínues
(X)
∞
−∞
(x)
Variància (σ
2 σ
2
σ
2 ) Segons la variable, es calcula amb la fórmula:
Discretes
(X)
x
(X)
2
(x)
x
2
(x)
(X)
2
Continues
(X)
∞
−∞
(X)
2
(x)
∞
−∞
2
(x)
(X)
2
Distribució Bernouilli Variables aleatories de només dos valors (0 i 1).
Esperança E (X) = p on p és la probabilitat de 1.
Variància Var (X) = pq amb q probabilitat de 0.
Distribució binominal Variables aleatories consistents en sumar n variables amb distribució bernouilli amb probabilitat p.
Funció de probabilitat
(k)
(X=k)
k
n−k
Esperança
(X)
Variància
(X)
Distribució de Poisson Variables aleatòries que poden prendre qualsevol valor k ∈ N
Funció de probabilitat
(k)
(X=k)
−λ
k
Esperança
(X)
Variància
(X)
Distribució uniforme discreta v. a. que pot prendre n valors finits i EQUIPROBABLES.
Funció de probabilitat
(k)
(X=k)
Esperança
(X)
Variància
(X)
2
Hipòtesi Sentència que ens diu una suposada distribució de probabilitats sobre un paràmetre.
Hipòtesi nul·la (H 0
0
0 ) Hipòtesi que volem contrastar, que es suposa certa, però de la que dubtem (e. g. “la moneda no està trucada”).
Hipòtesi alternativa (H 1
1
1 ) Hipòtesi que complementa les probabilitats de la nul·la. És la que ens porta a fer el contrast (e. g. “I si la moneda està
trucada?”)
Nota: Ens trobem tres casos (segons com quedin distribuides les probabilitats de H 0
i H 1
): Bilateral, unilateral dreta i unilateral esquerra,
depenent de si volem contrastar diferencia, excés o defecte en el valor de l’estadístic.
Nivell de significació crític o p-valor(α c α c α c ) Donada una mostra, la probabilitat que H 0 sigui certa.(Idea gràfica a les taules).
Variable resposta o observada És la variable(Y) que es vol estudiar si depèn o no de les altres (X 1
2
Factor Condició que afecta el resultat de la Variable resposta (condiciona el valor d’una variable “independent ”).
Nivell Maneres en que es pot expressar un Factor (generaran els diferents valors de la variable “independent”)
Efecte assignable Valor que pren Y en una combinació de nivells del/s factor/s.
Efecte no assignable, residual, aleatori Igual que abans, però no podem considerar que el resultat de Y depengui dels factors escullits.
ANOVA d’un factor Busquem diferencies entre els nivells (1, 2 ,... , k). Per això prenem els estadístics següents:
Mitjana mostral del nivell (x i
x i x i ) Per a cada nivell, es pot trobar la mitjana com una mitjana normal:
Nombre total d’observacions (n n n) Suma de tota la població dels k nivells:
Mitjana mostral general (xxx) :
i
n i
j= 1
i j
i
k
i= 1
i
k
i= 1
n i
j= 1
i j
Procediment (només v.a. ∼ N i amb σ =): Realitzem un contrast a lo bèstia on H 0 és mitjanes iguals (H 0 : μ 1 = μ 2 = · · · = μ k ) i per tant
no hi ha influència del factor en la variable resposta, i H 1 : μ i , μ j per a qualsevol i , j, que significa que hi ha alguna diferència i
per tant algun efecte sobre la mostra.
Zona de taules Utilitzem una F de Fisher (graus de llibertat: k − 1 i n − k ) (ens donen α): Les zones d’acceptació i rebuig seràn,
doncs, (0, F α
) i (F α
, ∞), respectivament.
Estadístic de prova Es troba després de trobar totes les coses següents i és la divisió de
Q e
Q d
t
i, j
2
i j
2
e
i
i
i
2
2
d
t
e
e
e
d
d
Si a més volguéssim el p-valor: α c
k− 1 ,n−k
ANOVA de dos factors i una dada per nivell Considerem dos factors com a possibles (en una taula, distribuits en files d’un mateix nivell i
columnes d’un altre factor i mateix nivell). A les fórmules s’entenen les següents lletres:
a : n
o nivells factor fila b : n
o nivells factor columna x i· : mitjana fila i
x · j : mitjana columna j x : mitjana general
Procediment És paral·lel al procés de una sola variable, però aquest cop tenim dos contrastos d’hipòtesis (una per al factor fila i una altra
per al factor columna). La resta segueix sent igual (cada contrast té com a H 0 iguals mitjanes i com a H 1 alguna diferent els intervals
de cadascuna també són iguals) el que canvia són els graus de llibertat amb que es fan:
m,n
a− 1 ,(a−1)(b−1)
b− 1 ,(a−1)(b−1)
Ara, a més, tenim 2 sumes de quadrats, que no es calculen igual:
t
i, j
2
i j
2
f
i
i
2
2
c
j
·
2
2
r
t
f
c
f
f
c
c
r
r
ANOVA de dos factors i més d’una dada per nivell Considerem 2 factors i a i b nivells, amb una mostra de r individus per combinació (n total
a · b · r). Ara, a part de les dades anteriors, podem fer la mitjana de cada combinació (x i j
Procediment Ara, també farem un contrast per saber si els dos factors tenen interacció (tres contrastos en total).
Canvis respecte l’anterior: Graus de llibertat de la F:
Fila: a − 1 i ab(r − 1)
Columna: b − 1 i ab(r − 1)
Interacció: (a − 1)(b − 1) i ab(r − 1)
Canvis en fórmules: ab per abr ; a per ar ; b per br ; Q r
I on:
I
i, j
i, j
2
i
i·
2
j
· j
2
2
ANOVA amb l’Excel
Recta de regressió mostral Donada una mostra de parelles de dades X i
i , es pot trobar la recta que defineix millor la dependència de Y respecte
X. La recta estimada serà ˆY i = αˆ +
βX i on α i β es troben:
n
i= 1
i
i
n
i= 1
i
n
i= 1
i
n
i= 1
2
i
n
i= 1
i
2
Mesures de bondat d’ajustament Dades que ens diuen si la recta és vàlida o no.
Coeficient de correlació (rrr) Relació lineal de la mostra. S’anomena Coeficient de determinació a r
2
n
i= 1
i
i
n
i= 1
i
n
i= 1
i
n
i= 1
2
i
n
i= 1
i
2
n
i= 1
2
i
n
i= 1
i
2
2
2
Error estàndard (S u
u
u ) Resum de errors individuals:
i
i
i
u
n
i= 1
i
2
Contrast de significativitat És significativa la r? S’apropa al valor po-
blacional ρ? (H 0 : ρ = 0 i H 1 : ρ , 0)
· Utilitzarem una t de Student amb n − 2 graus de llibertat per
trobar: H 0
: (−t α/ 2
, t α/ 2
· Estadístic de prova t =
r
n − 2
1 − r
2
, o utilitzar r de EP i les zones
amb
t α/ 2
t
2
α/ 2
en comptes de t α/ 2
Intérval de predicció Al intrapolar un nou resultat, hem de acompanyar-lo d’un marge d’error:
Valor particular Y 0
0
0
0
0
α/ 2
u
0
2
n
i= 1
2
i
2
Esperança de Y 0
0
0
0
0
α/ 2
u
0
2
n
i= 1
2
i
2
Regresió no lineal simple Possibles models de relació entre variables que es poden transformar en un model lineal. Per exemple:
Logarítmica En funcions del tipus: e
Y = a · X
b ⇒ Y = ln (a) + b · ln (X) ⇒ Y
′ = α
′
′ · X
′
Exponencial Y = a · X
b ⇒ ln (Y) = ln (a) + b · ln (X) ⇒ Y
′ = α
′
′ · X
′
Inversa Y = a +
b
X
′ = α
′
′ · X
′
Regresió lineal múltiple Model que expressa una variable (Y) en funció de més d’una variable (X 1
k
): Y = β 0
1
k
Mesures de bondat: Canvis respecte el simple Petites diferències que hem de tindre en compte un cop tinguem feta la regressió lineal (tot i que
mai en farem a mà, les múltiples).