








































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: analisis, Profesor: Desconocido Desconocido, Carrera: Biología, Universidad: UAH
Tipo: Diapositivas
Subido el 23/06/2015
1 / 48
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









































Ana Justel - 2011
Matriz de datos. Vector de medias y matriz de covarianzas. Representación gráfica de datos multivariantes. Distancias estadísticasDistancias estadísticas Datos atípicos multivariantes.
Ana Justel - 2011
Resúmenes núméricos de los datosResúmenes núméricos de los datos
Para datos categóricos o discretos:Para datos categóricos o discretos:
Resúmenes núméricos de los datosResúmenes núméricos de los datos
Para datos categóricos o discretos:Para datos categóricos o discretos:
Tabla de frecuencias
Para datos cuantitativosPara datos cuantitativos:
Medidas de posición
media, mediana, moda, media recortada
ó
í
Medidas de dispersión
varianza, desviación típica, rango,rango intercuartílico, MEDA
Medidas de forma
Coeficiente de asimetríaCoeficiente de curtosis o apuntamiento
Medidas de asociación
Coeficiente de correlación de Pearson
Ana Justel - 2011
Resumenes gráficos de los datos.Resumenes gráficos de los datos.
Para datosPara datos univariantes
univariantes:
Resumenes gráficos de los datos.Resumenes gráficos de los datos.
0
50 250200150100
Diagrama de barrasDiagrama de sectoresMapas estadísticos
Greatly Datos categóricos o discretos
A lot
Something
Little
Nothing
p
Serie temporalHistograma
120,
130,
g
Gráficos probabilísticosBarras de errorBox-plot
Datos cuantitativos
80,00 60,00 40, 100,
1351,35 538,46 363 64
Di
d
b
últi
l
Box
plot
Para datosPara datos multivariantes
multivariantes:
Datos categóricos o discretos
clorofila
20,00 0,
363,64126,67110,
Casos ponderados por nºcelulas
Di
agrama de barras múltiple
Box-plot múltiple
Datos categóricos o discretos
Diagrama de dispersiónMatriz de diagramas de dispersiónGráficos de estrellas y caras
Datos cuantitativos
Ana Justel - 2011
y
Cuestiones importantes sobre la organización de los datos:Cuestiones importantes sobre la organización de los datos:
El formato debe ser compatible con los requerimientos del
p
g
p
g
El formato debe ser compatible con los requerimientos del software que se vaya a usar para el análisis.
EXCEL admite casi cualquier organización posible
El problema
EXCEL admite casi cualquier organización posible. El problemaestá en cómo analizamos los datos con EXCEL! El “Editor de Datos del SPSS” almacena los datos en unaEl
Editor de Datos del SPSS
almacena los datos en una
matriz que siempre tiene las variables en las columnas. Cadafila contiene la información completa disponible sobre unindividuoindividuo.
Cuando hay datos faltantes (“missing data”):
Se interpola el valor faltante. Se elimina la variable para todos los individuos. Se excluye del análisis al individuo.
Ana Justel - 2011
Ejemplo:Ejemplo: Medidas de cráneos de cocodrilos
(alligator.txt)
Valores de 11 medidas físicas en un ejemplar de cada especie:
La matriz de datos es
x
Medida de la variable 6 en
el crocodrilo 3
Ana Justel - 2011
Ejemplo:Ejemplo: Lirios (iris.txt)
En 1936, el biólogo y estadístico Sir R.A. Fisher, recopila los datosde 150 lirios para cuantificar la variación geografica de estas flores
l
í
l
d
é
d
en la Península de Gaspé, Canada.La muestra contiene 50 lirios de cada una delas t es especies
i is
setosasetosa
i is
e sicoloe sicolo
e
las tres especies:
i
ris setosa
setosa
i
ris versicolor
versicolor
e
iris virginica
virginica.
Para cada flor se mire el anco y
el largo del pétalo y el sépalo, en
í
centrímetros.
La matriz de
datos es
x
Ana Justel - 2011
10
datos es
x
Matriz de datos. Vector de medias y matriz de covarianzas.
Ana Justel - 2011
Resumen numérico de datosResumen numérico de datos multivariantes
multivariantes:
Dispersión y formaDispersión y forma
p
s
s
s
s
s
s
1
12
11
es la varianza muestralde la variable
X
:
jj
p
s
s
s
S
2
22
21
de la variable
X
j
:
n
i
j
ij
j
jj
1
2
2
pp
p
p
s
s
s
2
1
es la covarianza
muestral
jk
contiene las
varianzasvarianzas
en la
es la covarianza
muestral
entre las variables
X
j
y
X
k
:
n
k
ik
j
ij
jk
jk
contiene las
varianzasvarianzas
en la
diagonal y todas las covarianzas
covarianzas
en el resto de los elementos(medidas de asociación lineal
i
k
ik
j
ij
jk
1
(medidas de asociación lineal entre dos variables). S
es siempre una matriz cuadrada y simétrica
p
x
p
Ana Justel - 2011
13
es siempre una matriz cuadrada y simétrica
p
x
p
Resumen numérico de datosResumen numérico de datos multivariantes
multivariantes:
Dispersión y formaDispersión y forma
La covarianza depende de las unidades de medida. Para medir elgrado de asociación lineal entre dos variables
es más habitual
grado de asociación lineal entre dos variables, es más habitualusar el coeficiente de correlación de Pearson y la
1
1
1
12
p
r
r
1
2
21
p
r
r
R
es la correlación muestral
jk
1
2
1
p
p
r
r
es la correlación muestral entre las variables
X
j
y
X
k
:
jk
jk
jk
k
j
j
El
coeficiente
de
correlación
no
depende
de
las
unidades
de
medida
El
coeficiente
de
correlación
no
depende
de
las
unidades
de
medida
Toma valores entre -1 y 1.El signo indica si la relación es positiva o negativa.
Ana Justel - 2011
14
EjemploEjemplo:
: Lirios
Matrices de COVARIANZA y CORRELACIÓN:Matrices de COVARIANZA y CORRELACIÓN:
Ana Justel - 2011
Ejemplo:Ejemplo:
Salida de SPSS para descriptivos
multivariantes
Ejemplo:Ejemplo:
Salida de SPSS para descriptivos
multivariantes
Ana Justel - 2011
Matriz de datos. Vector de medias y matriz de covarianzas. Representación gráfica de datos multivariantes.
Herramientas gráficas
que nos ayudan a estudiar las
Herramientas gráficas
que nos ayudan a estudiar las
relaciones entre variables
(forma, fuerza, etc.), a
identificar grupos
, y
detectar
outliers
Ana Justel - 2011
Resumen gráfico de DATOS UNIVARIANTESResumen gráfico de DATOS UNIVARIANTES
Barras de errorBarras de error
Resumen
gráfico de DATOS UNIVARIANTES
Resumen gráfico de DATOS UNIVARIANTES
Media + 2 desviacionesMedia + 2 desviaciones típicas
típicas
oo
tí i
tí i
n)
n)
MediaMedia
MediaMedia -
2 desviaciones típicas
típicas
oo
n)
2 errores típicos (s/
n)
La desviación típica es muy sensible a los datos atípicosLa desviación típica es muy sensible a los datos atípicos
Siempre es un gráfico simétricoSiempre es un gráfico simétrico
Es una buena herramienta cuando los datos son normalesEs una buena herramienta cuando los datos son normales
Ana Justel - 2011
Es una buena herramienta cuando los datos son normalesEs una buena herramienta cuando los datos son normales