Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Diapositivas, Diapositivas de Biología

Asignatura: analisis, Profesor: Desconocido Desconocido, Carrera: Biología, Universidad: UAH

Tipo: Diapositivas

2014/2015

Subido el 23/06/2015

usuario desconocido
usuario desconocido 🇪🇸

1 / 48

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 1:TEMA 1:
TEMA 1:TEMA 1:
ANALISIS EXPLORATORIO DE ANALISIS EXPLORATORIO DE
DATOS MULTIVARIANTESDATOS MULTIVARIANTES
Resúmenes numéricosResúmenes numéricos
DATOS MULTIVARIANTESDATOS MULTIVARIANTES
Resúmenes numéricosResúmenes numéricos
Gráficos Gráficos multivariantesmultivariantes
Distancias estadísticasDistancias estadísticas
Distancias estadísticasDistancias estadísticas
OutliersOutliers multivariantesmultivariantes
Ana Justel - 2011 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30

Vista previa parcial del texto

¡Descarga Diapositivas y más Diapositivas en PDF de Biología solo en Docsity!

TEMA 1:TEMA 1:TEMA 1:TEMA 1:

ANALISIS EXPLORATORIO DEANALISIS EXPLORATORIO DE

DATOS MULTIVARIANTESDATOS MULTIVARIANTES

Resúmenes numéricosResúmenes numéricos

DATOS MULTIVARIANTESDATOS MULTIVARIANTES

Resúmenes numéricosResúmenes numéricos

GráficosGráficos multivariantes

multivariantes

Distancias estadísticasDistancias estadísticasDistancias estadísticasDistancias estadísticas

OutliersOutliers multivariantes

multivariantes

Ana Justel - 2011

AnálisisAnálisis exploratorio de datos

exploratorio de datos multivariantes

multivariantes

Matriz de datos. Vector de medias y matriz de covarianzas. Representación gráfica de datos multivariantes. Distancias estadísticasDistancias estadísticas Datos atípicos multivariantes.

Ana Justel - 2011

Resúmenes núméricos de los datosResúmenes núméricos de los datos

Para datos categóricos o discretos:Para datos categóricos o discretos:

Resúmenes núméricos de los datosResúmenes núméricos de los datos

Para datos categóricos o discretos:Para datos categóricos o discretos:

Tabla de frecuencias

Para datos cuantitativosPara datos cuantitativos:

Medidas de posición

media, mediana, moda, media recortada

ó

í

Medidas de dispersión

varianza, desviación típica, rango,rango intercuartílico, MEDA

Medidas de forma

Coeficiente de asimetríaCoeficiente de curtosis o apuntamiento

Medidas de asociación

Coeficiente de correlación de Pearson

Ana Justel - 2011

Resumenes gráficos de los datos.Resumenes gráficos de los datos.

Para datosPara datos univariantes

univariantes:

Resumenes gráficos de los datos.Resumenes gráficos de los datos.

0

50 250200150100

Diagrama de barrasDiagrama de sectoresMapas estadísticos

Greatly Datos categóricos o discretos

A lot

Something

Little

Nothing

p

Serie temporalHistograma

120,

130,

g

Gráficos probabilísticosBarras de errorBox-plot

Datos cuantitativos

80,00 60,00 40, 100,

1351,35 538,46 363 64

Di

d

b

últi

l

Box

plot

Para datosPara datos multivariantes

multivariantes:

Datos categóricos o discretos

clorofila

20,00 0,

363,64126,67110,

Casos ponderados por nºcelulas

Di

agrama de barras múltiple

Box-plot múltiple

Datos categóricos o discretos

Diagrama de dispersiónMatriz de diagramas de dispersiónGráficos de estrellas y caras

Datos cuantitativos

Ana Justel - 2011

y

Cuestiones importantes sobre la organización de los datos:Cuestiones importantes sobre la organización de los datos:

El formato debe ser compatible con los requerimientos del

p

g

p

g

El formato debe ser compatible con los requerimientos del software que se vaya a usar para el análisis.

EXCEL admite casi cualquier organización posible

El problema

EXCEL admite casi cualquier organización posible. El problemaestá en cómo analizamos los datos con EXCEL! El “Editor de Datos del SPSS” almacena los datos en unaEl

Editor de Datos del SPSS

almacena los datos en una

matriz que siempre tiene las variables en las columnas. Cadafila contiene la información completa disponible sobre unindividuoindividuo.

Cuando hay datos faltantes (“missing data”):

Se interpola el valor faltante. Se elimina la variable para todos los individuos. Se excluye del análisis al individuo.

Ana Justel - 2011

Ejemplo:Ejemplo: Medidas de cráneos de cocodrilos

(alligator.txt)

Valores de 11 medidas físicas en un ejemplar de cada especie:

La matriz de datos es

x

Medida de la variable 6 en

el crocodrilo 3

Ana Justel - 2011

Ejemplo:Ejemplo: Lirios (iris.txt)

En 1936, el biólogo y estadístico Sir R.A. Fisher, recopila los datosde 150 lirios para cuantificar la variación geografica de estas flores

l

P

í

l

d

G

é

C

d

en la Península de Gaspé, Canada.La muestra contiene 50 lirios de cada una delas t es especies

i is

setosasetosa

i is

e sicoloe sicolo

e

las tres especies:

i

ris setosa

setosa

i

ris versicolor

versicolor

e

iris virginica

virginica.

Para cada flor se mire el anco y

el largo del pétalo y el sépalo, en

í

centrímetros.

La matriz de

datos es

x

Ana Justel - 2011

10

datos es

x

AnálisisAnálisis exploratorio de datos

exploratorio de datos multivariantes

multivariantes

Matriz de datos. Vector de medias y matriz de covarianzas.

Ana Justel - 2011

Resumen numérico de datosResumen numérico de datos multivariantes

multivariantes:

Dispersión y formaDispersión y forma

MATRIZ DE COVARIANZAS:MATRIZ DE COVARIANZAS:

  

  

p

s

s

s

s

s

s

 

1

12

11

es la varianza muestralde la variable

X

:

jj

s

   

   

p

s

s

s

S

2

22

21

de la variable

X

j

:

n

i

j

ij

j

jj

x

x

n

s

s

1

2

2

  

  

pp

p

p

s

s

s

2

1

es la covarianza

muestral

jk

s

S

contiene las

varianzasvarianzas

en la

es la covarianza

muestral

entre las variables

X

j

y

X

k

:

n

k

ik

j

ij

jk

x

x

x

x

s

jk

S

contiene las

varianzasvarianzas

en la

diagonal y todas las covarianzas

covarianzas

en el resto de los elementos(medidas de asociación lineal

i

k

ik

j

ij

jk

n

1

(medidas de asociación lineal entre dos variables). S

es siempre una matriz cuadrada y simétrica

p

x

p

Ana Justel - 2011

13

S

es siempre una matriz cuadrada y simétrica

p

x

p

Resumen numérico de datosResumen numérico de datos multivariantes

multivariantes:

Dispersión y formaDispersión y forma

La covarianza depende de las unidades de medida. Para medir elgrado de asociación lineal entre dos variables

es más habitual

grado de asociación lineal entre dos variables, es más habitualusar el coeficiente de correlación de Pearson y la

MATRIZ DE
CORRELACIONES

R

  

  

1

1

1

12

p

r

r

   

   

1

2

21

p

r

r

R

es la correlación muestral

jk

r

  

  

1

2

1

p

p

r

r

es la correlación muestral entre las variables

X

j

y

X

k

:

jk

jk

s

r

jk

k

j

j

s

s

El

coeficiente

de

correlación

no

depende

de

las

unidades

de

medida

El

coeficiente

de

correlación

no

depende

de

las

unidades

de

medida

Toma valores entre -1 y 1.El signo indica si la relación es positiva o negativa.

Ana Justel - 2011

14

EjemploEjemplo:

: Lirios

ÓÓ

Matrices de COVARIANZA y CORRELACIÓN:Matrices de COVARIANZA y CORRELACIÓN:

Ana Justel - 2011

Ejemplo:Ejemplo:

Salida de SPSS para descriptivos

multivariantes

Ejemplo:Ejemplo:

Salida de SPSS para descriptivos

multivariantes

Ana Justel - 2011

AnálisisAnálisis exploratorio de datos

exploratorio de datos multivariantes

multivariantes

Matriz de datos. Vector de medias y matriz de covarianzas. Representación gráfica de datos multivariantes.

Herramientas gráficas

que nos ayudan a estudiar las

Herramientas gráficas

que nos ayudan a estudiar las

relaciones entre variables

(forma, fuerza, etc.), a

identificar grupos

, y

detectar

outliers

Ana Justel - 2011

Resumen gráfico de DATOS UNIVARIANTESResumen gráfico de DATOS UNIVARIANTES

Barras de errorBarras de error

Resumen

gráfico de DATOS UNIVARIANTES

Resumen gráfico de DATOS UNIVARIANTES

Media + 2 desviacionesMedia + 2 desviaciones típicas

típicas

oo

  • 2

tí i

tí i

  • 2 errores típicos (s/

n)

  • 2 errores típicos (s/

n)

MediaMedia

95% de los datos95% de los datos

MediaMedia -

  • 2 desviaciones

2 desviaciones típicas

típicas

oo

    • 2 errores típicos (s/

n)

2 errores típicos (s/

n)

La desviación típica es muy sensible a los datos atípicosLa desviación típica es muy sensible a los datos atípicos

Siempre es un gráfico simétricoSiempre es un gráfico simétrico

Es una buena herramienta cuando los datos son normalesEs una buena herramienta cuando los datos son normales

Ana Justel - 2011

Es una buena herramienta cuando los datos son normalesEs una buena herramienta cuando los datos son normales