Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estudio de Distribuciones de Frecuencias: Unidimensionales y Bidimensionales - Prof. Loren, Apuntes de Estadística

Conceptos básicos sobre distribuciones unidimensionales y bidimensionales de frecuencias, incluyendo tablas de distribución, medidas de posición y dispersión, y medidas de asimetría y apuntamiento. Se explican conceptos relacionados con frecuencia absoluta, relativa, acumulada y las representaciones gráficas de histogramas, diagramas de barras, diagramas de rectángulos y diagramas de sectores.

Tipo: Apuntes

2012/2013

Subido el 21/03/2013

o_connor
o_connor 🇪🇸

3.7

(49)

38 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 1: Estad´ıstica Descriptiva
1 Introducci´on
Conceptos Generales
Poblaci´on
Muestra
Variables
V. Cuantitativas Discretas
Continuas
V. Cualitativas
2 Distribuciones unidimensionales de frecuencias
Sea X la variable de inter´es, y sean x1, x2,...,xklos distintos valores que toma dicha variable.
Dada una muestra de n datos, definimos:
Frecuencia absoluta:ni, nde veces que se repite cada valor xi.
Frecuencia relativa:fi=ni
n.
Frecuencia absoluta acumulada de xi(una vez ordenados de menor a mayor): es el
umero de datos menores o iguales que xi.Ni=n1+... +ni=
i
P
k=1
nkla frecuencia
absoluta acumulada de xi.
Frecuencia relativa acumulada:Fi=f1+...+fi=
i
P
k=1
fk=Ni
n.
2.1 Tablas de distribuci´on de frecuencias:
Variables cuantitativas con los datos sin agrupar.
Valores variable Fr. abs. Fr. rel. Fr. abs. acum. Fr. rel. acum.
xinifiNiFi
x1n1f1N1F1
.
.
..
.
..
.
..
.
..
.
.
xknkfkNk=n Fk= 1
n1
1
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Estudio de Distribuciones de Frecuencias: Unidimensionales y Bidimensionales - Prof. Loren y más Apuntes en PDF de Estadística solo en Docsity!

TEMA 1: Estad´ıstica Descriptiva

1 Introducci´on

Conceptos Generales

  • Poblaci´on
  • Muestra
  • Variables
    • V. Cuantitativas

Discretas

Continuas

  • V. Cualitativas

2 Distribuciones unidimensionales de frecuencias

Sea X la variable de inter´es, y sean x 1 , x 2 ,... , x k los distintos valores que toma dicha variable.

Dada una muestra de n datos, definimos:

  • Frecuencia absoluta: n i , n

◦ de veces que se repite cada valor x i

  • Frecuencia relativa: f i

n i

n

  • Frecuencia absoluta acumulada de x i (una vez ordenados de menor a mayor): es el

n´umero de datos menores o iguales que x i

. N

i = n 1 +... + n i

i ∑

k=

n k la frecuencia

absoluta acumulada de x i

  • Frecuencia relativa acumulada: F i = f 1 +... + f i

i ∑

k=

f k

Ni

n

2.1 Tablas de distribuci´on de frecuencias:

  • Variables cuantitativas con los datos sin agrupar.

Valores variable Fr. abs. Fr. rel. Fr. abs. acum. Fr. rel. acum.

xi ni fi Ni Fi

x 1 n 1 f 1

N

1

F

1

x k n k f k

N

k = n F k

n 1

  • Variables cualitativas: la tabla es equivalente a la anterior aunque si no hay relaci´on de

orden entre los valores de la variable se eliminan las columnas de frecuencias acumuladas.

  • Variables cuantitativas continuas con datos agrupados en intervalos de clase: [L i− 1

, L

i

Tomamos como representante del intervalo a su punto medio, la marca de clase, x i

L

i− 1

+ L

i

Int. clase Marca clase Fr. abs. Fr. rel. Fr. abs. ac. Fr. rel. ac. amplitud densidad datos

[L

i− 1

, L

i ) x i n i f i

N

i

F

i a i d i = n i /a i

[L

0

, L

1 ) x 1 n 1 f 1

N

1

F

1 a 1 d 1

[Lk− 1 , Lk) xk nk fk Nk Fk ak dk

n 1

3 Representaciones Gr´aficas

Variables cualitativas:

Diagrama de rect´angulos: cada rect´angulo representa cada uno de los valores que toma la

variable y su altura es la frecuencia correspondiente.

Diagramas de sectores: cada sector representa cada uno de los valores que toma la variable

y su ´angulo es proporcional a la frecuencia correspondiente.

¿Subir´a el Celta a primera divisi´on?

(^50) Sí

60

70

80

90

No

NS/NC

0

10

20

30

40

50

60

70

80

90

Sí No NS/NC

Variables cuantitativas discretas:

Diagrama de barras: En el eje de abscisas se sit´uan los diferentes valores de la variable,

construyendo sobre estos unas barras de altura igual a la frecuencia de cada valor.

Nivel educativo

Frecuencia

20

60

100

80

120

140

160

40

180

200

8 12 14 15 16 17 18 19 20 21

4.1.3 Mediana (Me)

Dada una distribuci´on de frecuencias (xi, ni) con valores ordenados de menor a mayor, llamamos

mediana, Me, al valor de la variable que divide la distribuci´on de frecuencias en dos partes

iguales.

C´alculo de la mediana:

  • Datos no agrupados: se busca la primera frecuencia acumulada tal que N i

n

  1. Si N i > n/2, entonces Me = x i
  1. Si N i = n/2, entonces Me =

x i

  • x i+
  • Datos agrupados: el intervalo mediano es el primero verificando N i

N

. La mediana se

calcula con la siguiente f´ormula: Me = L i− 1

N

2

− N

i− 1

n i

a i

= L

i− 1

1

2

− F

i− 1

f i

a i

4.1.4 Cuantil de orden p con 0 < p < 1 (x p

Es aquel valor que deja a lo sumo pN observaciones a su izquierda y (1 − p)N observaciones a

su derecha. Destacamos en particular los cuantiles siguientes:

  1. Cuartiles (Q 1

, Q

2

, Q

3 ): dividen a la distribuci´on el cuatro partes iguales.

  1. Deciles (D 1 , D 2 ,... , D 9 ): dividen a la distribuci´on en diez partes iguales.
  2. Percentiles (P 1

, P

2

,... , P

99 ): dividen a la distribuci´on en cien partes iguales.

C´alculo del cuantil de orden p:

  • Datos no agrupados: se busca la primera frecuencia acumulada tal que N i ≥ p:
  1. Si N i

pN, entonces x p = x i

  1. Si Ni = pN, entonces xp =

x i

  • x i+
  • Datos agrupados: el intervalo del cuantil ser´a el primero verificando N i ≥ pN. El cuantil

se calcula con la siguiente f´ormula: xp = Li− 1 +

pN − N i− 1

n i

ai = Li− 1 +

p − F i− 1

f i

ai.

4.2 Medidas de Dispersi´on

4.2.1 Medidas de Dispersi´on Absolutas

Estas medidas llevan unidades asociadas.

Rango o recorrido: es la diferencia entre el mayor y el menor valor de la muestra: Re =

max

i=1...k

x i − min

i=1...k

x i

Recorrido Intercuart´ılico: es la diferencia existente el tercer cuartil y el primero: R I

Q

3

− Q

1

Varianza: mide la dispersi´on respecto a la media: S

2

n,X

n

k ∑

i=

xi −

X

2

ni =

k ∑

i=

xi −

X

2

fi.

Desviaci´on t´ıpica: raiz cuadrada de la varianza S n,X

S

2

n,X

Propiedades de la varianza y la desviaci´on t´ıpica:

  • NUNCA son negativas S

2

n,X

≥ 0, Sn,X ≥ 0.

• S

2

n,X

n

k ∑

i=

x

2

i

n i

X

2 .

• S

2

n,aX+b

= a

2 S

2

n,X

y por tanto S n,aX+b = aS n,X

4.2.2 Medidas de Dispersi´on relativas

Estas medidas no llevan unidades asociadas, son adimensionales.

Coeficiente de variaci´on de Pearson: es el cociente entre la desviaci´on t´ıpica y la media:

CV =

S

n,X

X

4.2.3 Tipificaci´on

Dada una variable X con media μ, y varianza σ, la nueva variable Z =

X − μ

σ

es su tipificada.

Z es adimensional, tiene media 0 y varianza 1.

4.3 Medidas de Forma

Est´an relacionadas con la representaci´on gr´afica de la distribuci´on. Vamos a estudiar las medidas

de asimetr´ıa y de curtosis (o apuntamiento).

4.3.1 Medidas de asimetr´ıa

Coeficiente de asimetr´ıa de Fisher g 1

n

k ∑

i=

n i (x i

X)

3

S

3

n,X

  • g 1 > 0: asimetr´ıa positiva o por la derecha.
  • g 1 < 0: asimetr´ıa negativa o por la izquierda.
  • g 1 = 0: la distribuci´on es sim´etrica.

5 Distribuciones bidimensionales de frecuencias

5.1 Introducci´on

Una variable bidimensional la denotamos por (X,Y). Se trata de un par ordenado, donde X, Y

son las dos variables.

Los valores vienen expresados por (x i , y j ) con x i ∈ X, y j ∈ Y para todo i = 1,... , k y

j = 1,... , h.

5.2 Tablas de frecuencias

  • Frecuencia absoluta del par (xi, yj ): nij es el n´umero de veces que se presenta conjun-

tamente el par de valores (x i , y j

  • Frecuencia relativa del par (xi, yj ): fij =

n ij

N

. 100fij es el porcentaje de veces que se

presenta conjuntamente el par (xi, yj ).

X/Y y 1

... y j ... y h T otal

x 1 n 11

... n 1 j ... n 1 h n 1.

x i n i 1

... n ij ... n ih n i.

xk nk 1... nkj... nkh nk.

T otal n

. 1 ... n .j ... n .h n

En la ´ultima columna y en la ´ultima fila se escriben los totales por columna y fila res-

pectivamente. n i. es el n´umero total de veces que se ha presentado el valor x i con independencia

de los valores que tome la variable Y. n .j es el n´umero total de veces que se present´o el valor

y j con independencia de los valores que toma X. Son las frecuencias marginales.

Los distintos valores x i pueden aparecer agrupados en intervalos del tipo (L i− 1

, L

i ] y los

valores yj en intervalos (Lj− 1 , Lj ].

5.3 Distribuciones marginales y condicionadas.

5.3.1 Distribuciones marginales

La distribuci´on marginal de una de las variables viene definida por los valores que toma dicha

variable, independientemente de los valores que tome la otra variable.

Las distribuciones marginales de X e Y respectivamente son:

X n i. f i.

x 1 n

f

xk nk. fk.

Y n .j f .j

y 1 n

. 1 f . 1

yh n.h f.h

5.3.2 Distribuciones condicionadas

Se trata de estudiar la distribuci´on de una de las variables cuando la otra toma uno o va-

rios valores. Por ejemplo, podemos calcular la distribuci´on de X condicionada a que Y = y j

(X/Y = y j ), o bien la distribuci´on de Y condicionada a que X = x i (Y /X = x i

X/Y = y j n i /Y = y j

x 1 n 1 j

xk nkj

Y /X = x i n j /X = x i

y 1 n i 1

yh nih

5.3.3 Independencia Estad´ıstica

Dos variables X, Y se dice que son independientes estad´ısticamente si f i/Y =yj = f i. para

cualquier par de valores (xi, yj ). Esta expresi´on es equivalente a: fij = fi. · f.j para todo

par (x i , y j ) ´o n ij

n i. · n .j

n

para todo par (x i , y j

Medidas para estudiar la posible relaci´on lineal entre las variables:

Covarianza: S XY

n

h ∑

i=

k ∑

j=

(x i

X)(y j

Y )n ij

Propiedades:

1. S

XY

0 indica una relaci´on directa, S XY < 0 indica una relaci´on inversa, S XY = 0 indica

una ausencia de relaci´on lineal.

2. S

XY

n

h ∑

i=

k

j=

x i y j n ij

X ·

Y.

3. S

aX+b,cY +d = acS XY

  1. Depende de las unidades de medida y no est´a acotada.

Coeficiente de correlaci´on de Pearson: r XY = r =

S

XY

S

n,X

· S

n,Y

Es una medida adimensional que mide el grado de dependencia lineal entre las dos variables.

Toma valores en el intervalo [− 1 , 1]. Un valor de r cercano o igual a 0 implica poca o ninguna

relaci´on lineal entre X e Y (si r = 0 se dice que ambas variables est´an incorreladas), mientras

que cuanto m´as se acerque a 1 o a -1, m´as fuerte ser´a la relaci´on lineal entre X e Y , directa o

inversa respectivamente.