Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estudio de Distribuciones de Frecuencias: Unidimensionales y Bidimensionales - Prof. Loren, Apuntes de Estadística

Conceptos básicos sobre distribuciones unidimensionales y bidimensionales de frecuencias, incluyendo definiciones de frecuencia absoluta, relativa, acumulada y tablas de distribución. Se explican representaciones gráficas como diagramas de rectángulos, sectores y histogramas, y se introducen medidas de dispersión absolutas y relativas. Además, se abordan medidas de asimetría y apuntamiento (g1 y g2). Finalmente, se introduce el estudio de distribuciones bidimensionales.

Tipo: Apuntes

2015/2016

Subido el 23/05/2016

clarita95
clarita95 🇪🇸

4

(21)

28 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 1: Estad´ıstica Descriptiva
1 Introducci´on
Conceptos Generales
Poblaci´on
Muestra
Variables
V. Cuantitativas Discretas
Continuas
V. Cualitativas
2 Distribuciones unidimensionales de frecuencias
Sea X la variable de inter´es, y sean x1, x2,...,xklos distintos valores que toma dicha variable.
Dada una muestra de n datos, definimos:
Frecuencia absoluta:ni, nde veces que se repite cada valor xi.
Frecuencia relativa:fi=ni
n. otese que 100fies el porcentaje de veces que aparece xi
en la muestra.
Frecuencia absoluta acumulada de xi(una vez ordenados de menor a mayor): es el
umero de datos menores o iguales que xi.Ni=n1+...+ni=
i
P
k=1
nkla frecuencia absoluta
acumulada de xi.
Frecuencia relativa acumulada:Fi=f1+...+fi=
i
P
k=1
fk=Ni
n.
2.1 Tablas de distribuci´on de frecuencias:
Variables cuantitativas con los datos sin agrupar.
Valores variable Fr. abs. Fr. rel. Fr. abs. acum. Fr. rel. acum.
xinifiNiFi
x1n1f1N1F1
.
.
..
.
..
.
..
.
..
.
.
xknkfkNk=n Fk= 1
n1
1
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Estudio de Distribuciones de Frecuencias: Unidimensionales y Bidimensionales - Prof. Loren y más Apuntes en PDF de Estadística solo en Docsity!

TEMA 1: Estad´ıstica Descriptiva

1 Introducci´on

Conceptos Generales

  • Poblaci´on
  • Muestra
  • Variables
    • V. Cuantitativas

Discretas

Continuas

  • V. Cualitativas

2 Distribuciones unidimensionales de frecuencias

Sea X la variable de inter´es, y sean x 1 , x 2 ,... , x k los distintos valores que toma dicha variable.

Dada una muestra de n datos, definimos:

  • Frecuencia absoluta: n i , n

◦ de veces que se repite cada valor x i

  • Frecuencia relativa: f i

n i

n

. N´otese que 100f i es el porcentaje de veces que aparece x i

en la muestra.

  • Frecuencia absoluta acumulada de x i (una vez ordenados de menor a mayor): es el

n´umero de datos menores o iguales que x i

. N

i = n 1 +... + n i

i ∑

k=

n k la frecuencia absoluta

acumulada de x i

  • Frecuencia relativa acumulada: Fi = f 1 +... + fi =

i ∑

k=

fk =

N

i

n

2.1 Tablas de distribuci´on de frecuencias:

  • Variables cuantitativas con los datos sin agrupar.

Valores variable Fr. abs. Fr. rel. Fr. abs. acum. Fr. rel. acum.

x i n i f i

N

i

F

i

x 1 n 1 f 1

N

1

F

1

x k n k f k

N

k = n F k

n 1

  • Variables cualitativas: la tabla es equivalente a la anterior aunque si no hay relaci´on de

orden entre los valores de la variable se eliminan las columnas de frecuencias acumuladas.

  • Variables cuantitativas continuas con datos agrupados en intervalos de clase: [L i− 1

, L

i

Tomamos como representante del intervalo a su punto medio, la marca de clase, x i

L

i− 1

+ L

i

. La densidad de datos d i de cada clase es el n´umero de datos por unidad de

amplitud.

Int. clase Marca clase Fr. abs. Fr. rel. Fr. abs. ac. Fr. rel. ac. amplitud densidad datos

[L

i− 1

, L

i ) x i n i f i

N

i

F

i a i d i = n i /a i

[L

0

, L

1 ) x 1 n 1 f 1

N

1

F

1 a 1 d 1

[L

k− 1

, L

k ) x k n k f k

N

k

F

k a k d k

n 1

3 Representaciones Gr´aficas

Variables cualitativas:

Diagrama de rect´angulos: cada rect´angulo representa cada uno de los valores que toma la

variable y su altura es la frecuencia correspondiente.

Diagramas de sectores: cada sector representa cada uno de los valores que toma la variable y

su ´angulo es proporcional a la frecuencia correspondiente.

¿Acabar´a el R.C.Celta en puestos de Europa?

85%

NO

10%

NS/NC

5%

85%

10%

5%

SÍ NO NS/NC

Variables cuantitativas discretas:

Diagrama de barras: En el eje de abscisas se sit´uan los diferentes valores de la variable,

construyendo sobre estos unas barras de altura igual a la frecuencia de cada valor.

Tambi´en se puede usar el diagrama de sectores cuando la variable no tome muchos valores

diferentes.

  1. Si la distribuci´on de frecuencias es sim´etrica respecto a un valor c, entonces X = c.
  2. Media ponderada: X

w

=

x 1 w 1

  • x 2 w 2 +... + x k w k

w 1 + w 2 +... + wk

  1. Media en subpoblaciones: X =

X

1

N

1

+ X

2

N

2

+... + X

L

N

L

N

1

+ N

2

+... + N

L

4.1.2 Moda (Mo)

Es el valor de la variable que m´as veces se repite, el m´as frecuente. C´alculo de la moda:

  • Datos no agrupados: valor de la variable de mayor frecuencia absoluta o relativa.
  • Datos agrupados: se busca en el intervalo modal, el de mayor densidad de datos.

Mo = Li− 1 +

d i+

d i+

  • d i− 1

ai.

4.1.3 Mediana (Me)

Dada una distribuci´on de frecuencias (x i , n i ) con valores ordenados de menor a mayor, llamamos

mediana, Me, al valor de la variable que divide la distribuci´on de frecuencias en dos partes iguales.

C´alculo de la mediana:

  • Datos no agrupados: se busca la primera frecuencia acumulada tal que N i

n

  1. Si Ni > n/2, entonces Me = xi.
  2. Si N i = n/2, entonces Me =

x i

  • x i+
  • Datos agrupados: el intervalo mediano es el primero verificando N i

n

. La mediana se

calcula con la siguiente f´ormula: Me = L i− 1

n

2

− N

i− 1

n i

a i

= L

i− 1

1

2

− F

i− 1

f i

a i

4.1.4 Cuantil de orden p con 0 < p < 1 (x p

Es aquel valor que deja a lo sumo pn observaciones a su izquierda y (1 − p)n observaciones a su

derecha. Destacamos en particular los cuantiles siguientes:

  1. Cuartiles (Q 1

, Q

2

, Q

3 ): dividen a la distribuci´on el cuatro partes iguales.

  1. Deciles (D 1

, D

2

,... , D

9 ): dividen a la distribuci´on en diez partes iguales.

  1. Percentiles (P 1

, P

2

,... , P

99 ): dividen a la distribuci´on en cien partes iguales.

C´alculo del cuantil de orden p:

  • Datos no agrupados: se busca la primera frecuencia acumulada tal que N i ≥ pn:
  1. Si N i

pn, entonces x p = x i

  1. Si N i = pn, entonces x p

x i

  • x i+
  • Datos agrupados: el intervalo del cuantil ser´a el primero verificando N i ≥ pn. El cuantil se

calcula con la siguiente f´ormula: x p

= L

i− 1

pn − N i− 1

n i

a i

= L

i− 1

p − F i− 1

f i

a i

4.2 Medidas de Dispersi´on

4.2.1 Medidas de Dispersi´on Absolutas

Estas medidas llevan unidades asociadas.

Rango o recorrido: es la diferencia entre el mayor y el menor valor de la muestra: Re =

max

i=1...k

x i − min

i=1...k

x i

Recorrido Intercuart´ılico: es la diferencia existente el tercer cuartil y el primero: R I

Q 3 − Q 1.

Varianza: mide la dispersi´on respecto a la media: S

2

n,X

n

k ∑

i=

x i

− X

2

n i

k ∑

i=

x i

− X

2

f i

Desviaci´on t´ıpica: raiz cuadrada de la varianza S n,X

S

2

n,X

Propiedades de la varianza y la desviaci´on t´ıpica:

  • NUNCA son negativas S

2

n,X

≥ 0, S

n,X

• S

2

n,X

n

k ∑

i=

x

2

i

ni − X

2

.

• S

2

n,aX+b

= a

2 S

2

n,X

y por tanto S n,aX+b = aS n,X

4.2.2 Medidas de Dispersi´on relativas

Estas medidas no llevan unidades asociadas, son adimensionales.

Coeficiente de variaci´on de Pearson: es el cociente entre la desviaci´on t´ıpica y la media:

CV =

S

n,X

X

4.2.3 Gr´afico de caja o Box-plot

o *

Mediana Q 1

Q 3

Límite

interior

Límite

Exterior

Rango Intercuantílico

Valor mínimo dentro

de los límites

Posible dato

Dato atípico atípico

Q 1

-3RI Q 1

-1.5RI Q 3

+1.5RI (^) Q 3

+3RI

Límite

Exterior

Límite

interior

Valor máximo dentro de

los límites

4.2.4 Tipificaci´on

Dada una variable X con media μ, y varianza σ

2 , la nueva variable Z =

X − μ

σ

es su tipificada.

Z es adimensional, tiene media 0 y varianza 1.

-6,00 -4,00 -2,00 0,00 2,00 4,00 6,

0,

0,

0,

0,

0,

g 2 >

g 2 =

g 2 <

5 Distribuciones bidimensionales de frecuencias

5.1 Introducci´on

Una variable bidimensional la denotamos por (X,Y). Se trata de un par ordenado, donde X, Y

son las dos variables.

Los valores vienen expresados por (x i , y j ) con x i ∈ X, y j ∈ Y para todo i = 1,... , k y

j = 1,... , h.

5.2 Tablas de frecuencias

  • Frecuencia absoluta del par (x i , y j ): n ij es el n´umero de veces que se presenta conjun-

tamente el par de valores (xi, yj ).

  • Frecuencia relativa del par (x i , y j ): f ij

n ij

N

. 100 f ij es el porcentaje de veces que se

presenta conjuntamente el par (x i , y j

X/Y y 1

... y j ... y h T otal

x 1 n 11

... n 1 j ... n 1 h n 1.

xi ni 1... nij... nih ni.

x k n k 1

... n kj ... n kh n k.

T otal n

. 1 ... n .j ... n .h n

En la ´ultima columna y en la ´ultima fila se escriben los totales por columna y fila res-

pectivamente. Se denominan frecuencias marginales: n i. es el n´umero total de veces que se ha

presentado el valor x i con independencia de los valores que tome la variable Y , y n .j es el n´umero

total de veces que se present´o el valor y j con independencia de los valores que toma X.

Los distintos valores xi pueden aparecer agrupados en intervalos del tipo (Li− 1 , Li] y los valores

y j en intervalos (L j− 1

, L

j

].

5.3 Representaciones gr´aficas

Diagrama de barras. Para variables cualitativas o cuantitativas sin agrupar.

ojosclaros

ojososcuros

0

10

20

30

40

peloclaro pelooscuro

 

Diagrama de dispersion. Para variables cuantitativas sin agrupar. Este gr´afico nos puede

se˜nalar alg´un tipo de relaci´on funcional entre las variables.

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70

Gr´aficos de resumen de una de las variables en funci´on de la otra. Se resume una

variable cuantitativa (calculando su media, suma, mediana, etc.) en funci´on de otra variable

cualitativa o cuantitativa discreta que tome pocos valores.

5,

9

7,

2,

0

1

2

3

4

5

6

7

8

9

10

Aprobado MatrículadeHonra Notable Suspenso

 

3. S

aX+b,cY +d = acS XY

  1. Depende de las unidades de medida y no est´a acotada.

Coeficiente de correlaci´on de Pearson: r XY = r =

S

XY

Sn,X · Sn,Y

Es una medida adimensional que mide el grado de dependencia lineal entre las dos variables.

Toma valores en el intervalo [− 1 , 1]. Un valor de r cercano o igual a 0 implica poca o ninguna

relaci´on lineal entre X e Y (si r = 0 se dice que ambas variables est´an incorreladas), mientras que

cuanto m´as se acerque a 1 o a -1, m´as fuerte ser´a la relaci´on lineal entre X e Y , directa o inversa

respectivamente.

r XY

0: Y aumenta cuando aumenta X r XY < 0: Y disminuye cuando aumenta X

rXY = 1: relaci´on positiva perfecta rXY = −1: relaci´on negativa perfecta

r XY cercano a 0: poca o ninguna relaci´on r XY cercano a 0: poca o ninguna relaci´on lineal

lineal entre X e Y entre X e Y , pero clara relaci´on cuadr´atica