






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos sobre distribuciones unidimensionales y bidimensionales de frecuencias, incluyendo definiciones de frecuencia absoluta, relativa, acumulada y tablas de distribución. Se explican representaciones gráficas como diagramas de rectángulos, sectores y histogramas, y se introducen medidas de dispersión absolutas y relativas. Además, se abordan medidas de asimetría y apuntamiento (g1 y g2). Finalmente, se introduce el estudio de distribuciones bidimensionales.
Tipo: Apuntes
1 / 10
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







Conceptos Generales
Discretas
Continuas
Sea X la variable de inter´es, y sean x 1 , x 2 ,... , x k los distintos valores que toma dicha variable.
Dada una muestra de n datos, definimos:
◦ de veces que se repite cada valor x i
n i
n
. N´otese que 100f i es el porcentaje de veces que aparece x i
en la muestra.
n´umero de datos menores o iguales que x i
i = n 1 +... + n i
i ∑
k=
n k la frecuencia absoluta
acumulada de x i
i ∑
k=
fk =
i
n
Valores variable Fr. abs. Fr. rel. Fr. abs. acum. Fr. rel. acum.
x i n i f i
i
i
x 1 n 1 f 1
1
1
x k n k f k
k = n F k
n 1
orden entre los valores de la variable se eliminan las columnas de frecuencias acumuladas.
i
Tomamos como representante del intervalo a su punto medio, la marca de clase, x i
i− 1
i
. La densidad de datos d i de cada clase es el n´umero de datos por unidad de
amplitud.
Int. clase Marca clase Fr. abs. Fr. rel. Fr. abs. ac. Fr. rel. ac. amplitud densidad datos
i− 1
i ) x i n i f i
i
i a i d i = n i /a i
0
1 ) x 1 n 1 f 1
1
1 a 1 d 1
k− 1
k ) x k n k f k
k
k a k d k
n 1
3 Representaciones Gr´aficas
Variables cualitativas:
Diagrama de rect´angulos: cada rect´angulo representa cada uno de los valores que toma la
variable y su altura es la frecuencia correspondiente.
Diagramas de sectores: cada sector representa cada uno de los valores que toma la variable y
su ´angulo es proporcional a la frecuencia correspondiente.
¿Acabar´a el R.C.Celta en puestos de Europa?
SÍ
85%
NO
10%
NS/NC
5%
85%
10%
5%
SÍ NO NS/NC
Variables cuantitativas discretas:
Diagrama de barras: En el eje de abscisas se sit´uan los diferentes valores de la variable,
construyendo sobre estos unas barras de altura igual a la frecuencia de cada valor.
Tambi´en se puede usar el diagrama de sectores cuando la variable no tome muchos valores
diferentes.
w
=
x 1 w 1
w 1 + w 2 +... + wk
1
1
2
2
L
L
1
2
L
4.1.2 Moda (Mo)
Es el valor de la variable que m´as veces se repite, el m´as frecuente. C´alculo de la moda:
Mo = Li− 1 +
d i+
d i+
ai.
4.1.3 Mediana (Me)
Dada una distribuci´on de frecuencias (x i , n i ) con valores ordenados de menor a mayor, llamamos
mediana, Me, al valor de la variable que divide la distribuci´on de frecuencias en dos partes iguales.
C´alculo de la mediana:
n
x i
n
. La mediana se
calcula con la siguiente f´ormula: Me = L i− 1
n
2
i− 1
n i
a i
i− 1
1
2
i− 1
f i
a i
4.1.4 Cuantil de orden p con 0 < p < 1 (x p
Es aquel valor que deja a lo sumo pn observaciones a su izquierda y (1 − p)n observaciones a su
derecha. Destacamos en particular los cuantiles siguientes:
2
3 ): dividen a la distribuci´on el cuatro partes iguales.
2
9 ): dividen a la distribuci´on en diez partes iguales.
2
99 ): dividen a la distribuci´on en cien partes iguales.
C´alculo del cuantil de orden p:
pn, entonces x p = x i
x i
calcula con la siguiente f´ormula: x p
i− 1
pn − N i− 1
n i
a i
i− 1
p − F i− 1
f i
a i
4.2.1 Medidas de Dispersi´on Absolutas
Estas medidas llevan unidades asociadas.
Rango o recorrido: es la diferencia entre el mayor y el menor valor de la muestra: Re =
max
i=1...k
x i − min
i=1...k
x i
Recorrido Intercuart´ılico: es la diferencia existente el tercer cuartil y el primero: R I
Varianza: mide la dispersi´on respecto a la media: S
2
n,X
n
k ∑
i=
x i
2
n i
k ∑
i=
x i
2
f i
Desviaci´on t´ıpica: raiz cuadrada de la varianza S n,X
2
n,X
Propiedades de la varianza y la desviaci´on t´ıpica:
2
n,X
n,X
2
n,X
n
k ∑
i=
x
2
i
ni − X
2
.
2
n,aX+b
= a
2 S
2
n,X
y por tanto S n,aX+b = aS n,X
4.2.2 Medidas de Dispersi´on relativas
Estas medidas no llevan unidades asociadas, son adimensionales.
Coeficiente de variaci´on de Pearson: es el cociente entre la desviaci´on t´ıpica y la media:
n,X
4.2.3 Gr´afico de caja o Box-plot
o *
Mediana Q 1
Q 3
Límite
interior
Límite
Exterior
Rango Intercuantílico
Valor mínimo dentro
de los límites
Posible dato
Dato atípico atípico
Q 1
-3RI Q 1
-1.5RI Q 3
+1.5RI (^) Q 3
+3RI
Límite
Exterior
Límite
interior
Valor máximo dentro de
los límites
4.2.4 Tipificaci´on
Dada una variable X con media μ, y varianza σ
2 , la nueva variable Z =
X − μ
σ
es su tipificada.
Z es adimensional, tiene media 0 y varianza 1.
-6,00 -4,00 -2,00 0,00 2,00 4,00 6,
0,
0,
0,
0,
0,
g 2 >
g 2 =
g 2 <
5 Distribuciones bidimensionales de frecuencias
Una variable bidimensional la denotamos por (X,Y). Se trata de un par ordenado, donde X, Y
son las dos variables.
Los valores vienen expresados por (x i , y j ) con x i ∈ X, y j ∈ Y para todo i = 1,... , k y
j = 1,... , h.
tamente el par de valores (xi, yj ).
n ij
. 100 f ij es el porcentaje de veces que se
presenta conjuntamente el par (x i , y j
X/Y y 1
... y j ... y h T otal
x 1 n 11
... n 1 j ... n 1 h n 1.
xi ni 1... nij... nih ni.
x k n k 1
... n kj ... n kh n k.
T otal n
. 1 ... n .j ... n .h n
En la ´ultima columna y en la ´ultima fila se escriben los totales por columna y fila res-
pectivamente. Se denominan frecuencias marginales: n i. es el n´umero total de veces que se ha
presentado el valor x i con independencia de los valores que tome la variable Y , y n .j es el n´umero
total de veces que se present´o el valor y j con independencia de los valores que toma X.
Los distintos valores xi pueden aparecer agrupados en intervalos del tipo (Li− 1 , Li] y los valores
y j en intervalos (L j− 1
j
Diagrama de barras. Para variables cualitativas o cuantitativas sin agrupar.
ojosclaros
ojososcuros
0
10
20
30
40
peloclaro pelooscuro
Diagrama de dispersion. Para variables cuantitativas sin agrupar. Este gr´afico nos puede
se˜nalar alg´un tipo de relaci´on funcional entre las variables.
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70
Gr´aficos de resumen de una de las variables en funci´on de la otra. Se resume una
variable cuantitativa (calculando su media, suma, mediana, etc.) en funci´on de otra variable
cualitativa o cuantitativa discreta que tome pocos valores.
5,
9
7,
2,
0
1
2
3
4
5
6
7
8
9
10
Aprobado MatrículadeHonra Notable Suspenso
aX+b,cY +d = acS XY
Coeficiente de correlaci´on de Pearson: r XY = r =
XY
Sn,X · Sn,Y
Es una medida adimensional que mide el grado de dependencia lineal entre las dos variables.
Toma valores en el intervalo [− 1 , 1]. Un valor de r cercano o igual a 0 implica poca o ninguna
relaci´on lineal entre X e Y (si r = 0 se dice que ambas variables est´an incorreladas), mientras que
cuanto m´as se acerque a 1 o a -1, m´as fuerte ser´a la relaci´on lineal entre X e Y , directa o inversa
respectivamente.
r XY
0: Y aumenta cuando aumenta X r XY < 0: Y disminuye cuando aumenta X
rXY = 1: relaci´on positiva perfecta rXY = −1: relaci´on negativa perfecta
r XY cercano a 0: poca o ninguna relaci´on r XY cercano a 0: poca o ninguna relaci´on lineal
lineal entre X e Y entre X e Y , pero clara relaci´on cuadr´atica