Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Parámetros y Estadísticos: Parámetros y Estadísticos Básicos, Apuntes de Estadística

Una introducción a los parámetros y estadísticos, conceptos clave en estadística descriptiva. Aprenda sobre parámetros y estadísticos de posición, centralización, dispersión y forma, y cómo se utilizan en la determinación de cuartiles, percentiles y medidas de centralización y dispersión. Además, se incluyen ejemplos prácticos para mejorar su comprensión.

Tipo: Apuntes

2019/2020

Subido el 24/08/2020

juan-carlos-noriega-hernandez
juan-carlos-noriega-hernandez 🇨🇴

2 documentos

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
Parámetros y estadísticos
«Parámetro»: Es una cantidad numérica calculada sobre una
población y resume los valores que esta toma en algún atributo
Intenta resumir toda la información que hay en la población en unos pocos
números (parámetros). La altura media de los sujetos
Si un estadístico se usa para aproximar un parámetro también se le suele
llamar «estimador»
«Estadístico»: Es una cantidad numérica calculada sobre una
muestra que resume su información sobre algún aspecto
Normalmente nos interesa conocer un parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población, calculamos un estimador sobre
una muestra y “confiamos” en que sean próximos.
Tipos de estadísticos
«Posición»
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...
«Centralización»
Indican valores con respecto a los que los datos parecen agruparse.
Entre ellos cabe destacar: Media, mediana y moda
«Dispersión»
Indican la mayor o menor concentración de los datos con respecto a
las medidas de centralización.
Entre ellos : Desviación típica, coeficiente de variación, rango, varianza
«Forma»
Dan una idea de cómo se distribuyen los datos
Entre ellos: Asimetría, Apuntamiento o curtosis
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Parámetros y Estadísticos: Parámetros y Estadísticos Básicos y más Apuntes en PDF de Estadística solo en Docsity!

Parámetros y estadísticos

«Parámetro»: Es una cantidad numérica calculada sobre una

población y resume los valores que esta toma en algún atributo

Intenta resumir toda la información que hay en la población en unos pocos números (parámetros). La altura media de los sujetos

Si un estadístico se usa para aproximar un parámetro también se le suele llamar «estimador»

«Estadístico»: Es una cantidad numérica calculada sobre una

muestra que resume su información sobre algún aspecto

Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a TODA la población, calculamos un estimador sobre una muestra y “confiamos” en que sean próximos.

Tipos de estadísticos

«Posición»

Dividen un conjunto ordenado de datos en grupos con la misma

cantidad de individuos.

Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...

«Centralización»

Indican valores con respecto a los que los datos parecen agruparse.

Entre ellos cabe destacar: Media, mediana y moda

«Dispersión»

Indican la mayor o menor concentración de los datos con respecto a

las medidas de centralización.

Entre ellos : Desviación típica, coeficiente de variación, rango, varianza

«Forma»

Dan una idea de cómo se distribuyen los datos

Entre ellos: Asimetría, Apuntamiento o curtosis

Estadísticos de posición

Se define el «cuantil» de orden a como un valor de la variable por

debajo del cual se encuentra una frecuencia acumulada a.

Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Estadísticos PESO 60, 70, 80,

25 50 75

Percentiles

100 90 80 70 60 50 40

¿Qué peso no llega a alcanzar el 25%

de los individuos?

Primer cuartil = Percentil 25= 60 Kg

¿Qué peso es superado por el 25% de

los individuos?

Tercer cuartil = Percentil 75 = 80 Kg

¿Entre qué valores se encuentra el

50% de los individuos con un peso

“más normal”?

Entre el primer y tercer cuartil = entre 60 y 80 kg. Este intervalo coincide con los individuos que ocupan la “parte central” de la muestra. Los diagramas de caja sintetizan esta información.

Número de años de escolarización

5 ,3 , 5 ,3 , 6 ,4 1, 12 ,8 1, 25 1,7 3, 68 4,5 8, 56 3,7 11, 73 4,8 16, 85 5,6 22, 461 30,6 52, 130 8,6 61, 175 11,6 73, 73 4,8 77, 194 12,9 90, 43 2,9 93, 45 3,0 96, 22 1,5 98, 30 2,0 100, 1508 100,

3 4 5 6 7 8 9

10 11 12 13 14 15 16 17 18 19 20 Total

Frecuencia Porcentaje

Porcentaje acumulado

Estadísticos Número de años de escolarización 1508 0 12, 12,00 12 9, 11, 12, 12, 12, 12, 13, 14,0015, 16, 16,

N VálidosPerdidos Media Mediana Moda 10 20 25 30 (^4050) 60 70 75 80 90

Percentiles

≥20%?

≥ 90%?

Ejemplos

Medidas de centralización

«Media » (‘Mean’) Es la media aritmética (promedio) de los valores

de una variable. Suma de los valores dividido por el tamaño

muestral.

La media es un promedio aritmético: de 2,2,3,7 es (2+2+3+7)/4=3, Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos. Se puede considerar como el centro de gravedad de los datos

«Mediana » (‘median’) Es un valor que divide a las observaciones

en dos grupos con el mismo número de individuos (percentil 50). Si

el número de datos es par, se elige la media de los dos datos

centrales.

Mediana de 1,2,4,5,6,6,8 es 5 Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!

«Moda » (‘mode’) Es el/los valor/es donde la distribución de

frecuencia alcanza su máximo.

Las formulas

«Media » (Para datos sin agrupar: x 1 , x2 , ..., xn )

n

x

x i^ i

«Media » (Para agrupados u organizados en tablas)

xk

x 2

x 1

n

Lk-1 – Lk nk Nk

...

L 1 – L 2 n 2 N 2

L 0 – L 1 n 1 N 1

Variable fr. fr. ac.

n

N n

xn x i^ i

i i ∑ = =

«Cuartil de orden α » (Para agrupados u organizados en tablas)

Siendo i es el menor intervalo que tiene frecuencia acumulada superior a α ·n − 1 −^1 (^ − − 1 )

= + i i i

i i (^) n L L

n N C L

α α

58

100 – 130 115 3 58

90 - 100 95 3 55

80 - 90 85 5 52

70 - 80 75 11 47

60 – 70 65 21 36

50 – 60 55 10 15

40 – 50 45 5 5

Peso Marca Nº Σ %

( 70 60 ) 66 , 6 21

0 , 558 15 0 , 5 60

) − =

⋅ − C = +

− 1 −^1 (^ − − 1 )

= + i i i

i i (^) n L L

n N C L

α

( 70 60 ) 66 , 6 21

60 0 ,^55815

( )

0 , 558 0 , 5 1 1 1

) = + ⋅ − − =

⋅ − = = − + − i ii

i i L L n

N Mediana C L

Variabilidad o Dispersión

La variabilidad de en los valores de un cualquier atributo que

evaluemos está presente siempre en la naturaleza y en cualquier

fenómeno social, su origen en ciencias sociales, es siempre múltiple.

Diferencias individuales en el conocimiento de la materia.

EJEMPLO: Los estudiantes de Sociología reciben diferentes

calificaciones en la asignatura (variabilidad). ¿A qué puede deberse?

¿Podría haber otras razones (fuentes de variabilidad)?. Supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.

Dormir poco el día del examen, el croissant estaba envenenado... Diferencias individuales en la habilidad para hacer un examen. El examen no es una medida perfecta del conocimiento. « Variabilidad por error de medida.» En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala. « Variabilidad por azar, aleatoriedad.»

Medidas de Dispersión

Miden el grado de dispersión (variabilidad) de los datos,

independientemente de su causa.

Es muy sensible a valores extremos. EJEMPLO: 2,1,4,3,8,4. El rango es 8-1=7.

«Amplitud o Rango» (‘range’):

Es la diferencia entre las observaciónes

extremas.

«Rango intercuartílico»

(‘interquartile range’):

Es la distancia entre el primer y tercer

cuartil.

Parecida al rango, pero elimina las observaciones más extremas inferiores y superiores, haciéndose menos sensible a valores extremos. Rango intercuartílico = P75 - P

25% 25% 25%

Variabilidad o Dispersión

«Varianza S 2 » (‘Variance’): Mide el promedio de las desviaciones

(al cuadrado) de las observaciones con respecto a la media.

= (^) ∑ − i

xi x n

S^2 ( )^2

1

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable.

El llamado «coeficiente de inercia» (mayor o menor dispersión de los valores) influye en sus valores. Como la razón física de porqué un patinador gira a diferente velocidad cuando extiende o recoge sus brazos

Por estos inconvenientes se utiliza la «Desviación típica»

Coeficiente de variación

Es la razón entre la desviación típica y la media.

Mide la desviación típica en forma de « qué tamaño tiene con

respecto a la media» o «desviación por unidad de media»

También se la denomina «Variabilidad relativa» Es frecuente mostrarla en porcentajes. EJEMPLO: Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables. EJEMPLO: Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura. No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente

x

S CV =

Asimetría o sesgo

Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución La media tiende a desplazarse hacia las valores extremos (colas). Discrepancias entre las medidas de centralización indican la asimetría.

Estadísticos de Asimetría

Basados en diferencia entre estadísticos de tendencia central, se utilizan:

Por diferencias intercuartílicas 1º y 2º cuartiles y 2º y 3º.

Basados en desviaciones con signo respecto a la media. En este se basa SPSS. En función del signo del estadístico diremos que la asimetría es positiva o negativa. Distribución simétrica la que tiene asimetría nula.

Apuntamiento o curtosis

La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana, que es adimensional.

Se denomina: „ «Platicúrtica»: curtosis < 0 „ « Mesocúrtica»: curtosis = 0 „ « Leptocúrtica»: curtosis > 0

Las series que representan los siguientes gráficos poseen la misma media y desviación típica, pero con diferente grado de apuntamiento.

Leptocúrtica

(^316273237424752576267727782879297102108138) Frecuencia

400 300 200 100 0 Platicúrtica

Frecuencia 4548515457606366697275788184

160 140 120 100 80 60 40 Mesocúrtica

(^273237414549535761656973778185899399) Frecuencia

300

200

100

0