Tendencia central y medidas de dispersion - Estadistica - Apuntes - Grado Medio, Apuntes de Estadística Matemática. Universidad de La Rioja (UR)
caballerodelsino
caballerodelsino

Tendencia central y medidas de dispersion - Estadistica - Apuntes - Grado Medio, Apuntes de Estadística Matemática. Universidad de La Rioja (UR)

4 páginas
8Número de descargas
1000+Número de visitas
Descripción
Apuntes de estadística para el grado medio sobre la tendencia cantral y medidas de dispersión
20 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 4
Esta solo es una vista previa
3 páginas mostradas de 4 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 4 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 4 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 4 páginas totales
Descarga el documento
USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

Cuál será la medida de tendencia central que se debe usar, teniendo un conjunto de

observaciones?, para responder a este cuestionamiento, se debe tomar en cuenta la

necesidad de considerar dos factores muy importantes uno es la escala de medición, que

tiene que ser ordinal o numérica; y otra, la forma de distribución de las observaciones,

porque se tiene que saber si la distribución de las observaciones se desvía a la izquierda o a

la derecha de la media. Si hay observaciones distantes en una sola dirección se trata de una

distribución sesgada. Si los valores distantes son pequeños se sesga a la izquierda, sesgo

negativo. Si los valores distantes son grandes se sesga a la derecha, sesgo positivo

izquierda derecha

sesgo negativo sesgo positivo

Distribuciones simétricas

Las siguientes reglas deben considerarse al decidir cual medida se aplicará a las

observaciones del trabajo de investigación. La media se usa para datos numéricos y

Mediana

Mediana Mediana

media media

media

distribuciones simétricas, es decir sin ningún tipo de sesgo, y es sensible a los valores

absolutos. La mediana se emplea para datos ordinales o para datos numéricos con

distribución sesgada, porque no es sensible a la variación de los extremos. El modo se utiliza

para distribuciones bimodales ( dos observaciones que se repiten el mismo numero de

veces en la distribución ). Una forma de saber la forma que tiene la distribución de

observaciones es la siguiente: Si la media y la mediana son iguales la distribución es

simétrica ( se usa la media). Si la media es mayor que la mediana, la distribución está

sesgada a la derecha. Si la media es menor que la mediana la distribución está sesgada a la

izquierda ( en los últimos dos casos, se usa la mediana).

MEDIDAS DE DISPERSIÓN

Cuando se tiene una serie de mediciones de observaciones realizadas en una

investigación no basta con presentar la media o la mediana según sea el caso. Desde luego

que la información no es despreciable, pero se requiere lograr información mas objetiva, por

ejemplo saber como es la variación de dichas observaciones, es decir, como se dispersan, o

se sitúan en el área bajo la curva.

Varias son las medidas estadísticas, que se utilizan para dar una idea clara de cómo

es la dispersión o variación de las observaciones. Entre otras, el rango, extensión o

amplitud, la desviación estándar, el coeficiente de variación, percentiles y el rango o

amplitud intercuartil .

La diferencia entre la observación mas grande y la mas pequeña es lo que se

denomina rango, lo primero que se tiene que hacer es organizar los datos, por ejemplo en

una grafica de tronco y hoja o bien una lista en orden ascendente o descendente. Se hace la

operación aritmética y se obtiene un número que es el rango, esta información o número

obtenido es poco útil, por lo cual muchos autores al mencionar y exponer el rango, anotan los

valores mínimo y máximo de la lista de observaciones, lo cual tiene mayor utilidad, porque

nos indica de alguna forma como están dispersos los datos o más bien cual es la amplitud de

la dispersión de las observaciones. Por ejemplo

23,34,33,32,35,36,28,27,30 ( primero ponerlos en orden)

23,27,28,30,32,33,34,35,36

En el primer caso, el rango sería = ( 36 – 23 = 13)

En el segundo caso se pondría: rango = 23 a 36, esta información tendría mayor utilidad para

describir la amplitud de los datos

Cuando se tienen intervalos en una tabla de frecuencias, se hace un cálculo aproximado

usando el limite inferior del intervalo de clase menor y el limite superior del intervalo de clase

mas alto. En el ejemplo de abajo sería 3.0 a 7.9

Una medida de dispersión, muy útil y por lo tanto comúnmente utilizada es la

desviación estándar.

Es una medida de cómo se dispersan los datos alrededor de su media. Partimos del

hecho de que se pudiera medir que tanto se desvía de la media, cada una de las

observaciones. Se sumarían todas estas mediciones y se dividirían entre el número de ellas,

para formar una analogía de la media. Es decir una desviación media, luego entonces tendría

como fórmula  ( X – X ) / n. Sin embargo si sumamos todas las desviaciones el resultado

será siempre igual a cero. Entonces se pueden hacer dos cosas, una sumar los valores

absolutos de las desviaciones ( sin signos, por ejemplo el valor absoluto de 3 es I3I, y de –3

es I –3 I entonces es igual a 3 el número con barras verticales) o bien elevando al cuadrado

las desviaciones antes de sumarlas ( se quitan los signos) entonces quedaría la fórmula, así

 I X – X I / n, sin embargo ésta fórmula, no es útil para hacer inferencias. Por lo tanto se usa

la segunda opción que es elevar al cuadrado las desviaciones antes de sumarlas y se extrae

la raíz cuadrada para volver al estado original de medición de las observaciones. El

denominador también se modifica, para producir una estimación más precisa de la

desviación estándar verdadera de la población, queda n – 1, para que no se tenga el

resultado de cero( que es en otras operaciones lo que se conoce como grados de libertad)

Intervalos

3.0 – 3.9

4.0 – 4.9

5.0 – 5.9

6.0 – 6.9

7.0 – 7.9

Pacientes

X

X – X

(X – X)2

1 0.13 0.01 0.0001

2 0 -0.12 0.0144

3 -0.18 -0.30 0.0900

4 -0.15 -0.27 0.0729

5 0.11 -0.01 0.0001

6 0.43 0.31 0.0961

7 0.41 0.29 0.0841

8 -0.12 -0.24 0.0576

9 0.06 -0.06 0.0036

10 0.06 -0.06 0.0036

11 -0.19 -0.31 0.0961

12 0.39 0.27 0.0729

13 0.30 0.18 0.0324

14 0.18 0.06 0.0036

15 0.11 -0.01 0.0001

16 0.94 0.82 0.6724

17 -0.07 -0.19 0.0361

18 -0.23 -0.35 0.1225

total 2.18 1.4586

La varianza es el resultado obtenido, antes de extraer la raíz cuadrada

La raíz cuadrada = 0.2929 que es la desviación estándar( DE )

La variación o desviación de los datos del paciente 16 es casi la mitad del resultado

total, si se elimina, la DE es igual a 0.22, lo que demuestra la importancia de que una o más

desviaciones sean muy distantes de la media.

Un aspecto relevante es que la desviación de la media indica por ejemplo que 2 DE

abarcan casi las tres cuartas partes de todos los datos (75%), es decir 2DE de la media.

En una distribución simétrica 67% de las observaciones quedan entre la media y 1DE

95% quedan entre 2DE, y 99.7% se agrupan entre 3DE.

Otra medida útil para la dispersión relativa de los datos es el coeficiente de variación

es la desviación estándar dividida entre la media por 100%, es una medida de la variación

relativa con respecto a la media, y se usa cuando se comparan dos escalas de medición

diferentes, este coeficiente las estandariza. La fórmula es: CV = (DE / X) 100%. Los valores

del resultado indican que tan grande o pequeña es la variación, si es pequeña se puede

utilizar adecuadamente por ejemplo una prueba diagnostica.

No hay comentarios
Esta solo es una vista previa
3 páginas mostradas de 4 páginas totales
Descarga el documento