Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Resumen estadística, Resúmenes de Estadística

Asignatura: Estadística, Profesor: No lo se, Carrera: Economía, Universidad: UDIMA

Tipo: Resúmenes

2013/2014

Subido el 04/05/2014

vanessa.branalafuente
vanessa.branalafuente 🇪🇸

2 documentos

1 / 11

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 3: LAS MEDIDAS DE POSICIÓN E DISTRIBUCIONES UNIDIMENSIONALES
3.1. INTRODUCCIÓN
Las distribuciones de frecuencias de una variable estadística pueden estudiarse a través de unas
medidas, que se conocen con el nombre genérico de estadísticos y que, analizadas
conjuntamente, nos dan un panorama sobre las características de la distribución.
Los más habituales son:
3.2. LA MEDIA ARITMÉTICA
3.2.1. La media aritmética simple
Suele denotarse por
Se lee como “el sumatorio de todos los valores de x desde el primero (i = 1) hasta el último
(i = n)”
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Resumen estadística y más Resúmenes en PDF de Estadística solo en Docsity!

TEMA 3: LAS MEDIDAS DE POSICIÓN E DISTRIBUCIONES UNIDIMENSIONALES

3.1. INTRODUCCIÓN

Las distribuciones de frecuencias de una variable estadística pueden estudiarse a través de unas medidas, que se conocen con el nombre genérico de estadísticos y que, analizadas conjuntamente, nos dan un panorama sobre las características de la distribución.

Los más habituales son:

3.2. LA MEDIA ARITMÉTICA

3.2.1. La media aritmética simple

Suele denotarse por

Se lee como “el sumatorio de todos los valores de x desde el primero (i = 1) hasta el último (i = n)”

3.2.2. La media aritmética ponderada por las frecuencias

En las distribuciones de tipo II o de tipo III es necesario utilizar las frecuencias para obtener la media aritmética.

En el caso de que los datos estén agrupados en clases, es decir, en las distribuciones de tipo III, se opera igual, tomando la marca de clase mi como x (^) i. (Ver ejemplo 3.3)

3.2.3. La media aritmética ponderada por coeficientes

En ocasiones resulta conveniente introducir un coeficiente de ponderación que de mayor peso a algunos valores de la variable. Estos coeficientes o pesos suelen denominarse wi

Para las distribuciones de tipo II y III sería:

Ver ejemplos 3.5 y 3.6.

3.2.4. Propiedades de la media aritmética

  1. La suma de las desviaciones de todos los valores respecto a su media aritmética es cero
  2. Si multiplicamos o dividimos todas las observaciones por un mismo número, lo que se conoce como cambio de escala , la media queda multiplicada o dividida por dicho número.
  3. Si le sumamos a todas las observaciones un mismo número, lo que se conoce como cambio de origen , la media aumentará en dicha cantidad.

Como consecuencia de estas dos últimas propiedades, sí a la variable estadística x (^) i la sometemos al mismo tiempo a un cambio de origen O (^) t y a un cambio de escala C mediante la transformación (^) , (siendo O (^) t y C constantes), resulta que:

Esta propiedad es bastante utilizada para la simplificación de los cálculos cuando los valores observados son muy elevados y tienen un máximo común divisor. (Ver ejemplo 3.8)

3.2.5. Ventajas e inconvenientes de la media aritmética

Ventajas:

  • Se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro.
  • Es calculable en todas las variables, es decir siempre que nuestras observaciones sean cuantitativas.
  • Su significado es menos intuitivo que la media aritmética.
  • (^) La mayor complicación de los cálculos.
  • Su indefinición (da números con naturaleza imaginaria) cuando tiene valores negativos y su valor nulo cuando una observación toma este valor.

Exigirá normalmente la utilización de logaritmos o de programas informáticos.

Y en neperianos:

3.4. MEDIA ARMÓNICA

La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones; suele denotarse con la letra H.

Para distribuciones unitarias o de tipo I:

Para distribuciones de tipo II:

Su utilización es bastante poco frecuente y sólo debe emplearse cuando la variable está medida en unidades relativas, por ejemplo, KM./h., es decir, para promediar velocidades, tiempos, rendimientos, etc.

Ventajas:

  • Está definida de forma objetiva y es única.
  • Para su cálculo tiene en cuenta todos los valores de la distribución.
  • Es más representativa que otras medidas en los casos de obtener promedios de velocidades, rendimientos, productividades, etc.
  • Los valores extremos tienen una menor influencia que en la media aritmética.

Inconvenientes:

  • Sólo se puede calcular si no hay observaciones iguales a cero.
  • Cuando la variable toma algunos valores muy pequeños puede carecer de significado.

3.5. RELACION ENTRE LAS MEDIAS ARMÓNICA, GEOMÉTRICA Y ARITMÉTICA

3.6. LA MEDIANA

Las medias estudiadas hasta ahora son medidas que tratan de equilibrar los valores de una distribución compensando los más grandes con los más pequeños para buscar su centro de gravedad o posicionamiento central; estos estadísticos tienen 2 problemas:

  • Son muy sensibles a los valores extremos de las distribuciones de forma que cuando existe mucha dispersión los hacen poco representativos. Cálculo de la mediana.
  • No es posible calcularlos en las distribuciones cualitativas, para solucionarlo se calcula la moda.

La mediana de una distribución de frecuencias, previamente ordenada en orden creciente o decreciente, se define como el valor central de la variable que divide la distribución en dos partes iguales, es decir, es el valor que deja el mismo número de observaciones o de frecuencias a su izquierda que a su derecha.

A. Cálculo de la mediana en el caso de distribuciones de tipo I

A..1Que el número de observaciones, N, sea impar:

A..2Que el número de observaciones, N, sea par: En este caso hay 2 términos centrales, y; la mediana será la media aritmética de esos 2 valores. (Ver ej:3.13)

B. Cálculo de la mediana en las distribuciones de tipo II

Es preciso ordenar los valores y trabajar con la frecuencia absoluta acumulada N (^) i , obteniendo en concreto el valor N/2. Se distinguen 2 casos:

C. Que exista un Ni iguala N/2: En este caso la mediana es la media aritmética de X (^) i y del siguiente Xi+1, si la variable no admite decimales, la mediana serían los 2 valores, conjuntamente.

D. Cuando no existe un Ni que iguale a N/2, la mediana corresponde al primer X (^) i cuyo valor supere al de N/2.

E. Cálculo de la mediana en las distribuciones de tipo III o agrupadas por intervalos.

  1. (^) Si existe Ni que es igual a N/2, la mediana por convenio, es el límite superior del intervalo mediano o intervalo en el que Ni = N/

b) (^) Que los intervalos tengan distinta amplitud: Para este caso es necesario obtener un ratio de densidad de frecuencia (frecuencia absoluta dividida por amplitud del intervalo); el intervalo con mayor valor en este ratio constituirá el intervalo modal. Es imprescindible para evitar situaciones de desequilibrio que pudieran desvirtuar el propio concepto, interés e interpretación de la moda.

Para hallar el punto modal exacto lo más habitual es operar con la siguiente expresión:

Ventajas:

  • Puede obtenerse en todas las distribuciones (cuantitativas como cualitativas), ya que siempre es posible determinar el valor, la categoría o la modalidad que más se repite.
  • Su cálculo es sencillo.
  • Fácil interpretación estadística, a que nos da el valor o modalidad que más se repite.

Inconveniente:

  • En su determinación no intervienen todos los valores de la distribución, centrándonos sólo en la mayor frecuencia absoluta de un determinado valor de la variable o de la modalidad de los atributos.

3.8. MEDIDAS DE POSICION NO CENTRALES: LOS CUANTILES

Los cuantiles son los valores de la variable que dividen una distribución de frecuencias en partes iguales.

Los más habituales son:

  • Cuartiles, son 3 valores que dividen la serie de datos en cuatro partes iguales. La mediana coincide con el segundo cuartil divide la distribución en dos partes iguales.
  • Quintiles, son 4 valores que dividen la distribución en 5 partes iguales.
  • Deciles, son nueve valores que dividen la distribución en 10 partes iguales.
  • Percentiles, que son 99 valores que dividen la distribución en cien partes iguales.

Considerando N el número de datos de la distribución, o frecuencia absoluta acumulada, con

carácter general los cuantiles se obtienen con la expresión , en la que r indica el cuantil

correspondiente (r = 1, primer cuantil, r = 2, segundo cuantil, etc.) y q el número de intervalos con iguales frecuencias en los que se pretende dividir la distribución (si q = 4 hablamos de cuartiles, si q = 10 de percentiles, etc.).

Para distribuciones agrupadas en intervalos utilizamos la siguiente expresión:

Algunos programas informáticos no utilizan los mismos criterios o algoritmos indicados con anterioridad; en concreto, la Excel considera a todas las distribuciones como si fueran continuas y sitúa los cuartiles no el valor de la variable cuya frecuencia absoluta acumulada supera al establecido por el cuartil, sino en un punto intermedio que obtiene mediante un algoritmo particular. (Ver ejemplo 3.24).

3.9. MEDIDAS DE POSICION ROBUSTAS

Tratan de paliar los problemas de estimación asociados a distribuciones anómalas, siendo estadísticos que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución siendo, por tanto, el mejor compromiso.

3.9.1. La media k-recortada

Es la media de los datos que quedan después de eliminar el k por ciento de los datos más grandes y k por ciento de los datos más pequeños. A la media recortada al 25% se le denomina centrimedia. La media recortada al 0% es igual a la media aritmética.

3.9.2. La media k-winsorizada

En lugar de prescindir de los k por ciento datos más grandes y más pequeños, se sustituyen por el valor mayor y menor de los datos restantes.

3.9.3. La trimedia

Es un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) (Ver ejemplo 3.25)

3.10 MOMENTOS DE UNA DISTRIBUCIÓN UNIDIMENSIONAL DE FRECUENCIAS

Los momentos son medidas que caracterizan a una distribución de frecuencias y que tienen como principal utilidad su condición de operadores para el cálculo simplificado de las medidas de posición, dispersión o forma de una distribución; también tienen una importante utilidad para efectuar las regresiones estadísticas.

Existen dos clases:

  • Respecto al origen, que se representan con a (^) h
  • Los momentos centrales o respecto a la media, se representan con mh

Al momento de orden 2 respecto a la media m 2 , se le denomina varianza, constituye la medida de dispersión más utilizada.

LA MACRO HERRAMIENTAS DE EXCEL PARA ANÁLISIS ESTADÍSTICO

La hoja de cálculo Excel dispone también de una opción MACRO que facilita la rápida obtención de múltiples estadísticos descriptivos. La forma de ver si la opción está activada es mirar en el menú “Herramientas” y comprobar que se encuentra el texto “Análisis de datos”. En caso de no encontrar esta opción activada tendremos que cargar la macro “Herramientas para análisis”, dentro del apartado “Macros automáticas”.

Las posibilidades de esta macro son muy amplias, en este apartado nos quedaremos con la opción de Estadística Descriptiva.

Dicha opción Genera un informe de estadísticas de una sola variable para datos del rango de entrada, y proporciona información acerca de la tendencia central y dispersión de los datos. En concreto, genera información tanto sobre la Media, la Mediana y la Moda, como sobre los estadísticos de dispersión, concentración y forma (error típico, la desviación estándar, la varianza de la muestra, el coeficiente de Curtosis, el coeficiente de asimetría, el rango, el valor mínimo, el valor máximo, etc.) (Ver ejemplo pág. 153).

EL MENÚ DATOS

Ordenar datos

Los datos en una lista están organizados de tal manera que las filas definen registros y las columnas los campos que constituyen la información de los registros. Se pueden seleccionar hasta 3 criterios para ordenar la base de datos y dentro de cada uno de ellos por orden de presentación (ascendente o descendente).

Hay que tener presente:

  • En las operaciones de ordenación se ha de tener cuidado con las celdas que contienen fórmulas.
  • Si se ordena por filas, después de la ordenación, las referencias a celda de la misma fila serán correctas pero no lo serán las referencias a otras filas.
  • Si es por columnas, las referencias a celdas de la misma columna serán correctas después de ordenar, pero serán incorrectas las fórmulas que hacen referencia a otras columnas.
  • Una forma de evitar este problema es incluir en las fórmulas que se encuentran fuera de lista, sólo referencias absolutas. Si ordenamos por filas (columnas) debemos evitar las fórmulas que hagan referencia a otras filas (columnas).

3.11.2 Las funciones estadísticas en SPSS

Analizaremos 3 funciones de interés: la transformación de datos, la gestión y transformación de ficheros de datos y la generación de estadísticos descriptivos.

La transformación de datos

El análisis preliminar de la información a estudiar puede revelar esquemas de codificación poco prácticos o errores de codificación, o bien pueden requerirse transformaciones de los datos para trabajar posteriormente una mejor relación entre las variables.

SPPS puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la agrupación de categorías para su análisis posterior, hasta otras más avanzadas, como la creación de nuevas variables basadas en ecuaciones complejas e instrucciones condicionales.

Para realizar el cálculo de nuevas variables, utilice el cuadro de diálogos “Calcular” para calcular los valores de una variable basándose en transformaciones numéricas de otras variables; con el mismo:

  • Puede calcular valores para las variables numéricas o de cadena (alfanuméricas).
  • Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las nuevas variables, también se puede especificar el tipo y la etiqueta de variables.
  • Puede calcular valores de forma selectiva para subconjuntos e datos basándose en condiciones lógicas.
  • Puede utilizar más de 70 funciones preincorporadas, incluyendo funciones aritméticas, funciones estadísticas, funciones de distribución y funciones de cadena.

Calcular variable: “Si los casos”, permite aplicar transformaciones de los datos para subconjuntos de casos seleccionados utilizando expresiones condicionales. Una expresión condicional devuelve el valor verdadero, falso o perdido.

La gestión y transformación de ficheros

  • Ordenar datos
  • Transponer casos y variables
  • Fundir archivos
  • Seleccionar subconjuntos de casos.
  • Agregar datos.
  • Ponderar datos
  • (^) Reestructurar datos.

La generación de estadísticos descriptivos

SUM (A) : Halla la suma de las observaciones de la variable A

SUM (A, B, C,…) : Halla el vector de las sumas de las observaciones de las variables A, B, C…

MEAN (A) : Halla la media de la variable A

MEAN (A, B, C, …) : Halla el vector de las medias de las variables A, B, C, …

LAG(numvar;n): Desplaza el comienzo de la variable numérica “numvar” n posiciones hacia delante y sustituye las n primeras posiciones por valores desaparecidos. Se trata de la típica variable retardo de orden n.