Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Descriptiva, Apuntes de Estadística Empresarial

Asignatura: Análisis exploratorio de datos, Profesor: , Carrera: Estadística Empresarial, Universidad: UMH

Tipo: Apuntes

2013/2014

Subido el 18/03/2014

irenesansano
irenesansano 🇪🇸

4.2

(24)

7 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 1. Introducción
1. ¿Qué es la estadística?
Estadística es la ciencia basada en la recolección, organización, presentación,
análisis e interpretación de datos para facilitar la toma de decisiones fundamentadas.
1. Planteamiento de objetivos.
2. Diseño y planificación de la recogida de datos.
3. Estudio de campo: recogida de información.
4.
Análisis exploratorio de datos: ESTADÍSTICA DESCRIPTIVA
5. Análisis inferencial y ajuste de modelos estadísticos: ESTADÍSTICA
INFERENCIAL. (es una parte de la estadística que comprende los métodos y
procedimientos que por medio de la inducción determina propiedades de una población
estadística, a partir de una pequeña parte de la misma. Busca a partir de los datos
observados en una muestra, generalizar las conclusiones a toda la población de
referencia)
6. Predicción de nuevos datos a partir de los modelos ajustados.
2. Estadística Descriptiva (Análisis Exploratorio de Datos)
El objetivo básico de la Estadística Descriptiva es describir, resumiendo los datos recopilados,
lo que hemos observado o medido en un conjunto de sujetos o individuos.
Censo: Observamos/medimos a todos los individuos de una población.
Muestra: Observamos/medimos un subconjunto de individuos de una población.
Al aplicar técnicas y procedimientos de Estadística Descriptiva sobre una muestra, nunca se
pretenden generalizaciones a la población a la que pertenece dicha muestra. (Si fuese así sería
Estadística Inferencial)
Las técnicas y procedimientos utilizados se engloban en dos tipos:
Numéricos
Gráficos
Los datos a describir provienen de medir u observar características (VARIABLES) de interés
en los sujetos considerados. Distinguimos dos tipos de variables:
Variables categóricas. Sólo unas pocas respuestas son posibles.
Si esas respuestas no tienen asociado ningún número, la variable se llama
NOMINAL. Por ejemplo, se recoge información sobre la condición jurídica de
cada empresa. Existen varias respuestas, pero limitadas y no son numéricas.
Respuestas, tipo de sociedad: S.A., S.L., C.B., Autónomo…
Fases de un
Análisis
Estadístico
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Estadística Descriptiva y más Apuntes en PDF de Estadística Empresarial solo en Docsity!

Tema 1. Introducción

  1. ¿Qué es la estadística?

Estadística es la ciencia basada en la recolección, organización, presentación, análisis e interpretación de datos para facilitar la toma de decisiones fundamentadas.

  1. Planteamiento de objetivos.

  2. Diseño y planificación de la recogida de datos.

  3. Estudio de campo: recogida de información.

Análisis exploratorio de datos: ESTADÍSTICA DESCRIPTIVA

  1. Análisis inferencial y ajuste de modelos estadísticos: ESTADÍSTICA INFERENCIAL. (es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una pequeña parte de la misma. Busca a partir de los datos observados en una muestra, generalizar las conclusiones a toda la población de referencia)
  2. Predicción de nuevos datos a partir de los modelos ajustados.
  3. Estadística Descriptiva (Análisis Exploratorio de Datos)

El objetivo básico de la Estadística Descriptiva es describir , resumiendo los datos recopilados, lo que hemos observado o medido en un conjunto de sujetos o individuos.

Censo: Observamos/medimos a todos los individuos de una población. Muestra: Observamos/medimos un subconjunto de individuos de una población.

Al aplicar técnicas y procedimientos de Estadística Descriptiva sobre una muestra, nunca se pretenden generalizaciones a la población a la que pertenece dicha muestra. (Si fuese así sería Estadística Inferencial)

Las técnicas y procedimientos utilizados se engloban en dos tipos: ■ Numéricos ■ Gráficos

Los datos a describir provienen de medir u observar características (VARIABLES) de interés en los sujetos considerados. Distinguimos dos tipos de variables:

Variables categóricas. Sólo unas pocas respuestas son posibles.

  • (^) Si esas respuestas no tienen asociado ningún número, la variable se llama NOMINAL. Por ejemplo, se recoge información sobre la condición jurídica de cada empresa. Existen varias respuestas, pero limitadas y no son numéricas. Respuestas, tipo de sociedad: S.A., S.L., C.B., Autónomo…

Fases de un Análisis Estadístico

  • Si las respuestas son vinculables a un número u orden, la variable se llama ORDINAL. Por ejemplo, se pregunta el grado de satisfacción con un producto (o un profesor...típico test de la umh). Grado de satisfacción:
  1. Nada satisfecho 2. Poco satisfecho 3. Regular 4. Bastante satisfecho 5. Muy satisfecho

Variables numéricas. Muchas respuestas diferentes son posibles y todas ellas numéricas. Por ejemplo, se han recopilado el número de llamadas telefónicas diarias recibidas en un servicio de comida a domicilio. Pues pueden ser 23, 57, o 90… Respuestas numéricas en un rango amplio.

Tema 2. Tablas de frecuencias y descriptivos gráficos

  1. Introducción

El primer paso tras recabar información experimental u observacional, es tabular y visualizar los datos.

Las tablas de frecuencias nos permiten organizar la información y resumirla a través de los porcentajes de distribución.

Obtenidos los resúmenes porcentuales asociados a las tablas de frecuencia la visualización de la distribución de los datos es inmediata.

  1. Tablas de frecuencia para una variable.

Una tabla de frecuencias es una presentación resumida y organizada de los distintos valores que toma la variable. Número y porcentaje de sujetos que han dado cada una de las posibles respuestas. Para organizar la información disponible a través de tablas de frecuencias es preciso tener en cuenta:

♦ Si los datos vienen dados individualizados o agrupados. ♦ El tipo y valores posibles de la característica medida/observada. ♦ La organización de los datos de acuerdo a esos posibles valores-respuestas: tabulación. ♦ El resumen numérico de dicha ordenación: conteos. NOTA: Todos los ejemplos que hay a continuación son los mismos que hemos usado en el tema 1

2.1.Tabla de frecuencias para variables categóricas nominal.

Para las variables categóricas nominales el orden no tiene importancia. Se establece la tabla a partir de frecuencias absolutas y frecuencias relativas.

Las frecuencias absolutas representan el número de sujetos observados en cada una de las categorías o de la variable.

Totales: 50 1

2.3.Tabla de frecuencias para variables numéricas.

La construcción de la tabla de frecuencias no es inmediata ya que la información ordenada no se encuentra clasificada en categorías. Por este motivo, el siguiente paso es la determinación de clases o categorías de valores para la agrupación de la información ordenada. Dichas clases se denominan intervalos, introduciendo además los conceptos de amplitud del intervalo, como la diferencia entre el valor máximo y mínimo, y la marca de clase, como el punto medio de dicho intervalo. En la tabla de frecuencias para variables numéricas se calcula las frecuencias relativas y absolutas y sus acumuladas. Como en las variables categóricas ordinal.

Paso 1. Ordenar los datos

Paso 2. Calcular el rango Rango= nº Máximo – nº Mínimo

Paso 3. Establecer el número de intervalos que se desean construir. Para tamaños de muestra pequeños (menos de 5 datos) se recomienda construir no más de 5 intervalos.

Paso 4. Establecer límites y amplitud (igual para todos) de cada intervalo, teniendo en cuenta:

a. Valor máximo y mínimo observado en la muestra. b. Procurar que los extremos de los límites sean números enteros para su mejor comprensión.

Paso 5. Tabular los resultados.

Ejemplo: llamadas telefónicas diarias recibidas en un establecimiento de comida rápida.

Rango=83-42=

  1. (^) Procedimientos gráficos vinculados a las tablas de frecuencias

Estudiamos a continuación la representación de las tablas de frecuencias:

  • Diagramas de barras
    • Se representan frecuencias, frecuencias relativas y/o porcentajes con barras cuya altura es el valor de la frecuencia o porcentaje.
    • Pros: fácil representación.
    • Contras: Dificultad comparativa cuando hay muchas clases.

Paso 3, 4 y 5Paso 1 y 2Paso 1

  • Diagramas de sectores
    • Se usan para representar porcentajes. El círculo se divide en sectores de área proporcional al porcentaje de cada clase.
    • Pros: Fácil representación
    • Contras: Dificultad comparativa con muchas clases o clases con porcentajes pequeños.
  • Gráfico de líneas Se unen mediante líneas las frecuencias relativas o porcentajes (sencillos o acumulados). El eje X representa la característica observada y en él se sitúan los posibles valores ordenados. El eje Y contiene la escala porcentual.
  • Gráfico combinado de barras y líneas Representación combinada de frecuencias relativas y/o porcentajes sencillos y acumulados.
  • Histograma Es la versión del gráfico de barras en variables numéricas (continuas), apareciendo las barras pegadas unas a otras para reflejar continuidad. Facilita la comprensión de cómo se distribuyen los datos a lo largo del rango de valores posibles.

Tema 3. Medidas de localización, dispersión y forma.

Gráficos.

Las medidas de localización, dispersión y forma permiten resumir la información de un conjunto de datos numéricos en una serie de indicadores numéricos que caracterizan cómo se distribuyen. Diferenciamos varios tipos de medidas: ■ Medidas de localización ■ Medidas de dispersión

  • Si pos no es entero, se redondea al entero por exceso p+ , y el percentil es el dato que se encuentra en dicha posición.

Gráficos de cajas. Son útiles para presentar diferentes medidas de localización como los datos, como mínimo, máximo y cuartiles.

  1. Medidas de dispersión.

Dispersión: cómo de variables son los datos. Tratan de cuantificar la cantidad de variación, diseminación o agrupamiento de los datos. El objetivo fundamental es conocer si los datos se agrupan en torno a cierto valor o si por el contrario se reparten sobre el rango posible de observaciones. Por lo tanto, se usan para establecer la fiabilidad sobre las medidas de localización. Las medidas habituales son el rango, rango intercuartílico, varianza, desviación típica…

  1. Medidas de forma.

Forma: cuál es la forma de la distribución de los datos.

  1. Gráficos.

P= dato de pos+ cuando pos nos ha salido