Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística: Ciencia de la Información, Apuntes de Estadística

La estadística es una ciencia que describe, analiza y representa conjuntos de datos mediante métodos numéricos y gráficos. Ayuda a recolectar datos y tomar decisiones adecuadas. Se divide en estadística descriptiva y estadística inferencial. La estadística descriptiva resume, analiza y realiza inferencias sobre datos, mientras que la estadística inferencial se utiliza para efectuar estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos (población).

Tipo: Apuntes

2020/2021

Subido el 11/02/2021

iciargp5
iciargp5 🇪🇸

3 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA
Estadística: 1 rama de las matemáticas. Aparece cuando nos encontramos en situaciones de
incertidumbre. Nos ayuda a recolectar datos para reducir la incertidumbre y tomar decisiones
adecuadas.
- Siempre existe un margen de error.
- Es una ciencia que nos va a decir como podemos emplear la información
La estadística es una ciencia que:
-Describe, analiza y representa un conjunto de datos
-Utiliza métodos numéricos y gráficos para resumir y presentar la información contenida en los
datos
-Solo describe datos
Recolectamos información con encuestas a raíz de muestras. Cuanto mayor sea el tamaño de la
muestra mayor exactitud y menor margen de error habrá en la decisión tomada.
-A partir de los datos anteriores vamos a averiguar el comportamiento
-Se apoya en el calculo de probabilidades ( un nivel de confianza del….)
-Se apoya en datos muestras para efectuar estimaciones, decisiones, predicciones y otras
generalizaciones sobre un conjunto mayor de datos ( población)
DEFINICIONES IMPORTANTES:
-Población o universo: un grupo grande, que puede ser finito o infinito, de unidades con alguna
característica en común. ( concretarla) todas las tiendas
-Unidad: El objeto más pequeño o individuo que puede ser investigado, la fuente de la
información básica. cada tienda
-Muestra: Subconjunto de unidades de la población o universo. conjunto de tiendas seleccionada
- La variable: numero de unidades vendidas
1
Los clasifica
Resume
halla
regularidades
Analiza
Realiza
inferencias
Para ayudar a tomar decisiones adecuadamente
Estadística descriptiva:
Estadística inferencial:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga Estadística: Ciencia de la Información y más Apuntes en PDF de Estadística solo en Docsity!

Estadística: 1 rama de las matemáticas. Aparece cuando nos encontramos en situaciones de incertidumbre. Nos ayuda a recolectar datos para reducir la incertidumbre y tomar decisiones adecuadas.

  • Siempre existe un margen de error.
  • Es una ciencia que nos va a decir como podemos emplear la información La estadística es una ciencia que:
  • (^) Describe, analiza y representa un conjunto de datos
  • (^) Utiliza métodos numéricos y gráficos para resumir y presentar la información contenida en los datos
  • (^) Solo describe datos Recolectamos información con encuestas a raíz de muestras. Cuanto mayor sea el tamaño de la muestra mayor exactitud y menor margen de error habrá en la decisión tomada.
  • (^) A partir de los datos anteriores vamos a averiguar el comportamiento
  • (^) Se apoya en el calculo de probabilidades ( un nivel de confianza del….)
  • (^) Se apoya en datos muestras para efectuar estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos ( población) DEFINICIONES IMPORTANTES:
  • (^) Población o universo: un grupo grande, que puede ser finito o infinito, de unidades con alguna característica en común. ( concretarla) todas las tiendas
  • (^) Unidad: El objeto más pequeño o individuo que puede ser investigado, la fuente de la información básica. cada tienda
  • (^) Muestra: Subconjunto de unidades de la población o universo. conjunto de tiendas seleccionada
  • (^) La variable: numero de unidades vendidas Los clasifica Resume^ halla regularidades Analiza^ Realiza Recoge datos inferencias Para ayudar a tomar decisiones adecuadamente Estadística descriptiva: Estadística inferencial:

Ej: la temperatura media del municipio de pozuelo durante el verano de 2017

  • (^) Población: todos los registros de temperatura de todo el verano 2017
  • (^) Unidad: cada registro
  • (^) Muestra: registros seleccionados
  • (^) La variable: la temperatura media de pozuelo durante verano 2017 Ej: Ingresos totales por cliente durante un año para un establecimiento determinado
  • (^) Población: Todos los clientes del establecimiento
  • (^) Unidad: Cada cliente del establecimiento
  • (^) Muestra: Los clientes seleccionados
  • (^) La variable: Ingresos totales por cliente durante un año para un establecimiento determinado La probabilidad de que una unidad de la población pueda ser elegida como parte de la muestra es similar para todos los elementos de la población ETAPAS ESUDIO ESTADÍSTICO: 1- Planteamiento del problema:
    • Objetivo
    • Población 2- Recogida información muestran 3- Análisis descriptivo 4- Inferencia (¿?) 5- Diagnóstico
    • validez de los supuestos
    • Interpretación
    • Conclusiones ¿ Para que se aplica?
  • (^) RRHH
  • (^) MK
  • (^) Producción
  • (^) Finanzas <<TODA TOMA DE DECISIONES, EMPRESA E INCERTIDUMBRE DOS CONCEPTOS QUE VAN DE LA MANO >> Para que una muestra sea buena lo mejor es realizar un muestro aleatoria

IMP DIFERENCIAR:

  • (^) Variable: una característica o cualidad que se tiene que poder medir. No tiene por que ser un elemento numérico. ( el color por ej no se puede medir por eso le asiganamos un número) TIPOS:
  • (^) Categórica o cualitativa: solamente clasifica ( ej: estado civil) nominales y ordinales
  • (^) Numérica o cuantitativa : Expresan un valor, que puede ser discreto (no se puede decimal) o continuo ( hay decimal)
  • (^) Dato: Valor observado o medido de la variable. cuantificación de la variable
  • (^) Elemento:Lo que le identifica! ( ej: marca) NIVELES DE MEDICIÓN ESCALA DE RAZÓN: cuando el 0 si que significa ausencia de valor ( tiempo 0, 0 ingresos) Si no se puede medir en negativo es de razón ESCALA DE INTERVALOS: cuando el 0 no significa ausencia de valor ( ej:saldo) ESCALA ORDINAL: clasifica y ordena ( ej: rankings) ESCALA NOMINAL : Clasifica (Ej: sexo) Una cuantificación o valor observado. Valores que toma la variable Clasificados en dos tipos: CORTE TRANSVERSAL: Cuando el dato hace referencia al mismo dato, pero cuando es observado por distintos individuos. EJ: Al hablar de la altura de los alumnos, la altura de cada individuo en particular. ( mismo dato observado en individuos diferentes y referidos al mismo momento del tiempo) SERIE TEMPORAL: El mismo dato en los mismo Individuos durante distintos periodos de tiempo. Ej: Beneficios de una misma empresa en distintos años
  • (^) Primarias: cuando somos nosotros los que hemos observado la información ( investigación personal o recogida de datos) Realizo yo el estudio. Ventaja: Concordancia con nuestros objetivos ( puesto que lo hacemos nosotros) Desventaja: el coste
  • (^) Secundario : No es un estudio propio, utilizo las de otros. Ventaja: coste Desventaja: la posible no concordancia

DATOS

FUENTE DE DATOS

CUALITATIVAS

CUANTITATIVAS

¿ Que es un PARÁMETRO? Son ciertas caracteresticas ( “ es un caracter”) de ese grupo o conjunto de datos que mide un determinado aspecto de la vriable. EJ: la media, tiempo minimo, tiempo medio, nivel máximo de satisfacción, el mínimo…

observación : El valor que ha tomado la variable

TEMA 2 MEDIDAS DE POSICIÓN Y DISPERSIÓN:

ESTADÍSTICA DESCRIPTIVA, MEDIDAS DE CENTRALIZACIÓN

Estas medidas permiten resumir la información contenida de los datos. EJ: Salarios 1:

Media: 2000 salarios 2

Media: 2000 En la primera muestra los datos muy cerca de la media, en la segunda muy separados. Por lo tanto, en vez de ser homogéneos son muy dispersos ( los de la segunda muestra) Medidas de tendencia central:

- Media aritmética

- Mediana

- Moda ( relación empírica entre la media, la

mediana y la moda)

- Otras medidas de centralización

Moda: Es una medida de tendencia central que se puede utilizar sea cual sea el tipo de variable a estudiar ( cualitativa ( sobre todo para esta) o cuantitativa) La moda es el valor que más se repite, aquel cuya frecuencia absoluta es máxima. Puede ser única, que haya más de una o que no exista. Cualtiles, percentiles y deciles: Cuartiles. Dividen un conjunto de datos en cuatro partes iguales Deciles: Dividen un conjunto de datos en 10 partes iguales Percentiles: dividen un conjunto de datos en 100 partes iguales INTERPRETAR LA TABLA: Rango: diferencia entre max y min Cuartel inferior: Cuartel superior: Rango intercuartílico: (Q3 ( cuartel superior- Q1 Cuartel inferior) = 50% vendedores ha venido entre 39.6000- 101. EL HISTOGRAMA Representación gráfica de los datos cuando analizamos variables cuantitativas continuas o variables cuantitativas discretas con muchísimos valores. Representa: probabilidad acumulada en cada uno de los valores de la variable. Es decir, cuando el tamaño de la muestra es muy elevado. Estonce Slo que haremos es: dividir y agrupar la muestra por íntervalos

Barras = intervalos Barras unidas = intervalos continuos Altura barra = frecuencia relativa del intervalo ( suma de todas: 1) FIJARNOS EN LA MEDIANA: Al unir todos los puntos y crear una línea, nos damos cuenta de que distribución es asimétrica( cuando media es mayor a la mediana) a la derecha de la mediana. Cuando hay asimetría hay mayor dispersión de datos. Los vendedores que venden por en encima de la mediana tiene ventas muy diferentes entre ellos, mientras que los que están por debajo de la mediana las ventas son menos diferentes. Por el contrario es simétrico cuando la media, mediana y moda coinciden en el mismo punto. TIPOS ASIMETRÍA:

  • (^) Media> mediana: asimetría positiva, MAYOR DISPERSIÓN DE DATOS—> g1 mayor q 0
  • (^) Media < mediana: asimetría negativa —> g1(grado de asimetría) menor que 0 Igual a cero= simétrica DIAGRAMA DE CAJAS:
  • Puede ser horizontal o vertical.
  • (^) La caja representa: rango intercultílico
  • (^) Dispersión: se ve igual que en el histograma ( Es asimétrico)
  • (^) Q1: Línea desde el min hasta principio caja
  • (^) Q3: Línea desde caja hasta valor máximo Valor mínimo Valor máximo Rango intercualtílico ( la caja) Mediana

ASIMETRÍA:

asimétrica( cuando media es mayor a la mediana) Cuando hay asimetría hay mayor dispersión de datos. Por el contrario es simétrico cuando la media, mediana y moda coinciden en el mismo punto. G —> igual a 0 TIPOS ASIMETRÍA:

  • (^) Media> mediana: asimetría positiva, MAYOR DISPERSIÓN DE DATOS—> g1 mayor q 0
  • (^) Media < mediana: asimetría negativa —> g1 menor que 0
  • (^) G1= Grado de asimetría CURTOSIS: Analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Analiza en apuntalamiento de los intervalos Lepocurtica: Datos muy concentrados. G2> 0 Mesocírtica: término medio, tiene una distribución normal G2= 0. Normal-estándar tipificada. Media= 0 / Desviación típica= Platicúrtica: Mayor dispersión de los datos g2< 0 Estadística descriptova unidimensional: Describir datos es: Encontrar patrones entender el comportamiento de los datos, Es descubrir las principales relaciones Es descubrir la historia que tratan de contarnos • Exponen la información recogida en la muestra de manera inteligente:
  • Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad.
  • Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido por el total, normalizadas.
  • Frecuencias acumuladas absolutas y relativas: Acumulan las frecuencias absolutas y relativas. Son especialmente útiles para calcular cuartiles (como veremos más adelante).

DIAGRAMA DE PARETO

Me indica cuales son las principales causas o formas en las que se presenta la variable cualitativa. (Regla 80, 20: El 80% de los ingresos resulta de el 20% de las ventas Ordenamos datos de mayor a menos frecuencia, se representa con barras y linea roja: que representa frecuencia acumulada. Distribuciones unidimensionales: Se analiza una sola variable Distribución bidimensional: Se analizan dos variables Distribución multidimensional: Se analizan varias variables TIPOS DE GRÁFICOS: Variables cualitativas: gráfico de sectores y gráfico de barras. Histograma COPIAR APUNTES CLASE FALTADA Y ANTERIOR Cualitativos: Cuantitativos

  • (^) Tablas
  • (^) Pie/ barras
  • (^) Pareto
  • (^) Porcentajes
  • (^) Histograma
  • (^) Box plot
  • (^) Posición
  • (^) Dispersión
  • (^) Forma

5-Según un informe de Recursos Humanos , un trabajador en los países industriales gasta en promedio 419 minutos al día en el trabajo. Supongamos que la desviación estándar del tiempo gastado en el trabajo es de 27 minutos. a. Si la distribución del tiempo empleado en el trabajo es de aproximadamente en forma de campana, entre lo que dos veces lo haría 68% de las cifras a ser? 95%? 99,7%? media= 419 minutos Sigma/ desviación típica= 27 minutos b. Si no se conoce la forma de la distribución de los tiempos, aproximadamente qué porcentaje de los tiempos sería entre 359 y 479 minutos? 8- El precio medio de cotización de una acción es de 75 u.m. y su varianza de 25. Calcule el porcentaje de observaciones comprendidas entre los valores 65 y 85. c. Si los datos tienen forma de campana, calcule el porcentaje aproximado de observaciones comprendidas entre 65 y 85. media= 75 Sigma al cuadrad0= 25; sigma=

intervalo= ( media -K x sigma ; media + k x sigma) = 65; 75- k x 5= 65 10= 5K—> k= 2 75-k x5 = 6- Las ventas diarias en los últimos diez días de la pizza margarita de Pizzería Mateo´s correspondientes a uno de sus locales situado en el centro de la ciudad han sido: 6, 8, 10, 12, 14, 9, 11, 7, 13, 11 d. Calcule las ventas medias y la desviación estándar de la pizza margarita en estos diez días. e. Calcule su coeficiente de variación. f. Realice una representación gráfica de las ventas de estos diez días.Ç COPIAR APUNTESSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS

  1. Una muestra de 20 analistas financieros ha recibido el encargo de predecir los beneficios por acción que obtendrá una empresa el próximo año, y los resultados obtenidos de su estudio han sido: a. Trace el histograma. b. Halle las frecuencias relativas. c. Halle las frecuencias acumuladas. Número de analistas M a r c a d e clase f r e c u e n c i a relativa F. A b s. Acumulada F. Abroluta 9,95 < 10,45 2 10,2 0,1 2 0, 10,45 < 10,95 8 10,7 0,4 10 0, 10,95 < 11,45 6 10,9 0,3 16 0, 11,45 < 11,95 3 11,7 0,15 19 0, 11,95 < 12,45 1 11,2 0,05 20 1

TEMA 3:

Análisis de dos características o aspectos de forma conjunta. No hablamos de dos variables, si no de variable aleatoria conjunta. Tabla de frecuencias bivariadas o conjuntas: VER AULA! ————————————————————————— Si la media esta antes de la mediana es simetría positiva Medidas de sesgo= errores ————————————————————————— TABLA DE CONTINGENCIA:

  • (^) El orden de los factores no altera el producto Última columna lateral: Distribución marginal de X Última fila abajo: Distribución marginal de Y TEMA 3 1………………………………………………………………………………………………………….… Cuanto mas cercano estén los puntos de la linea imaginaria, mayor relación lineal hay
  • (^) Correlación: mide la relación lineal entre una y otra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  • (^) Si no hay correlación: incorrelada COEFICIENTE DE CORRELACIÓN PEARSON: QUE TIENE QUE DAR: -1<RO< -1 = Relación lineal perfecta negativa( a medida que una variable aumenta la otra disminuye 0 = variables incorreladas 1 = relación perfecta positiva 0 - 0,4= Débil 0,4- 0,7= media 0,7 - 1= fuerte COMO CALCULARLO: RO= Covarianza X x Y / desvíación tipica X x desviación típica de Y
  • (^) Media gasto: 12,
  • (^) Media ventas: 904, 17
  • (^) Covarianza gasto en publicidad, ventas ?? = (10-12,5)nx (750 -904,17)…….todos los meses entre 12
  • (^) Desviación típica de X = raíz cuadrada de varianza

LA CORRELACIÓN NO IMPLICA CAUSALIDAD Dos variables aleatorias independientes, DARÍAN 0 SIEMPRE LA COVARIANZA ¿Cuando son independientes?

  • (^) cuando el producto de la marginal es igual a X11. MIRARLO EN LA TABLA! Si se cumple: variables independientes en toda la tabla. Las ventas aumentan en 0,976. POR CADA EURO QUE AUENTO EL GASTO EL PUBLICIDAD LAS VENTAS AUMENTAN ESO

EJERCICIOS

VARIALE ALEATORIA: