Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Sigue practicando con estos documentos, Ejercicios de Estadística Matemática

Para ayudar a tu conocimiento académico

Tipo: Ejercicios

2014/2015

Subido el 22/02/2023

anjosek
anjosek 🇧🇴

1 documento

1 / 154

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
UNIVERSIDAD ARTURO PRAT – IQUIQUE CHILE
ESTADISTICA APLICADA. JUAN ZAMBRANO CHALLAPA. 2017
Pág. Nº 1
UNIDAD I. ESTADISTICA DESCRIPTIVA
1) INTRODUCCIÓN
Se han planteado muchas definiciones de la estadística, algunas caracterizando la
estadística como ciencia, y otras como metodología. Con fines estrictamente
académicos daremos la siguiente definición.
Estadística
Es un conjunto de técnicas para:
Recopilar,
Organizar (clasificar, agrupar),
Presentar y
Analizar datos con el fin de describirlos o de realizar inferencias válidas
De acuerdo a esta definición.
𝑳𝐚 𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐬𝐞 𝐜𝐥𝐚𝐬𝐢𝐟𝐢𝐜𝐚 𝐞𝐧 𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐃𝐞𝐬𝐜𝐫𝐢𝐩𝐭𝐢𝐯𝐚
𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐈𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐢𝐚𝐥
Estadística Descriptiva
Es un conjunto de técnicas para: describir, mostrar o presentar datos a través de
tablas, gráficos y medidas estadísticas.
Estadística Inferencial
Es un conjunto de técnicas para: inferir los resultados obtenidos en la muestra
hacia la población de la cual fue extraída.
NOTA: Estas dos partes de la estadística no son mutuamente excluyentes, ya que,
para utilizar las técnicas de la inferencia estadística, se requiere conocer las
técnicas de la estadística descriptiva.
2) CONCEPTOS BÁSICOS INICIALES
(1) Dato estadístico (o información estadística)
Es cualquier dato que se puede comparar, analizar e interpretar
Ejemplo:
Si lanzamos 5 veces una moneda, obtenemos 5 datos: cara, cara, sello, cara,
sello.
Pero los valores son sólo dos: cara y sello
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga Sigue practicando con estos documentos y más Ejercicios en PDF de Estadística Matemática solo en Docsity!

UNIDAD I. ESTADISTICA DESCRIPTIVA

1) INTRODUCCIÓN

Se han planteado muchas definiciones de la estadística, algunas caracterizando la

estadística como ciencia, y otras como metodología. Con fines estrictamente

académicos daremos la siguiente definición.

Estadística

Es un conjunto de técnicas para:

Recopilar,

Organizar (clasificar, agrupar),

Presentar y

Analizar datos con el fin de describirlos o de realizar inferencias válidas

De acuerdo a esta definición.

𝑳𝐚 𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐬𝐞 𝐜𝐥𝐚𝐬𝐢𝐟𝐢𝐜𝐚 𝐞𝐧 ൝

𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐃𝐞𝐬𝐜𝐫𝐢𝐩𝐭𝐢𝐯𝐚

𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐈𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐢𝐚𝐥

Estadística Descriptiva

Es un conjunto de técnicas para: describir, mostrar o presentar datos a través de

tablas, gráficos y medidas estadísticas.

Estadística Inferencial

Es un conjunto de técnicas para: inferir los resultados obtenidos en la muestra

hacia la población de la cual fue extraída.

NOTA: Estas dos partes de la estadística no son mutuamente excluyentes, ya que,

para utilizar las técnicas de la inferencia estadística, se requiere conocer las

técnicas de la estadística descriptiva.

2) CONCEPTOS BÁSICOS INICIALES

(1) Dato estadístico (o información estadística)

Es cualquier dato que se puede comparar, analizar e interpretar

Ejemplo:

Si lanzamos 5 veces una moneda, obtenemos 5 datos: cara, cara, sello, cara,

sello.

Pero los valores son sólo dos: cara y sello

(2) Población

Es el conjunto de todos los datos con características comunes.

Al número de datos de la población se le llama “N” (tamaño poblacional).

𝑳𝐚 𝐩𝐨𝐛𝐥𝐚𝐜𝐢ó𝐧 𝐩𝐮𝐞𝐝𝐞 𝐬𝐞𝐫 ൝

(3) Muestra

Es un subconjunto representativo de la población.

Al número de datos de la muestra se le llama “n” (tamaño muestral).

(4) Unidad de análisis

Es cada uno de los objetos sobre los que se realiza la observación de una o

más variables. Son los sujetos u objetos de estudio

(5) Variable

Es cada una de las características que poseen los objetos. Se denotan con las

letras X, Y, Z, etc.

(1) Variable cualitativa

Son aquellas que expresan una cualidad o atributo, sus datos se expresan

mediante palabras.

Ejemplos: Género, Estado Civil; Profesión; Nivel Educacional; Causas de

Accidentes; etc.

(1.1) Variable cualitativa nominal

Es aquella cuando se definen categorías y se cuenta el número de

datos pertenecientes a cada categoría y no lleva ninguna ordenación

en las posibles modalidades

Ejemplos:

 Género: femenino y masculino

 Color de ojos: negro, azul, verde, etc.

 Partidos políticos: DC, PPD, RN, UDI, PS, etc

 Profesiones: Profesor, Ingeniero, Médico, etc.

(7) Estadígrafo

Es una medida de alguna característica en la muestra:

𝐋𝐨𝐬 𝐄𝐬𝐭𝐚𝐝í𝐠𝐫𝐚𝐟𝐨𝐬 𝐦á𝐬 𝐮𝐬𝐚𝐝𝐨𝐬 𝐬𝐨𝐧

𝟐

𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐭á𝐧𝐝𝐚𝐫 𝐦𝐮𝐞𝐬𝐭𝐫𝐚𝐥: 𝐬

𝐏𝐫𝐨𝐩𝐨𝐫𝐜𝐢ó𝐧 𝐦𝐮𝐞𝐬𝐭𝐫𝐚𝐥: 𝐩

3) DISTRIBUCIÓN DE FRECUENCIAS (O TABLA)

Es una tabla que divide un conjunto de datos en un número adecuado de “clases”.

Se utilizan para presentar los datos obtenidos en alguna investigación en forma

clara y ordenada. Son auto-explicativas

𝑷𝐚𝐫𝐭𝐞𝐬 𝐝𝐞 𝐮𝐧𝐚 𝐃𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐜𝐢ó𝐧 𝐝𝐞 𝐟𝐫𝐞𝐜𝐮𝐞𝐧𝐜𝐢𝐚

𝐓í𝐭𝐮𝐥𝐨 ൞

¿ 𝐐𝐮é?

¿ 𝐃ó𝐧𝐝𝐞?

¿ 𝐂ó𝐦𝐨?

¿ 𝐂𝐮á𝐧𝐝𝐨?

𝐂𝐮𝐚𝐝𝐫𝐨 ൝

𝐂𝐮𝐞𝐫𝐩𝐨

𝐄𝐧𝐜𝐚𝐛𝐞𝐳𝐚𝐦𝐢𝐞𝐧𝐭𝐨

𝐂𝐨𝐥𝐮𝐦𝐧𝐚 𝐦𝐚𝐭𝐫𝐢𝐳

𝐈𝐧𝐝𝐢𝐜𝐚𝐜𝐢𝐨𝐧𝐞𝐬

𝐜𝐨𝐦𝐩𝐥𝐞𝐦𝐞𝐧𝐭𝐚𝐫𝐢𝐚𝐬

𝐅𝐮𝐞𝐧𝐭𝐞

𝐍𝐨𝐭𝐚

𝐂𝐨𝐦𝐞𝐧𝐭𝐚𝐫𝐢𝐨

(1) El Titulo. Es la indicación que se coloca en la parte superior de la misma y

debe responder a las preguntas:

¿Qué son los datos incluídos en el cuerpo de la tabla?

¿Dónde está el área representada por los datos?

¿Cómo están los datos clasificados?

¿Cuándo ocurrieron los datos?

(2) El cuerpo. Está formado por un conjunto de filas y columnas que contienen

respectivamente, las series horizontales y verticales de información.

(3) El encabezamiento. Es la parte de la tabla en que se indica la naturaleza del

contenido de cada columna. Estos al igual que los títulos deben ser breves,

pero suficientemente explícitos.

(4) Columna Matriz. Es la parte de la tabla en que es designada la naturaleza (las

categorías, las modalidades de la variable) del contenido de cada fila.

(5) Indicaciones complementarias.

(a) Fuente: Es el indicador de la entidad responsable de donde se obtuvieron

los datos.

(b) Notas: Son colocadas al pie del cuadro para esclarecimientos de orden

general.

(c) Comentarios. También colocadas al pie del cuadro, sirven para aclarar

minucias en relación a las celdas, columnas, filas.

Ejemplo

Formas genéricas:

Formato de una Distribución de frecuencias para Variable Cualitativa

Categorías de la Variable

X

𝒊

Frecuencia Absoluta

(FA)

𝐢

Frecuencia Relativa

(FR)

𝐢

𝐢

𝟏

𝟐

  

𝑴

Total 𝑛 1

Tipos de frecuencias

(1) Frecuencia absoluta (𝑭𝑨 = 𝒏

𝒊

Es el número de veces que aparece un determinado valor en un estudio

estadístico.

La suma de las frecuencias absolutas es igual a " n", o sea:

௜ୀଵ

(2) Frecuencia absoluta acumulada (𝑭𝑨𝑨 = 𝑵 𝒊

Es la suma de las frecuencias absolutas de todos los valores inferiores o

iguales al valor considerado, o sea:

௝ୀଵ

(3) Frecuencia relativa (𝑭𝑹 = 𝒇 𝒊

Es el cuociente entre la frecuencia absoluta de un determinado valor y el

número total de datos, o sea:

La suma de las frecuencias relativas es igual a " 1 " , en efecto:

௜ୀଵ

(4) Frecuencia relativa acumulada (𝑭𝑹𝑨 = 𝑭

𝒊

Es el cociente entre la frecuencia absoluta acumulada de un determinado

valor y el número total de datos, o sea:

௝ୀଵ

Ejemplo de Distribución Categórica

Género de los empleados de la empresa TBC, en el pueblo de HUATACONDO. Año 2017

Género

((Variable)

Número de Empleados

(FA)

Porcentaje de Empleados

(FR)

Femenino 19 47,5%

Masculino 21 52,5%

Total 40 100,0%

FUENTE: RRHH de Huatacondo, 2017

NOTA: Las cifras corresponden a una muestra hipotética

Ejemplo de distribución numérica discreta

Número de hijos de los empleados de la empresa TBC, en el pueblo de

HUATACONDO. Año 2017

Número

de hijos

(Variable)

Número de

empleados

(FA)

Porcentaje

de

empleados

(FR)

Número de

empleados

acumulados

(FAA)

Porcentaje de

empleados

acumulados

(FRA)

Total 40 100,0%

FUENTE: RRHH de Huatacondo, 2017

Edad de los empleados de la empresa TBC en HUATACONDO, año 2017

Edad

(en años)

(Variable)

Marca de

Clase

(MC)

Nº de

Empleados

(FA)

Nº de empleados

Acumulados

(FAA)

Porcentaje

De empleados

(FR)

Porcentaje

De empleados

Acumulados

(FRA)

[20,0 ; 26,5[ 23,25 8 8 20,0 20,

[26,5 ; 33,0[ 29,75 11 19 27,5 47,

[33,0 ; 39,5[ 36,25 7 26 17,5 65,

[39,5 ; 46,0[ 42,75 6 32 15,0 80,

[46,0 ; 52,5[ 49,25 2 34 5,0 85,

[52,5 ; 59,0[ 55,75 2 36 5,0 90,

[59,0 ; 65,5] 62,25 4 40 10,0 100,

TOTAL 40 100,

Las clases también pueden ser escritas como:

Edad

(en años) Otra forma

Edad

(en años) En SPSS

Se lee por ejemplo:

𝑷𝒓𝒊𝒎𝒆𝒓 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐: 𝑫𝒆 𝟐𝟎 𝒉𝒂𝒔𝒕𝒂 𝒎𝒆𝒏𝒐𝒔 𝒅𝒆 𝟐𝟔, 𝟓 𝒂ñ𝒐𝒔

𝑺𝒆𝒈𝒖𝒏𝒅𝒐 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐: 𝑫𝒆 𝟐𝟔, 𝟓 𝒉𝒂𝒔𝒕𝒂 𝒎𝒆𝒏𝒐𝒔 𝒅𝒆 𝟑𝟑 𝒂ñ𝒐𝒔

El polígono de frecuencias, de menor interés que el histograma, es la

poligonal que une los puntos medios de las bases superiores de los rectángulos

y se cierra con el punto medio anterior y posterior al histograma.

(3) Polígono de frecuencias acumuladas (ojivas)

Se utiliza para representar distribuciones de frecuencias acumuladas agrupadas

en intervalos. En el eje de abscisas se representan los distintos intervalos de

clase. Sobre el extremo superior de cada intervalo de clase se levanta una línea

perpendicular de altura proporcional a la frecuencia absoluta acumulada del

intervalo. Partiendo del extremo inferior del primer intervalo y uniendo los

extremos de las líneas anteriores, se obtiene el polígono de frecuencias

acumuladas.

(4) Gráfico circular o de sector

Se utiliza para representar distribuciones de frecuencias cualitativas.

En el diagrama de sectores, cada carácter se representa por un sector circular

de área proporcional a la frecuencia absoluta del mismo, es decir:

𝒊

𝒊

°

(5) Gráfico de Pareto

Se utiliza en Control de Calidad

Clasifica la cantidad y tipo de defectos que se presentan en un producto o en un

servicio. Recibe este nombre en honor al científico italiano del siglo XIX, Vilfredo

Pareto, quien observó que la mayor parte de la “actividad” en un proceso es

causada por una cantidad pequeña de “factores”. Su concepto, a menudo

denominado “regla 80-20”, es que “80% de la actividad es provocada por 20%

de los factores”. Si se concentran en este último dato, 20%, los gerentes

pueden resolver 80% del problema.

(6) Gráfico de caja y bigote (gráfico de los 5 números)

Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

Suministra información sobre los valores mínimo y máximo, los percentiles P 25 ,

P 50 , y P 75 , y sobre la existencia de valores atípicos y la asimetría de la

distribución.

(7) Pictogramas; son figuras alusivas al tema

5) MEDIDAS ESTADÍSTICAS DE VARIABLES CUANTITATIVAS CONTINUAS

Una vez clasificados los datos originales, cuyas características más esenciales se

destacan, será necesario calcular un conjunto de estadísticas (indicadores) que

caractericen en forma algo más precisa la distribución que se está estudiando.

𝐌𝐞𝐝𝐢𝐝𝐚𝐬 𝐞𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚𝐬

𝐃𝐞 𝐏𝐨𝐬𝐢𝐜𝐢ó𝐧

𝐌𝐞𝐝𝐢𝐚 𝐀𝐫𝐢𝐭𝐦é𝐭𝐢𝐜𝐚

𝐌𝐞𝐝𝐢𝐚 𝐆𝐞𝐨𝐦é𝐭𝐫𝐢𝐜𝐚

𝐌𝐞𝐝𝐢𝐚 𝐀𝐫𝐦ó𝐧𝐢𝐜𝐚

𝐌𝐞𝐝𝐢𝐚 𝐂𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐚

𝐃𝐞 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢ó𝐧

𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐦𝐞𝐝𝐢𝐚

𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐭á𝐧𝐝𝐚𝐫

𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧

𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚

(1) MEDIDAS DE POSICIÓN

Nos facilitan información sobre los datos que estamos analizando. Estas medidas

permiten conocer diversas características de los datos.

Nos dan el valor que ocupa una determinada “posición" respecto al resto de la

muestra.

Características de las medidas de posición

1°) Debe estar definido en forma objetiva.

2°) Debe depender de toda la información obtenida en lo posible.

3°) Debe ser fácil de comprender (no debe tener un carácter abstracto) y de

interpretar.

4°) Debe ser fácil de calcular.

5°) Debe ser estable (no debe ser sensible a fluctuaciones).

6°) Debe ser adecuado a cálculos algebraicos posteriores.

Tipos

 Medidas de posición central: informan sobre los valores medios de los datos.

 Medidas de posición no central: informan de como se distribuye el resto de los

valores de los datos.

(1.1) Medidas de posición central

Nos dan un centro de la distribución de frecuencias, es un valor que se puede

tomar como representante de todos los datos. Las principales medidas de posición

central son: Promedio, Moda y Mediana.

(1.1.1) Promedio

Es el valor medio ponderado de los datos. Se pueden calcular diversos tipos de

promedio, siendo los más utilizados:

(1.1.1.1) Media aritmética

Es el v a l or obtenido al s uma r todos los da tos y div i di r el resultado

entre el núme ro total de da tos. Se representa por 𝑥̅. O sea:

௜ୀଵ

Ejemplo

Los pesos en kilogramos de seis trabajadores son: 84, 91, 72, 68, 87 y 78.

Hallar el peso medio.

Media aritmética para datos agrupados

Si los da tos vienen a grupa dos en una tabla de frecuencias, la

expresión de la me dia es:

௜ୀଵ

௜ୀଵ

Propiedades de la media aritmética

1 º ) La s uma de las des v i ac i ones de los datos de una distribución

respecto de su me di a es igual a c e ro:

− 𝑥̅ ) = 0. Teorema de Koning

Ejemplo:

La suma de las desviaciones de los números 84, 91, 72, 68, 87, 78 de

su media aritmética 80 es igual a 0, en efecto:

2 º ) La me di a a ri tmé tic a de los c ua dra dos de las de sv i a ci one s

de los valores de la variable con respecto a un núme ro cualquiera

(1.1.1.3) Media armónica

Es igual al número recíproco de la media aritmética de los valores

recíprocos de la distribución:

Se usa cuando las unidades de los valores son cuocientes (m/seg; km/hr,

etc).

(1.1.1.4) Media cuadrática

Es igual a la raíz cuadrada de la media aritmética de los cuadrados de los

valores de la variable.

Se usa en el análisis de la varianza y para valores negativos de una

variable.

NOTA

En datos agrupados, para calcular las medidas anteriores utilizamos las

marcas de clase, es decir, 𝑦

indicará el punto medio del intervalo.

La relación entre: la media, la media geométrica, y la media armónica es:

(1.1.2) Mediana

Es el v a l or que ocupa el l uga r ce ntra l de los da tos cuando éstos están

orde na dos de menor a ma y or. Se representa por: 𝑋

La me di a na se puede ha l la r sólo para vari a bl es c ua nti ta tiv a s.

Cálculo de la mediana para datos no agrupados

1 º ) O rde na mos los da tos de me nor a may or.

2 º ) Ubicar la posición de la mediana, usando:

௡ାଵ

3 º ) Aplicar la fórmula: 𝑀

(௉௢௦)ାଵ

(௉௢௦)

E j e mpl o: 2, 3, 4, 4, 5 , 5, 5, 6, 6

Ubicar la posición de la mediana, usando:

௧௔

𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 ⟹ 𝑀

E j e mpl o: 7, 8, 9, 10, 11, 12

(1º) Ubicar la posición de la mediana, usando:

𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 3

௥௔

௧௔

𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛

2º) Aplicar la interpolación lineal:

(௉௢௦)ାଵ

(௉௢௦)

Cálculo de la mediana para datos agrupados

1º) La me dia na se encuentra en el i nte rv a l o donde la frec ue nc ia

a c umul a da llega hasta la mi ta d de la s uma de l a s fre cue nc i as

a bs ol uta s , es decir tenemos que buscar el intervalo hasta donde tenemos

el 𝟓𝟎% 𝒅𝒆 𝒏.

2º) Aplicamos la fórmula de interpolación:

ெ ೐

ି ଵ

Donde :

𝑴 𝒆

, 𝑒𝑠 𝑒𝑙 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎.

𝑴 𝒆

ି 𝟏

𝑴

𝒆

𝑴

𝒆

Propiedad

La mediana hace mínima la suma de todas las desviaciones absolutas de

los valores de la variable respecto a una constante k cualquiera. Es decir:

௜ୀଵ

௜ୀଵ

; para cualquier constante k.