




















































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: introduccion a la estadistica, Profesor: , Carrera: Administración y Dirección De Empresas, Universidad: UNIOVI
Tipo: Ejercicios
Subido el 07/06/2018
1 / 92
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





















































































Descargado en:
patatabrava .com
Capítulo I
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y así sucesivamente. Huntsberger tiene razón pues al instante de escuchar esta palabra estas son las imágenes que llegan a nuestra cabeza. La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias. Los mercados, la medicina, la ingeniería, los gobiernos, etc. Se nombran entre los más destacados clientes de ésta. La ausencia de ésta conllevaría a un caos generalizado, dejando a los administradores y ejecutivos sin información vital a la hora de tomar decisiones en tiempos de incertidumbre. La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la cual se adhirió a la Estadística a las ciencias formales. En este breve material se expone los conceptos, la historia, la división así como algunos errores básicos cometidos al momento de analizar datos Estadísticos.
Definición de Estadística La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva. Otros autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacón esta se define como “la ciencia que tiene por objeto el estudio cuantitativo de los colectivos”; otros la definen como la expresión cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y análisis. La más aceptada, sin embargo, es la de Minguez, que define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima”. Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término se usa para referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística; y el término estadístico, en singular y en masculino, se refiere a una medida derivada de una muestra.
Utilidad e Importancia Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.
Historia de la Estadística Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio. Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos. Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico. Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
2.- Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política: Las ideas mercantilistas extrañan una intensificación de este tipo de investigación. Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política. Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durantes las dos terceras partes del siglo XIX. 3.- Tercera Fase: Estadística y Cálculo de Probabilidades: El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su análisis”.
División de la Estadística
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales.
Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. Como consecuencia, la característica más importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada.
Método Estadístico
El conjunto de los métodos que se utilizan para medir las características de la información, para resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de información, es lo que se llama métodos estadísticos. Los métodos de análisis para la información cuantitativa se pueden dividir en los siguientes seis pasos:
Errores Estadísticos Comunes
Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente identificables. Algunos de éstos errores son: Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o
estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada. Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico. Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada
47 10
1 470 = = =
N
xn X
n
i
i i
Propiedades: 1ª) Si sometemos a una variable estadística X, a un cambio de origen y escala Y = a + b X, la media aritmética de dicha variable X, varía en la misma proporción.
2ª) La suma de las desviaciones de los valores o datos de una variable X, respecto a su media aritmética es cero.
1
=
i
n
i
Ventajas e inconvenientes:
que representan el número de veces que un valor de la variable es más importante que otro.
=
n
i
i
n
i
i i
1
1
b) Media geométrica
Sea una distribución de frecuencias (x (^) i , n (^) i ). La media geométrica, que denotaremos
por G. se define como la raíz N-ésima del producto de los N valores de la distribución.
Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la
misma, pero utilizando la marca de clase (Xi).
El empleo más frecuente de la media geométrica es el de promediar variables tales como
porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone
que la variable presenta variaciones acumulativas.
Ventajas e inconvenientes:
Además, cuando la variable toma al menos un x (^) i = 0 entonces G se anula, y si la
variable toma valores negativos se pueden presentar una gama de casos particulares en
los que tampoco queda determinada debido al problema de las raíces de índice par de
números negativos.
c) Media armónica
La media armónica, que representaremos por H, se define como sigue:
= r i i
n xi
N H
1
1
Obsérvese que la inversa de la media armónica es la media aritmética de los inversos
de los valores de la variable. No es aconsejable en distribuciones de variables con
valores pequeños. Se suele utilizar para promediar variables tales como productividades,
velocidades, tiempos, rendimientos, cambios, etc.
Ventajas e inconvenientes:
n= 32
Lugar que ocupa = 32/2 = 16 ==>
6 2
5 7 2
Me = x^1 + xi +^1 = + =
Notar que en este caso se podría haber producido que hubiera una frecuencia absoluta
acumulada superior a 16. En este caso se calcularía como en el ejemplo anterior.
b) Variables agrupadas por intervalos
En este caso hay que detectar en que intervalo está el valor mediano. Dicho intervalo se
denomina “ intervalo mediano ”.
Cada intervalo Ii vendrá expresado según la notación Ii = ( L (^) i-1 , Li ]; observando la
columna de las frecuencias acumuladas, buscaremos el primer intervalo cuya Ni sea
mayor o igual que
, que será el intervalo modal; una vez identificado dicho intervalo,
procederemos al cálculo del valor mediano, debiendo diferenciar dos casos:
1º) Si existe Ii tal que (^) i Ni
N N p p 2
− 1 , entonces el intervalo mediano es el^ ( Li-1 , Li ]
y la mediana es:
c i ni
Ni
N
Me Li
1 2 1
− − = − +
2º) Análogamente si existe un Ii tal que 2
N N (^) i = (^) , la mediana es Me = Li
Ejemplo:
( Li-1, Li] ni Ni [20 , 25] 100 100 (25 , 30] 150 250 (30 , 35] 200 450 (35 , 40] 180 630 (40 , 45] 41 671 N = 671
671/2 = 335.5 ; Me estará en el intervalo (30 - 35 ]. Por tanto realizamos el cálculo:
1
− − i i
i
Ventajas e inconvenientes :
ordinal.
extremos u “outliers ”.
e) Moda
La moda es el valor de la variable que más veces se repite, y en consecuencia, en una
distribución de frecuencias, es el valor de la variable que viene afectada por la máxima
frecuencia de la distribución. En distribuciones no agrupadas en intervalos se observa la
columna de las frecuencias absolutas, y el valor de la distribuci6n al que corresponde la
mayor frecuencia será la moda. A veces aparecen distribuciones de variables con más de
una moda (bimodales, trimodales, etc), e incluso una distribución de frecuencias que
presente una moda absoluta y una relativa.
En el caso de estar la variable agrupada en intervalos de distinta amplitud, se define el
intervalo modal, y se denota por ( Li-1 , Li ], como aquel que posee mayor densidad de
frecuencia ( hi ); la densidad de frecuencia se define como : i
i i
Una vez identificado el intervalo modal procederemos al cálculo de la moda, a través de
la fórmula:
c i hi hi
hi Mo Li 1 1
1 1 − + +
= −
En el caso de tener todos los intervalos la misma amplitud, el intervalo modal será el
que posea una mayor frecuencia absoluta ( ni ) y una vez identificado este, empleando la
fórmula:
i
c ni ni
ni Mo Li 1 1
1 1 − + +
= −
Ventajas e inconvenientes:
xi ni Ni 5 3 3 10 7 10 15 5 15 20 3 18 25 2 20 N = 20
Calcular la mediana (Me); el primer y tercer cuartil (C1,C3); el 4º decil (D4) y el 90 percentil (P90)
Mediana (Me) Lugar que ocupa la mediana Î lugar 20/2 = 10 Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos es
cálculo:
12 , 5 2
10 15 2
Me = xi^ + xi +^1 = + =
Primer cuartil (C1)
Lugar que ocupa en la distribución ( ¼). 20 = 20/4 = 5 Como Ni-1 <
< Ni , es
Tercer cuartil (C3) Lugar que ocupa en la distribución (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta acumulada, por tanto realizaremos el cálculo:
1
Cuarto decil (D4)
Lugar que ocupa en la distribución (4/10). 20 = 80/10 = 8. Como Ni-1 <
< Ni
ya que 3 < 8 < 10 por tanto D4 =10.
Nonagésimo percentil (P90) Lugar que ocupa en la distribución (90/100). 20 = 1800/100 = 18. que coincide con un
valor de la frecuencia absoluta acumulada, por tanto realizaremos el cálculo:
1
ordenados los datos de menor a mayor, tenga como frecuencia acumulada ( Ni ) un
; una vez
identificado el intervalo Ii ( Li-1 , Li ], calcularemos el cuantil correspondiente, a través de la fórmula:
c i ni
q Ni
rN
Crq Li
1 1
− − = − + r=1,2,...,q-1. Cuartil: q=4; Decil:
q=10; Percentil: q=
Ejemplo:
DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90 percentil
de la siguiente distribución:
[Li-1 , Li) ni Ni [0 , 100] 90 90 (100 , 200] 140 230 (200 , 300] 150 380 (300 , 800] 120 500 N = 500
estará situado en el intervalo (100 – 200].Aplicando la expresión directamente,
tendremos:
(100 – 200]. Aplicando la expresión tendremos:
100 178 , 57 140
200 90 4 100 =
− D = +
(300 – 800]. Aplicando la expresión tendremos:
500 591 , 67 120
500 300 70 120
300 450 380 90 = + = P = + −
2.3. Momentos potenciales Los momentos son medidas obtenidas a partir de todos los datos de una variable
estadística y sus frecuencias absolutas. Estas medidas caracterizan a las distribuciones
i
minx i
R = máx x −
Ej: Sea X, las indemnizaciones recibidas por cuatro trabajadores de dos empresas A y B
Re ( A) = 370 – 100= 270
Re ( B) = 245 – 225= 20 ---Æ Distribución menos dispersa
I = Q − Q
( D − D
( P − P
b) Desviación absoluta media con respecto a la media ( de )
Nos indica las desviaciones con respecto a la media con respecto a la media aritmética
en valor absoluto.
ni
r
i
x i
x
e
d
c) Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la
media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto
menor representatividad tendrá la media aritmética.
La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas
al cuadrado.
N
r i i
xi x n S
− = 1
( )^2 2 1 2
2
r
i
i i
=
Propiedades:
1ª) La varianza siempre es mayor o igual que cero y menor que infinito ( 0 )
2
2ª) Si a una variable X la sometemos a un cambio de origen “ a ” y un cambio de escala
“ b ”, la varianza de la nueva variable Y= a + bX, será:
( S (^) (^) y^2 = b^2 S x^2 )
d) Desviación típica o estándar
Se define como la raíz cuadrada con signo positivo de la varianza.
2
x x
S =+ S
2.4.2. Medidas de dispersión relativa
Nos permiten comparar la dispersión de distintas distribuciones.
a) Coeficiente de variación de Pearson ( CVx )
Indica la relación existente entre la desviación típica de una muestra y su media.
Al dividir la desviación típica por la media se convierte en un valor excento de unidad de
medida. Si comparamos la dispersión en varios conjuntos de observaciones tendrá
menor dispersión aquella que tenga menor coeficiente de variación.
El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la
media aritmética, cuando está tome valores cercanos a cero, el coeficiente tenderá a
infinito.
Ejemplo : Calcula la varianza, desviación típica y la dispersión relativa de esta
distribución.
Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de vecinos
X ni
2 2
3 2
5 1
6 3