



































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Fundamentos de Estadística, Profesor: , Carrera: Turismo, Universidad: UNED
Tipo: Apuntes
1 / 43
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




































1.- ESTADÍSTICA: Es la ciencia que se ocupa de la obtención de información y que proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre.
Se divide en tres grandes apartados: Estadística descriptiva, que recoge un conjunto de técnicas y procedimientos para organizar, resumir y tratar sistemáticamente datos disponibles de sucesos ya acaecidos; Estadística inferencial o inferencia estadística, que estudia los métodos empleados para inferir algo acerca de una población basándose en la información aportada por una parte del colectivo (muestra); la inferencia se basa en la teoría matemática de la probabilidad , que constituye el tercer gran apartado de la estadística.
2.- Defina los conceptos de población y muestra
Población: Conjunto de elementos que cumplen una determinada característica (ej.: clientes de un hotel en una determinada fecha) y que componen el conjunto que tratamos de investigar.
Muestra: Cualquier subconjunto de individuos pertenecientes a una población determinada. Debe ser representativa es decir, reflejar lo mejor posible las características de la población.
Parámetros son las características que posee una población y que suelen ser desconocidas a priori. Por ejemplo, la edad de los viajeros de una compañía aérea, la nacionalidad de los visitantes un museo, el motivo de los viajes contratados en una agencia, etc.
Cuando estas características son numéricas (cuantitativas), es decir, cuando se pueden medir, se denominan variables (años de edad, renta anual en euros, etc.); por el contrario, cuando las características de la población no son susceptibles de medirse numéricamente (cualitativas) reciben el nombre de atributos (el color del pelo, el sexo, la profesión, el estado civil, el grado de satisfacción del cliente con un servicio, etc...).
Los atributos, a diferencia de las variables, presentan modalidades o categorías (el atributo sexo puede adoptar las modalidades de varón o mujer, el atributo intención de voto se concreta en los nombres de los partidos políticos que se presenten a las elecciones sondeadas y el de opinión sobre la satisfacción de un cliente con el servicio de limpieza de un hotel puede adoptar las modalidades que se determinen: excelente, bueno, malo, regular, etc.).
5. El 10% de los españoles que viajaron al extranjero durante el año 2004 prefirieron no contratar ningún seguro de viaje. Reflexione acerca de cómo pudo llegarse a esta conclusión: ¿qué tipo de estudio estadístico se utilizó?, ¿se trabajó con una muestra o con una población?.
A esta conclusión pudo llegarse sin duda como resultado de una encuesta realizada a cierto Número de individuos (una muestra) elegidos entre la población total de españoles que viajaron al extranjero en 2004. El parámetro a estimar en este caso fue la proporción poblacional, estimada mediante la proporción muestral.
6. Indique qué son y qué información más relevante contienen las Cuentas Satélites de Turismo.
La Cuenta Satélite del Turismo es un sistema de información económica, constituido por un un conjunto de cuentas y tablas que presenta los distintos parámetros económicos del turismo de forma interrelacionada para una fecha de referencia dada y permite medir el impacto del Turismo sobre la Economía Nacional.
La información más relevante consta de tres tipos de elementos:
1.- DISTRIBUCIÓN o DISTRIBUCION DE FRECUENCIAS: Es el conjunto de valores que toma una variable adecuadamente ordenados, de mayor a menor o de menor a mayor, y acompañado de sus frecuencias absolutas, es decir, las veces en las que aparece cada valor.
2. En una distribución de frecuencias unidimensional, defina los conceptos de frecuencia absoluta, frecuencia total, frecuencia relativa y frecuencia absoluta acumulada. Elabore un sencillo ejemplo con estas frecuencias para una distribución de tipo I
Dada una distribución de frecuencias de una variable discreta X, se denomina:
frecuencia total, es la suma de todas las frecuencias absolutas, es decir, el total de datos o población: N
Ni Frecuencia absoluta acumulada : es la frecuencia absoluta de dicho valor más la suma de las frecuencias absolutas de todos los valores anteriores.(número de datos menores o iguales que él, xi )
Fi Frecuencia relativa acumulada : es el cociente entre su frecuencia absoluta acumulada y el total de la población (número de datos menores o iguales que f (^) i )
Si la distribución de frecuencias es de variable agrupada en intervalos, el concepto es análogo pero referido a los intervalos en lugar de a los valores de la variable.
En una distribución de tipo I, los valores de la variable no se repiten, como por ejemplo, los siguientes valores:
1, 3, 4, 6, 7, 9, 12, 13, 15, 16, 17, 18, 22, 25, 26, 29
La frecuencia absoluta de cada valor es 1; la frecuencia total es 16; la frecuencia relativa de cada valor es
; la frecuencia absoluta acumulada de cada valor coincide con el número que indica el lugar que ocupa (escritos en orden creciente), es decir, respectivamente. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16
3. Una empresa quiere saber el número de veces que se repite un determinado sueldo
entre su plantilla y para ello utiliza la moda de la distribucion de sueldos. ¿Es correcto? Razone la respuesta
No es correcto. Para saber el número de veces que se repite un determinado sueldo debemos observar la frecuencia absoluta. La moda indicaría el sueldo que más se repite entre los empleados.
4.- Tipos de distribuciones
DISTRIBUCIONES DE TIPO I: Cuando los valores no se repiten.
DISTRIBUCIONES DE TIPO II: Cuando los valores se repiten un determinado número de veces.
DISTRIBUCIONES DE TIPO III: Con variables continuas o discretas que presentan un gran número de valores y resulta conveniente agruparlos en intervalos o clases.
Li= límite superior del intervalo.
Li-1=límite inferior del intervalo
Ci= amplitud de intervalo=Li-Li-
El punto medio de cada intervalo se llama marca de clase=Li-1+Li/
4.- Representación gráfica de las distribuciones:
Gráficos de barras;
Histogramas (datos agrupados);
Gráficos de sectores;
Gráficos de series temporales;
Diagrama de Pareto (Se emplea para representar datos cualitativos y su construcción se realiza en dos pasos: a) Se ordenan las clases o categorías según la frecuencia relativa de su aparición; b) Cada clase se representa por un rectángulo con una altura igual a la frecuencia relativa.)
Diagrama de tallos y hojas
3. Señale las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución. ¿En qué casos no es posible utilizarla?
Las principales ventajas de la media aritmética son las siguientes:
El principal inconveniente es que es un valor muy sensible a los valores extremos, con lo que en las distribuciones con gran dispersión de datos puede llegar a perder totalmente su significado. Recordemos aquí la famosa anécdota del pollo, si una persona se come un pollo y otra no come pollo, como media, entre las dos se habrán comido medio pollo cada una.
Supongamos que sobre una variable Xi efectuamos un cambio de origen y de escala:
Y = ax + b
(Multiplicar por a es un cambio de escala y sumar b es un cambio de origen)
La media aritmética de Yi sería:
Y=1Ni=1rYini=1Ni=1r(aXi+b)ni=a1Ni=1rXini+b1Ni=1rni ;
Por tanto, Y = aX + b
es decir, la media aritmética queda afectada por el mismo cambio de origen y de escala.
5. Defina el concepto de media aritmética ponderada y explique cuándo y por qué es conveniente introducir ponderaciones en la media aritmética e indique un ejemplo.
Consideremos la distribución de la variable X = {xi}i=1, .., r con frecuencias respectivas ni. Una media aritmética ponderada se obtiene multiplicando previamente cada valor de la variable xi, por un coeficiente de ponderación wi. Hay que tener en cuenta que entonces la frecuencia queda también multiplicada por wi, de forma que la media aritmética sería:
Es conveniente introducir ponderaciones cuando se trabaja con distribuciones de tipo I y II porque se dispone de muchos valores, por lo que es necesario ponderar la media aritmética simple con las frecuencias absolutas de los valores respectivos, dando lugar a :
En otras ocasiones es necesario introducir un coeficiente de ponderación, que de mayor peso a algunos de los valores de la variable, es decir, cuando los valores de la variable a ponderar no se consideren todos igualmente importantes. Por ejemplo, la nota final de una asignatura obtenida promediando las notas obtenidas en dos exámenes parciales, uno de ellos de más importancia que el otro, dando lugar a la siguiente formulación:
Ejemplo: supongamos que queremos hacer una selección de personas para la recepción de un hotel en el que se considera muy importante el conocimiento de inglés y menos importante el de otras materias como la estadística o el marketing; en el currículum vitae de un candidato tenemos información sobre las notas medias obtenidas en distintos bloques de conocimientos; se considera que la calificación de inglés debe ponderarse el doble que la del resto de materias:
6. Si a todos los valores de una variable les sumamos una constante positiva m, ¿qué le ocurre a su media aritmética? ¿Qué propiedad de la media aritmética se aplica para determinar este resultado?
La media aritmética aumentará en esa cantidad m. La propiedad aplicada es la que establece que efectuado un cambio de origen en la variable, dicho cambio afecta a la media en la misma medida.
7. Si en una distribución de frecuencias hubiera dos medias aritméticas, reflexione sobre las 3 siguientes opciones a) Debe elegirse como válida una cualquiera de ellas, b) Debe elegirse la media aritmética de ambas, c) No puede darse este caso.
La opción correcta es la c porque la media aritmética está unívocamente determinada por la
Puede obtenerse pero carece de significado ya que, al haber un valor nulo, el resultado es cero.
12. ¿Es posible obtener la media geométrica de una distribución unidimensional de frecuencias en la que la variable X toma algún valor negativo? Razone la respuesta.
Si la frecuencia del valor negativo es impar y el tamaño de la población es par, entonces la media geométrica no se puede calcular porque una raíz de índice par de un número negativo no tiene
13. ¿En qué casos es preferible, por ser más representativa, utilizar la media geométrica en vez de la media aritmética?
Cuando los valores a promediar tengan entre sí una relación multiplicativa en lugar de aditiva. Por ejemplo cuando se trate de tasas de crecimiento. Ejemplo: las tasas de crecimiento de determinada magnitud a lo largo de cuatro periodos de tiempo han sido respectivamente 1,2; 1,5; 1,1 y 1,3 (esto quiere decir que la magnitud ha aumentado sucesiva y respectivamente el 20%, el 50% el 10% y el 30%). Entonces la tasa media habrá sido la media geométrica
15.- Propiedades de la media armónica.
1. Es única. 2. Su cálculo es sencillo. 3. Utiliza todos los valores de la distribución. 4. Es más representativa que otras medias para el cálculo de promedios de velocidades, rendimientos y productividades. 5. No debe usarse para valores de la variable muy pequeños, ya que se desvirtúa la información. 6. No es posible calcularla cuando existen valores igual a cero. 16. Señale las ventajas e inconvenientes de la media armónica como medida de posición de
una distribución ¿En qué casos es adecuado utilizarla?
La media armónica sólo se puede calcular si no hay observaciones iguales a cero. Es una medida estadística que se emplea cuando se quieren promediasr rendimientos, velocidades, productividades, etc.
Sus principales ventajas son:
rendimientos, productividades, etc.
El principal inconveniente se produce cuando se utiliza para variables en los que hay valores muy pequeños; en estos casos sus inversos pueden aumentar casi hasta el infinito, eliminando el efecto del resto de los valores. Por esta misma razón no es posible calcularla cuando algún valor es cero, ya que se produce una indeterminación matemática.
Puede demostrarse que en todas las distribuciones de frecuencias que, si existen: H ≤ G ≤ X
21.- Propiedades de la mediana
22.- La media de una muestra siempre divide los datos en dos mitades iguales ¿es correcta esta afirmación? Explíquelo.
No, esta es la definición de la mediana; hay que explicar las diferencias entre media aritmética y mediana.
23. Defina la mediana y la moda de una distribución unidimensional de frecuencias e indique el inconveniente de ambas.
Mediana es el valor tal que el 50% de la población tiene un valor inferior y el otro 50% tiene un valor superior. Si los valores están dispuestos en orden creciente (o decreciente), la mediana ocupa el valor central.
Un inconveniente de la mediana es que, salvo los valores adyacentes, los demás no intervienen en su determinación. Por ejemplo, la mediana de las distribuciones A = {100, 101, 102 , 103} y B = { 1, 101, 102, 1000} es la misma
Moda es el valor, o valores, de mayor frecuencia, o densidad de frecuencia, en el caso de valores agrupados en intervalos que no tengan la misma amplitud.
La moda posee el inconveniente, al igual que la mediana, que en su determinación no intervienen los valores de la variable sino únicamente se tienen en cuenta las frecuencias.
24.- Propiedades de la moda
unidimensional (o bidimensional) de frecuencias.
Las principales ventajas son:
Posee el inconveniente, al igual que la mediana, que en su determinación no intervienen los valores de la variable sino únicamente se tienen en cuenta las frecuencias.
26. Defina el concepto de moda relativa y ponga un ejemplo de distribución unidimensional con una moda relativa
Un valor de la variable es moda relativa cuando su frecuencia es mayor o igual que la de sus valores contiguos. Ejemplo:
xi ni
1 20
2 10
3 16
4 12
5 15
El 3 es moda relativa pues su frecuencia es mayor que las de sus valores contiguos.
El 5 no es moda relativa pues, aunque su frecuencia es mayor que la de su valor contiguo por la izquierda, carece de valor contiguo por la derecha.
El 1 tampoco es moda relativa por la misma razón anterior. Sin embargo es la moda, pues su frecuencia es mayor que las demás.
1. ¿Cuál es el objetivo de las medidas de dispersión estadística?, ¿cuáles son las principales que conoce?
Tratan, como su nombre indica, de medir la mayor o menor dispersión de los valores de la variable, dentro de su dominio. A mayor dispersión, menor es la representatividad de la medida de posición, y viceversa.
Pueden señalarse: -el recorrido (rango o amplitud): diferencia entre el mayor y el menor valor de la variable; - la desviación media: media aritmética de las distancias (diferencias en valor absoluto) de cada valor a la media; -la varianza: media aritmética de los cuadrados de la distancia de cada valor a la media; -la desviación típica: raíz cuadrada de la varianza; -el coeficiente de variación de Pearson: cociente entre la desviación típica y la media aritmética.
2. Explique los conceptos estadísticos de Rango, Recorrido, Amplitud Total y Coeficiente de apertura. Ponga un sencillo ejemplo de cálculo.
Todas son medidas de dispersión, es decir, explican la mayor o menor representatividad de las medidas de posición.
El Rango, Recorrido o Amplitud total, es la medida más sencilla de dispersión absoluta, se define como la diferencia entre el último y el primer valor de la distribución (ordenados de menor a mayor)
El Coeficiente de Apertura, expresa la misma medida anterior pero por cociente, es decir, es una medida de dispersión relativa.
Cap = 15/1 = 15 Cap = 14/2 = 7
3. Defina y explique el significado de los conceptos estadísticos de varianza y desviación típica (de una distribución de frecuencias) y las propiedades de la desviación típica.
Aritmética de la variable, la varianza de una distribución se define como la media aritmética de los cuadrados de las desviaciones respecto a la media. Es una medida de dispersión y se representa por
6.- ¿Qué diferencia existe entre la desviación típica y la cuasi-desviación típica? ¿Qué propiedades poseen?
Para una población de tamaño N, la desviación típica es la raíz cuadrada de la varianza
(raíz cuadrada de la cuasi-varianza).
La cuasi-desviación típica obtenida para una muestra de una población, es mejor estimador de la desviación típica de la población que la propia desviación típica muestral.
Propiedades:
7.- ¿La varianza se ve afectada por los cambios de origen? ¿Y por los cambios de escala? Ponga un ejemplo en su razonamiento.
La varianza se ve afectada exclusivamente por el cambio de escala de forma que si xi es una
8.- Sí a una variable Xi la sometemos al mismo tiempo a un cambio de origen O y a un cambio de escala C ¿cuál o cuáles de las siguientes afirmaciones son falsas o correctas y por qué?
**- Los cambios de origen afectan a la media aritmética
9.- Defina el concepto de coeficiente de variación de Pearson y explique su significado en dos variables que tienen como media 110 y 30, respectivamente y, como varianza 1024 en el primer caso y 196 en el segundo. ¿Qué efectos tiene este coeficiente para valorar la representatividad de la media aritmética de ambas distribuciones?
El coeficiente de variación de Pearson es el cociente entre la desviación típica y la media Aritmética, luego proporciona el número de veces que la desviación típica es mayor que la media. Se trata de una medida de dispersión relativa. Cuanto menor sea la dispersión de la variable y, por tanto, cuanto menor sea el valor absoluto del coeficiente de variación, mejor representará la media aritmética a los valores de la población. Si el valor absoluto del coeficiente de variación es mayor que la unidad, se considera que la media aritmética no es representativa de la población.
(En porcentajes)
Para los datos de la pregunta:
1ª variable: coeficiente de variación = 1024110=32110≅0,
2ª variable: coeficiente de variación = 19630=1430 2 2 4 50,
El coeficiente de variación de Pearson es una medida relativa de la dispersión mientras que la varianza (o la desviación típica) es una medida absoluta. En este caso, tiene mayor dispersión absoluta la 1ª variable pero, no obstante, posee menos dispersión relativa, lo que significa que la dispersión es mayor en la segunda distribución que en la primera. Cuanto menor sea el coeficiente de variación, más representativa será la media de forma que si |CV|≥ 1 se considera que la media no es representativa.
10.- ¿Qué valores puede tomar el coeficiente de variación de Pearson? Interprete estos valores.
es una medida de dispersión relativa. Cuanto menor sea su valor absoluto, menor será la dispersión de los valores de la variable y, por tanto, mayor será la representatividad de la media aritmética.
Se considera que si dicho valor es mayor que la unidad, la media debe descartarse como
medida representativa de la población.
11.- Se atribuye al dramaturgo irlandés Bernard Shaw la siguiente frase:"Si yo me como dos pollos y tu ninguno, la Estadística afirma que cada uno de nosotros, en promedio, nos comemos un pollo". Utilice Vd. La metodología estadística para precisar el alcance y crítica de la anterior afirmación.