Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


apuntes estadistica, Apuntes de Turismo

Asignatura: Fundamentos de Estadística, Profesor: , Carrera: Turismo, Universidad: UNED

Tipo: Apuntes

2012/2013

Subido el 04/08/2013

dumpy-2
dumpy-2 🇪🇸

4.3

(7)

2 documentos

1 / 34

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
UNED. ELCHE. e-mail: [email protected]
TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/
EJERCICIOS PROPUESTOS EN EXÁMENES
1/34
EJERCICIOS PROPUESTOS EN EXÁMENES
ÍNDICE Pág.:
- DISTRIBUCIONES - PREGUNTAS TEÓRICAS ... 1
UNIDIMENSIONALES - PROBLEMAS ....................... 8
- DISTRIBUCIONES BIDIMENSIONALES ...................... 14
- NÚMEROS ÍNDICES ........................................................ 26
- SERIES TEMPORALES .................................................... 28
- PROBABILIDAD ............................................................... 30
- INFERENCIA ESTADÍSTICA .......................................... 32
DISTRIBUCIONES UNIDIMENSIONALES (CAPÍTULOS 2, 3 Y 4)
PREGUNTAS TEÓRICAS.-
1. Señale las ventajas e inconvenientes de la media aritmética como medida de posición de
una distribución.
Respuesta.-
En el texto base podemos leer:
Las principales ventajas de la media aritmética son las siguientes:
- Es calculable en todas las variables, es decir siempre que nuestras observaciones sean
cuantitativas.
- Para su cálculo se utilizan todos los valores de la distribución.
- Es única para cada distribución de frecuencias.
- Tiene un claro significado, ya que al ser el centro de gravedad de la distribución representa
todos los valores observados.
El principal inconveniente es que es un valor muy sensible a los valores extremos, con lo que
en las distribuciones con gran dispersión de datos puede llegar a perder totalmente su significado.
Recordemos aquí la famosa anécdota del pollo, si una persona se come un pollo y otra no come
pollo, como media, entre las dos se habrán comido medio pollo cada una.
2. Se atribuye al dramaturgo irlandés Bernard Shaw la siguiente frase:"Si yo me como dos
pollos y tu ninguno, la Estadística afirma que cada uno de nosotros, en promedio, nos comemos un
pollo". Utilice Vd. la metodología estadística para precisar el alcance y crítica de la anterior
afirmación.
Solución.-
Si X = “nº de pollos que se come cada persona”, podemos construir la siguiente tabla de
frecuencia:
xinixinixi2xi2ni
0 1 0 0 0
2 1 2 4 4
Totales: 2 2 4
De donde: Media = 2
2= 1; Varianza = 4
2 – 1 = 1; Desviación típica =1; Coeficiente de
variación =
= 1
1 = 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22

Vista previa parcial del texto

¡Descarga apuntes estadistica y más Apuntes en PDF de Turismo solo en Docsity!

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

ÍNDICE Pág.:

  • DISTRIBUCIONES - PREGUNTAS TEÓRICAS ... 1 UNIDIMENSIONALES - PROBLEMAS ....................... 8
  • DISTRIBUCIONES BIDIMENSIONALES ...................... 14
  • NÚMEROS ÍNDICES ........................................................ 26
  • SERIES TEMPORALES .................................................... 28
  • PROBABILIDAD ............................................................... 30
  • INFERENCIA ESTADÍSTICA .......................................... 32

DISTRIBUCIONES UNIDIMENSIONALES (CAPÍTULOS 2, 3 Y 4)

PREGUNTAS TEÓRICAS.-

1. Señale las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución. Respuesta.- En el texto base podemos leer: Las principales ventajas de la media aritmética son las siguientes:

  • Es calculable en todas las variables, es decir siempre que nuestras observaciones sean cuantitativas.
  • Para su cálculo se utilizan todos los valores de la distribución.
  • Es única para cada distribución de frecuencias.
  • Tiene un claro significado, ya que al ser el centro de gravedad de la distribución representa todos los valores observados. El principal inconveniente es que es un valor muy sensible a los valores extremos, con lo que en las distribuciones con gran dispersión de datos puede llegar a perder totalmente su significado. Recordemos aquí la famosa anécdota del pollo, si una persona se come un pollo y otra no come pollo, como media, entre las dos se habrán comido medio pollo cada una. 2. Se atribuye al dramaturgo irlandés Bernard Shaw la siguiente frase:"Si yo me como dos pollos y tu ninguno, la Estadística afirma que cada uno de nosotros, en promedio, nos comemos un pollo". Utilice Vd. la metodología estadística para precisar el alcance y crítica de la anterior afirmación. Solución.- Si X = “nº de pollos que se come cada persona”, podemos construir la siguiente tabla de frecuencia: x (^) i n (^) i x (^) in (^) i x (^) i^2 x (^) i^2 n (^) i 0 1 0 0 0 2 1 2 4 4 Totales: 2 2 4

De donde: Media =

= 1; Varianza =

  • 1 = 1; Desviación típica =1; Coeficiente de

variación =

=

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

Así pues, aunque la media aritmética es 1, un coeficiente de variación igual a 1 supone una dispersión grande y debemos considerar que la media aritmética no es representativa de la población.

3. Señale las ventajas e inconvenientes de la media geométrica como medida de posición de una distribución. Solución.- En el texto base podemos leer: Las principales ventajas:

  • Es más representativa que la media aritmética cuando la variable evoluciona de forma acumulativa con efectos multiplicativos.
  • Cuando existe, es decir cuando la distribución no tiene valores negativos, y cuando está definida, es decir cuando la distribución no tiene valores nulos, su valor está definido de forma objetiva y es único.
  • Para su cálculo se tiene en cuenta todos los valores de la distribución.
  • Los valores extremos tienen una menor influencia que en la media aritmética. Los principales inconvenientes:
  • La mayor complicación de los cálculos.
  • Su indefinición (da números con naturaleza imaginaria) cuando tiene valores negativos y su valor nulo cuando una observación toma este valor. 4. Explique el significado del coeficiente de variación de Pearson en dos variables que tienen como media 110 y 30, respectivamente y, como varianza 1024 en el primer caso y 196 en el segundo. Solución.-

1ª variable: coeficiente de variación =

2ª variable: coeficiente de variación =

El coeficiente de variación de Pearson es una medida relativa de la dispersión mientras que la varianza (o la desviación típica) es una medida absoluta. En este caso, tiene mayor dispersión absoluta la 1ª variable pero, no obstante, posee menos dispersión relativa

5. Indique razonadamente cómo se comporta la media aritmética ante un cambio de escala y un cambio de origen en una variable. Solución.- Supongamos que sobre una variable X (^) i efectuamos un cambio de origen y de escala: Y (^) i = aX (^) i + b (multiplicar por a es un cambio de escala y sumar b es un cambio de origen) La media aritmética de Yi sería:

( )

r r r r i i i i i i i i 1 i 1 i 1 i 1

Y Y n aX b n a· X n b· n aX b N (^) = N (^) = N (^) = N =

= (^) ∑ = (^) ∑ + = (^) ∑ + (^) ∑ = +

es decir, la media aritmética queda afectada por el mismo cambio de origen y de escala.

6. Defina los conceptos estadísticos de población, marco estadístico, muestra e individuo o unidad estadística. Respuesta.- Población: Conjunto de elementos que cumplen una determinada característica (ej.: clientes de un hotel en una determinada fecha).

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

9. Defina la mediana y la moda de una distribución unidimensional de frecuencias e indique el inconveniente de ambas 10. ¿Cuál es el objetivo de las medidas de dispersión estadística? ¿cuáles son las principales que conoce? 11. ¿Es posible obtener la media geométrica de una distribución unidimensional de frecuencias en la que la variable toma algún valor nulo? Razone la respuesta Respuesta.- Puede obtenerse pero carece de significado ya que, al haber un valor nulo, el resultado es cero. 12. Defina el concepto de moda relativa y ponga un ejemplo de distribución unidimensional con una moda relativa Respuesta.- Un valor de la variable es moda relativa cuando su frecuencia es mayor o igual que la de sus valores contiguos. Ejemplo: x (^) i n (^) i 1 20 2 10 3 16 4 12 5 15 El 3 es moda relativa pues su frecuencia es mayor que las de sus valores contiguos. El 5 no es moda relativa pues, aunque su frecuencia es mayor que la de su valor contiguo por la izquierda, carece de valor contiguo por la derecha. El 1 tampoco es moda relativa por la misma razón anterior. Sin embargo es la moda, pues su frecuencia es mayor que las demás. 13. Defina el Coeficiente de Variación de Pearson y explique su significado. Respuesta.-

Se define el coeficiente de variación de Pearson CV = mediaaritmética X

Desviación típica σ = , y se trata de

una medida de dispersión relativa. Cuanto menor sea su valor absoluto, menor será la dispersión de los valores de la variable y, por tanto, mayor será la representatividad de la media aritmética. Se considera que si dicho valor es mayor que la unidad, la media debe descartarse como representativa de la población. 14. Defina los conceptos de parámetro, variable y atributo 15. Defina el concepto de mediana de una distribución de frecuencias y ponga un sencillo ejemplo de cálculo en una distribución unidimensional de tipo 1 con un número impar de observaciones

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

16. Defina el concepto de varianza de una distribución.

17. ¿En qué casos es preferible, por ser más representativa, utilizar la media geométrica en vez de la media aritmética? Respuesta.- Cuando los valores a promediar tengan entre sí una relación multiplicativa en lugar de aditiva. Por ejemplo cuando se trate de tasas de crecimiento. Ejemplo: las tasas de crecimiento de determinada magnitud a lo largo de cuatro periodos de tiempo han sido respectivamente 1,2; 1,5; 1, y 1,3 (esto quiere decir que la magnitud ha aumentado sucesiva y respectivamente el 20%, el 50% el

10% y el 30%). Entonces la tasa media habrá sido la media geométrica 4 1 , 2 · 1 , 5 · 1 , 1 · 1 , 3 ≅ 1 , 27.

18. Sí a una variable X (^) i la sometemos al mismo tiempo a un cambio de origen O y a un cambio de escala C ¿cuál o cuáles de las siguientes afirmaciones son falsas o correctas y por qué?

  • Los cambios de origen afectan a la media aritmética
  • Los cambios de escala afectan a la media aritmética
  • La varianza y la desviación típica sólo se ven afectadas por los cambios de escala. Respuesta.-

Las tres afirmaciones son correctas. En efecto, sea C

X O

Yi i

=. Entonces

C

X O

X O

C

n n

Xn O· n

C

n C

X O

n

Y

i

i i

i i i

i

i (^) = − = − 

∀ ∀ ∀

, es decir, la media se ve

afectada por el cambio de origen y de escala.

Además, Var(Y) = ( )  =

∑ −^ = ∑ ∑

∀ ∀ ∀i

i

2 i i

i

2 i i

i

2 i (^) C n

X X

n

n C

X O

C

X O

n

Y Y n n

= Var(X )

C

2 19. Explique cuándo y por qué es conveniente introducir ponderaciones en la media aritmética. Respuesta.- Cuando los valores de la variable a ponderar no se consideren todos igualmente importantes. Por ejemplo, la nota final de una asignatura obtenida promediando las notas obtenidas dos exámenes parciales, uno de ellos de más importancia que el otro

20. Explique los conceptos estadísticos de Rango, Recorrido, Amplitud total y Coeficiente de Apertura. Respuesta.- Ver U.D. pág. 90 y 91. 21. Indique las diferencias entre los conceptos estadísticos de Parámetro, Variable y Atributo Respuesta.- En el texto base explica que se denominan parámetros a las características poblacionales que deseamos investigar y que suelen ser desconocidas a priori. Por ejemplo, la edad de los viajeros de una compañía aérea, la nacionalidad de los visitantes un museo, el motivo de los viajes contratados en una agencia, etc. Cuando estas características son numéricas, es decir, cuando se pueden medir, se denominan variables (años de edad, renta anual en euros, etc.); por el contrario, cuando las características de la población no son susceptibles de medirse numéricamente reciben el nombre de atributos (el color del pelo, el sexo, la profesión, el estado civil, el grado de satisfacción del cliente con un servicio, etc...).

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

25. Indique un ejemplo en el que sea aconsejable introducir ponderaciones para el cálculo de la media aritmética. Respuesta.- En la página 47 de las U.D. proponen el siguiente ejemplo: supongamos que queremos hacer una selección de personas para la recepción de un hotel en el que se considera muy importante el conocimiento de inglés y menos importante el de otras materias como la estadística o el marketing; en el currículum vitae de un candidato tenemos información sobre las notas medias obtenidas en distintos bloques de conocimientos; se considera que la calificación de inglés debe ponderarse el doble que la del resto de materias: Materias Calificacione s

Coeficientes de ponderación Inglés 8 2 Marketing 6 1 Estadística 10 1

Entonces la nota media sería: 8 2 1 1

x =

26. Defina las medidas de simetría y apuntamiento de una distribución de frecuencias. Respuesta.- En el libro de texto (pág.: 87) se proponen cuatro medidas de asimetría:

El coeficiente de asimetría de Fisher:

( )

( )

2

3 n

i 1 i

2 i

n

i 1 i

3 i 3 x

3 1

x x n N

x x n N

m g

σ

=

=

El coeficiente de asimetría de Pearson: Ap = x

x Me σ

El coeficiente de asimetría de Bowley: C (^) a = 3 1

3 1 Q Q

Q Q 2 Me −

El coeficiente de asimetría de la hoja de cálculo Excel: ( )( ) ∑= 

n

I 1

3 i s

x x n 1 n 2

n A

En todos los casos, si el coeficiente es positivo hay asimetría a la derecha, si es negativo, hay asimetría a la izquierda y si es cero la distribución es simétrica.

Respecto a las medidas de apuntamiento, tenemos el coeficiente de Fisher, g 2 = 3

m

4

σ

y el

que usa la hoja de cálculo Excel: C =

( ) ( )( )( )

( ) (^) ( ) ( n 2 )( n 3 )

3 n 1 s

x x n 1 n 2 n 3

n n 1 n^2 i 1

4 i − −

. En ambos

casos, si el coeficiente es positivo, la forma de la distribución es más apuntada que la normal (leptocúrtica), si es cero es como la normal (mesocúrtica) y si es negativo es menos apuntada (platicúrtica). 27. Indique las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución ¿En que casos no es posible utilizarla? 28. ¿Existe siempre la moda en una distribución unidimensional de frecuencias? Razone la respuesta.

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

29. ¿Qué diferencia existe entre la desviación tlpica y la cuasi-desviación típica? ¿Qué propiedades poseen? 30. Indique las ventajas e inconvenientes de la media geométrica como medida de posición de una distribución ¿En que casos no es posible calcularla? 31. ¿Qué son los cuantiles de una distribución unidimensional de frecuencias? ¿Cuáles son los cuantiles más habituales? 32. Defina el concepto de tipificación de una variable ¿Cuál es la media aritmética de una variable tipificada? PROBLEMAS.-

1. En la siguiente distribución determinar los tres cuartiles, el séptimo decil y el 99º percentil.

x (^) i 1 3 4 5 7 9 n (^) i 10 20 30 20 27 13 Solución.- Añadamos la columna de frecuencias acumuladas: x (^) i n (^) i N (^) i 1 10 10 3 20 30 4 30 60 5 20 80 7 27 107 9 13 120 120 Tendremos:

Q 1 = 2

x 30 x 31 +

= 3,5; Q 2 = Me = 2

x 60 x 61 +

= 4,5; Q 3 =

x 90 + x 91 = 7;

D 7 = =

x 84 x 85 7; P 99 = x 119 = 9.

2. Calcular la mediana en las siguientes distribuciones: x (^) i 4 8 12 20 25

x (^) i 3 1 5 7

x (^) i 0 1 2 3 4 n (^) i 4 10 4 1 1

Solución.- En el primer caso la mediana es 12; en el segundo caso es 2

= 4; en el tercer

caso: x (^) i n (^) i N (^) i 0 4 4 1 10 14 2 4 18 3 1 19 4 1 20

→ Mediana = 1 2

x 10 x 11

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

Solución.- Ventas anuales en € de una (^) Y (^) i N° de agencias (^) Y (^) i·n (^) i 93.000 93 2 186 98000 98 3 294 112.000 11 4 448 118.000 11 5 590 165.000 16 6 990 190.000 19 8 1520 225.000 22 4 900 265.000 26 3 795 350.000 35 4 1400 400.000 40 6 2400 425.000 42 2 850 526.000 52 2 1052 575.000 57 1 575 50 1200

media aritmética de Yi = 240 → media de X (^) i = 240·1000 = 240000 moda absoluta de Y (^) i= 190 → moda absoluta de X (^) i= 190000 moda relativa de Y (^) i = 400 → moda relativa de X (^) i= 400000 moda relativa de Y (^) i = 526 → moda relativa de X (^) i= 526000

5. Calcular el coeficiente de variación de Pearson de la siguiente distribución de frecuencias L (^) i-L (^) i+1 n 0-10 20 10-20 50 20-30 60 30-40 40 40-50 30 50-60 10 Solución.- De la tabla: L (^) i-L (^) i+1 n (^) i x (^) i x (^) in (^) i x (^) i^2 x (^) i^2 ·n (^) i 0-10 20 5 100 25 500 10-20 50 15 750 225 11250 20-30 60 25 1500 625 37500 30-40 40 35 1400 1225 49000 40-50 30 45 1350 2025 60750 50-60 10 55 550 3025 30250 210 5650 189250 obtenemos:

X = 26, X 2 = 901, σ^2 = ( ) 2 2 X − X =177, σ = 13,

CV =

X

σ = 0,

Dado que el coeficiente de variación es < 0,5, podemos considerar que la media tiene una aceptable representatividad.

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

6. Con los siguientes datos referidos a una muestra de visitantes de un establecimiento hotelero. Datos de edad Número de visitantes menos de 10 años 2 de 10 a 15 años 35 de 15 a 25 años 45 de 25 a 35 años 33 de 35 a 45 años 35 de 45 a 55 años 50 de 55 a 65 años 40 más de 65 años 60 Total 300

Obtener: a) Las frecuencias acumuladas, las frecuencias relativas y las frecuencias relativas acumuladas. b) Las principales medidas de posición (media, mediana y modas absolutas y relativas) Solución.- Para precisar, supondremos los intervalos cerrados por la izquierda y abiertos por la derecha. Además, tomaremos el último intervalo igual a [65, 75]. Así tendremos: a) Datos de edad

Número de visitantes (n (^) i)

Marcas de clase (x (^) i)

Frecuencias acumulada s (N (^) i)

Frecuencias relativas (f (^) i)

Frecuencias relativas acumuladas (Fi)

x (^) i·n (^) i

Densidades de frecuencia

[0, 10[ 2 5 2 0 , 06 300

2 ) = 0 , 06 300

2 ) = 10 0 , 2 10

2

[10, 15[ 35 12,5 37 0 , 116 300

35 ) = 0 , 123 300

37 ) = 437,5 7 5

35

[15, 25[ 45 20 82 0 , 15 300

45 = 0 , 273 300

82 ) = 900 4 , 5 10

45

[25, 35[ 33 30 115 0 , 11 300

33 = 0 , 383 300

115 ) = 990 3 , 3 10

33

[35, 45[ 35 40 150 0 , 116 300

35 ) = 0 , 5 300

150 = 1400 3 , 5 10

35

[45, 55[ 50 50 200 0 , 16 300

50 ) = 0 , 6 300

200 ) = 2500 5 10

50

[55, 65[ 40 60 240 0 , 13 300

40 ) = 0 , 8 300

240 = 2400 4 10

40

[65, 75] 60 70 300 0 , 2 300

60 = 1 4200 6 10

60

Total 300 12837,

b) De la tabla obtenemos la media 42,791 6 300

x

= = ; la mediana Me = 45; la clase

modal absoluta es [10, 15] (la de mayor densidad de frecuencia) luego la moda absoluta:

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

c) La proporción total de quejas: puesto que se ha entrevistado a 100 clientes que hubieran podido presentar un máximo de 500 quejas (una por departamento) y sólo se han presentado 36, la proporción total de

quejas sería 500

= 0,072 es decir, un 7,

% de los clientes (en la muestra considerada) presenta alguna queja. La proporción de quejas que obtuvo cada departamento: La moda sería el departamento número 2, que es le que obtiene mayor número de quejas. Los distintos departamentos son modalidades de un atributo, no constituyendo una variable cuantitativa y por tanto el cálculo de la media aritmética no tiene sentido.

8. Calcular la media, la mediana y la moda de la masa salarial de una empresa con 1000 trabajadores que tiene la distribución adjunta de salarios por intervalos:

Solución.- Construimos la tabla:

Salario Mensual en euros

Marcas de clase

Nº de trabajadores x (^) i·n (^) i

Frecuencia acumulada N (^) i Li–1–Li (x (^) i) (n (^) i) 600-800 € 700 160 112000 160 Clase modal → (^) 800-1000 € 900 200 180000 360 1000-1200 € 1100 100 110000 460 Clase mediana → 1200-1400 € 1300 110 143000 570 1400-1600 € 1500 100 150000 670 1600-1800 € 1700 85 144500 755 1800-2000 € 1900 10 19000 765 2000-2200 € 2100 14 29400 779 2200-2400 € 2300 25 57500 804 2400-2600 € 2500 47 117500 851 2600-2800 € 2700 24 64800 875 2800-3000 € 2900 40 116000 915 3200-3400 € 3300 85 280500 1000

Departamento Nº de quejas Proporción

1 10 36

Salario Mensual en euros Li–1–Li

Nº de trabajadores (n (^) i) 600-800 € 160 800-1000 € 200 1000-1200 € 100 1200-1400 € 110 1400-1600 € 100 1600-1800 € 85 1800-2000 € 10 2000-2200 € 14 2200-2400 € 25 2400-2600 € 47 2600-2800 € 24 2800-3000 € 40 3200-3400 € 85

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

1000 1524200 de donde se obtiene:

Media = 1524, 1000

1524200 = (^) €; Mediana = L (^) i–1 + · 200 1272, 110

c 1200 n

N

N

i i

i 1 ≅

Moda = L (^) i–1 + (^) i i 1 i 1

i (^1) ·c n n

n

− +

9. La valoración de 0 a 10 del grado de satisfacción con los servicios recibidos por una agencia mayorista a partir de una muestra de 500 agencias minoristas es la siguiente:

Obtener la media aritmética de la valoración de los servicios ponderada por la importancia de las ventas de cada estrato y por el número de agencias e interpretar el significado de los resultados obtenidos. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES (CAPÍTULO 5 )

1º) Razone brevemente sobre los conceptos de Casualidad, Causalidad y Especificación de modelos estadísticos. (Junio 2003) Respuesta.- Consideremos en una población dos o más variables:

  • Es posible que exista relación entre ellas de modo que una variación de una o varias produzca como consecuencia una variación en otras, explicable mediante alguna teoría general (por ejemplo, de la teoría de la demanda se deduce que si aumentamos el precio, disminuye la demanda). En este caso decimos que existe relación de causalidad.
  • Es posible no obstante que encontremos relación entre las variables pero no exista modelo teórico lógico que fundamente la relación (por ejemplo, calificaciones obtenidas por 50 alumnos en una asignatura y producción de cereales de 50 provincias). Hablaremos en este caso de casualidad.
  • Así pues, al estudiar la relación entre variables, debemos especificar previamente un modelo teórico que recoja las principales relaciones de causalidad (por ejemplo, el nº de clientes de una cadena hotelera puede venir explicado por los precios de alojamiento, el número de turistas que visitan la localidad, etc.) 2º) En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones:

3 4 8 TOTAL 5 4 2 2 8 6 2 1 2 5 7 1 2 4 7 TOTAL 7 5 8 20

X Y

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

R = 11

20 02

m m · m

cumpliéndose que –1 ≤ R ≤ 1. Si es 1 ó –1, la varianza se compone exclusivamente de la varianza explicada, es decir, la varianza residual es nula y el ajuste de la nube de puntos a la recta de regresión es perfecto; si es cero entonces la varianza se compone exclusivamente de la varianza residual y la ecuación de regresión no es representativa. 4º) Una empresa quiere realizar un estudio sobre la influencia de las campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y sus ventas en los últimos 5 años: Años Gastos publicidad Ventas 1997 2,2 195 1998 2,5 200 1999 2,8 221 2000 2,9 230 2001 3,1 239 2002 3,5 248 a) Obtener un modelo lineal que permita predecir las ventas en función de los gastos en publicidad. b) Predecir las ventas de 2003 si se piensa invertir en publicidad 5 millones de euros. e) Valorar los errores obtenidos por la recta de regresión. (Junio 2003 reserva) Solución.- a) Consideramos la variable bidimensional (x (^) i, y (^) i) donde x (^) i = “gastos en publicidad”; y (^) i = “ventas”, tenemos la tabla:

x (^) i y (^) i x (^2) i y (^2) i x (^) i·y (^) i 2,2 195 4,84 38025 429 2,5 200 6,25 40000 500 2,8 221 7,84 48841 618, 2,9 230 8,41 52900 667 3,1 239 9,61 57121 740, 3,5 248 12,25 61504 868 Totales: 17 1333 49,2 298391 3823, de donde se deduce:

a 10 = 2,83333333 m (^) 20= 0, a 01 = 222,166667 m (^) 02= 373, m (^) 11= 7, de donde la recta de regresión de Y/X:

y – 222,17 =

(x 2,83) 0,

− ↔ y ≅ 45,35x + 93,

b) sustituyendo en la recta x = 5 → y ≅ 320,

c) El coeficiente de determinación R^2 =

7,81^2

≅ 0,9477, lo que indica que la recta de

regresión es representativa para realizar interpolaciones o extrapolaciones.

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

5º) Elabore una tabla tipo de una distribución bidimensional (X, Y) indicando el significado de los términos x 1 , x 2. ........ x (^) r ; y 1 , y 2 ......y (^) s ; n (^) i1, n (^) i2, .....n (^) is ; n (^) 1j , n (^) 2j , ...., n (^) rj ; n (^) i· ; n (^) ·j ; N. (Septiembre 2003)

Respuesta.- y x

y 1 y 2 ..... y (^) s

x 1 n 11 n (^12) ..... n (^) 1s n (^1) · x 2 n 21 n 22 ..... n (^) 2s n (^2) · .. .

. .....^

x (^) r n (^) r1 n (^) r2 ..... n (^) rs n (^) r · n · 1 n · 2 ..... n · s N

x 1 , x 2 , ..., x (^) r : valores de la variable X y 1 , y 2 , ..., y (^) r : valores de la variable Y n (^) ij : frecuencia del punto (x (^) i, y (^) j ), i = 1, 2, ..., 3; j = 1, 2, ..., s

n (^) i · = (^) ∑

s

j 1

n (^) ij es la frecuencia marginal de x (^) i.

n · j = (^) ∑

r

i 1

n (^) ij es la frecuencia marginal de y (^) j.

N = (^) ∑

s

j 1

n (^) j= (^) ∑

r

i 1

n (^) i = (^) ∑ ∀ i,∀j

n (^) ij es el total de individuos.

6º) Defina el coeficiente de correlación lineal e indique los valores que puede tomar y su significado. (Septiembre 2003) Respuesta.-

R = 20 02

11 m ·m

m

. Se cumple que –1 ≤ R ≤ 1. Si R = ±1, la correlación es máxima y los puntos (xi, y (^) j )

están en línea recta (las dos rectas de regresión coinciden), de pendiente positiva si R = 1 y de pendiente negativa si R = –1. Cuanto menor, en valor absoluto, sea R, mayor será el ángulo que formen entre sí las rectas de regresión. Si R = 0, no existe correlación y las rectas de regresión y = a 01 , x = a 10 , son perpendiculares. 7º) Se ha efectuado una encuesta a 20 agencias de viaje preguntando por su situación respecto a dos variables de interés (nº de clientes diarios y nº de trabajadores); en estas encuestas se han obtenido los siguientes resultados Nº de trabajadores Nº de clientes

1 2 3 total

6 2 1 2^ 5

7 1 2 4^ 7

total 7 5 8 20 Obtener los momentos de orden 1 y 2 respeto a la media y respecto al origen de esta distribución y estudiar la posible dependencia entre ambas variables. (Septiembre 2003)

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

9º.- En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones:

y (^) i x (^) j

1 2 3 TOTAL

TOTAL 4 5 9 18

Se pide: a) Construya las distribuciones marginales de frecuencias de las variables x e y b) Calcule la media aritmética, la desviación típica y el coeficiente de variación de Pearson c) Calcule la covarianza de la distribución conjunta de ambas variables (Junio 2004) Solución.- a) y b) Distribución marginal de la x Distribución marginal de la y x (^) j n (^) j· x (^) j ·n (^) j· x (^) j^2 x (^) j^2 n (^) j· y (^) j n (^) ·i y (^) j ·n (^) ·i y (^) j^2 y (^) j^2 n (^) ·i 0 4 0 0 0 1 4 4 1 4 3 6 18 9 54 2 5 10 4 20 5 8 40 25 200 3 9 27 9 81 18 58 254 18 41 105

x = a 10 = 18

≅ 3,22 y = a 01 = 18

x 2 = a 20 =^ 18

≅ 14,11 y 2 = a 02 = 18

S (^) x = m 20 = a 20 −a^210 ≅ 1,93 S (^) y = m 02 = a 02 −a^201 ≅ 0,

CV (^) x = x

S (^) x ≅ 0,60 CV (^) y = y

S (^) y ≅ 0,

c) Calculamos x (^) j ·y (^) i·n (^) ji,

y (^) i x (^) j

y sumando obtenemos (^) ∑ j,i

x (^) j yinji= 147, de donde (^18)

x· y= a 11 = ≅ 8,17. Así pues,

Cov(X,Y) = m 11 = a 11 – a 10 ·a 01 ≅ 0, 10º.- La siguiente tabla de distribución de frecuencias indica, para 2 variables, la relación existente entre las ventas medias de un complejo turístico y las temperaturas medias observadas durante un conjunto de años.

TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

Temperatura media durante el verano en grados centesimales (X (^) i)

Ventas en euros de un complejo turístico (Y (^) i) 25 6, 27 7, 30 9, 28 8, 31 9, 30 8,

Obtener: a) Un diagrama o gráfico de dispersión b) La recta de regresión entre la variable dependiente Yi y la independiente X (^) i (Jun. 2004-2ª) Solución.- a) Representaremos la nube de puntos:

6

6,

7

7,

8

8,

9

9,

24 25 26 27 28 29 30 31 32 Temperatura

Ventas

b) La recta de regresión entre la variable dependiente Yi y la independiente Xi es la recta

X/Y: x–a 10 = 02

11 m

m (y–a 01 )

Temperatur a media durante el verano en grados centesimales (X (^) i)

Ventas en euros de un complejo turístico (Y (^) i)

X (^) i·Y (^) i X (^) i^2

25 6,5 162,5 (^625) (^27 7 189 ) 30 9 270 900 28 8,5 238 784 (^31 9 279 ) 30 8,2 (^246 ) 171 48,2 1384,5 (^4899)

a 10 = 28,5 m11= 1, 20

11 m

m = 0,

a 01 = 8,03 m 20 = 4, a 11 = 230, a 20 = 816,