Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística administrativa, Apuntes de Estadística Empresarial

Asignatura: Estadistica administrativa, Profesor: Pedro Nicolas Teran Agraz, Carrera: Gestión y Administración Pública, Universidad: UNIOVI

Tipo: Apuntes

2014/2015

Subido el 01/06/2015

silrguez
silrguez 🇪🇸

3.9

(32)

17 documentos

1 / 30

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
2012/13
Estadística Administrativa
2º GAP
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Vista previa parcial del texto

¡Descarga Estadística administrativa y más Apuntes en PDF de Estadística Empresarial solo en Docsity!

Estadística Administrativa

2º GAP

TEMA 3

Métodos de muestreo

Muestra y censo

Para obtener conclusiones seguras sobre una población, p.ej. cuántos ciudadanos están a favor de una modificación de la ley, lo mejor sería estudiar a todos los individuos, de forma que el resultado obtenido sea exacto sin ninguna duda. Esto se llama realizar un censo ; en la práctica, lo que se hace es seleccionar una muestra formada por parte pero no todos los individuos de la población.

El objetivo del muestreo es poder alcanzar conclusiones más rápido y con menos coste, sin perder un alto grado de fiabilidad, es decir, teniendo una medida numérica del riesgo de equivocarnos en esas conclusiones y en las decisiones que tomemos a partir de ellas.

Razones para usar una muestra en lugar de un censo

  1. Sería demasiado caro o se tardaría demasiado tiempo. Ej.: Examinar en una auditoría todas y cada una de las nóminas emitidas en un año por Iberia (20.000 trabajadores).
  2. Sería absurdo. Ej.: Hacer una encuesta electoral preguntando a todos los electores; para eso ya está el día de las elecciones.
  3. Sería innecesario. Ej.: Hacer un control de calidad a todos los yogures que se fabrican, siendo que los fabricados a la vez son idénticos.
  4. A veces, examinar un individuo implica destruirlo o dejarlo inutilizable. Ej.: Comprobar la vida útil de una bombilla, hacer un test de rotura a una pieza de metal.
  5. A menudo, se puede sacar conclusiones con la precisión requerida y con un alto grado de fiabilidad examinando solo una pequeña parte de los individuos.

Ejemplo

Si sospechamos que se puede estar produciendo un fraude en la adjudicación de subvenciones, habiéndose concedido 2400 en total, podríamos tomar ya la decisión tras inspeccionar tan solo 131 subvenciones, descartando el fraude si menos de 6 de ellas presentan anomalías. Aunque inspeccionemos "tan pocas" subvenciones, en este caso el riesgo de equivocarnos sería tan solo del 5%. Este es el tipo de problemas es el que aparece en la asignatura optativa de 3º Técnicas Estadísticas de Auditoría y Control.

Preguntas que se plantean al hacer un muestreo

Lógicamente, son dos:

  1. ¿Cuántos individuos tenemos que examinar para garantizar la fiabilidad de las conclusiones?
  2. ¿Cuál sería la mejor manera de escogerlos?

sea lo más representativa posible de toda la población, para que las conclusiones obtenidas de la muestra sean parecidas a las que obtendríamos de estudiar toda la población.

Algunos muéstreos no probabilísticos, como el muestreo por cuotas, intentan asegurar que la muestra sea razonablemente representativa, pero aun así se puede incurrir en sesgos debido a, por ejemplo:

  1. Hechos que el investigador desconoce o ha pasado por alto. Ej.: Supongamos que el uso de las redes sociales depende de algo que no imaginamos, como si la persona hace deporte o no. El uso de cuotas no garantiza que haya la misma proporción de personas que hacen deporte en la muestra que en la población: puede ser desde que todos hagan deporte a que ninguno lo haga. Otro ej.: el auditor investiga un posible fraude en Compras y decide (muestreo opinático) no entrevistar a nadie de Inversiones, pero no sabe que mandos intermedios de Compras fueron transferidos a Inversiones porque no se prestaron a participar en el fraude.
  2. Falta de independencia entre los encuestados. Ej.: Si hacemos una encuesta en un punto de Gijón, puede ser que a una hora haya muchas madres que van a buscar a los niños al colegio, a otra hora empleados de oficina que salen de trabajar, a otra hora obreros, y a otra hora gente que no tiene que levantarse pronto al día siguiente. Dependiendo de la hora, los resultados serán unos u otros.
  3. Sesgo de autoselección : en el muestreo de bola de nieve y en las encuestas online solo participan personas que "se presentan voluntarias" para hacerlo. Estas no necesariamente son representativas de toda la población. Ej.: Las encuestas en webs de medios de comunicación tienden a coincidir con la línea editorial del medio, ya que los lectores de la web están mayoritariamente de acuerdo con esa línea. Si preguntamos sobre el grado de acuerdo con la huelga general, no saldrá lo mismo en la web de Intereconomía que en la de Mundo Obrero.

La mayor parte de esos sesgos se pueden paliar o evitar seleccionando la muestra al azar, es decir, usando alguna forma de muestreo probabilístico en la medida de lo posible.

Ejemplos de muestreo probabilístico

Muestreo aleatorio : Se caracteriza por que, cada vez que se selecciona un individuo, los restantes tienen la misma probabilidad de ser elegidos. Puede ser con reemplazamiento ( con reposición ), si el mismo individuo puede ser elegido más de una vez para formar parte de la muestra; y sin reemplazamiento ( sin reposición ), si los individuos elegidos son estudiados y excluidos del estudio en lo sucesivo.

Ejs.: Dos encuestadores eligen personas al azar en los dos extremos de una calle y cada uno no sabe a qué personas ha preguntado el otro ( con reemplazamiento, porque los dos podrían preguntar a la misma persona ). Un auditor examina 50 facturas al azar ( sin reemplazamiento, porque no tiene sentido que examine la misma factura dos veces ).

Muestreo por unidad monetaria : A la hora de hacer una auditoría, no es lo mismo un fraude en la compra de una maquinaria de 240 000 € que en una caja de clips de 1 €. En el muestreo por unidad monetaria, la probabilidad de seleccionar una operación es proporcional al valor

monetario involucrado. De esta forma se desincentiva el fraude en las grandes operaciones ya es muy probable que sean investigadas en detalle.

Muestreo estratificado : La población se divide en grupos (estratos) lo más homogéneos posible y se muestrea al azar dentro de cada grupo. Los individuos de cada estrato deberían ser lo más parecidos posible entre sí, y lo más distintos posible de los de los otros estratos. Ej.: En unas elecciones universitarias, se podría tomar a profesores, alumnos y personal como estratos distintos. Otros ejemplos de variables para estratificar podrían ser el sexo, el nivel de estudios, ser ocupado, parado o jubilado, etc.

El interés de este muestreo suele ser: garantizar que estratos pequeños están adecuadamente representados en la muestra ( un muestreo universitario al azar podría incluir solo alumnos y ningún profesor ), estudiar la influencia de una variable ( p.ej. ¿utilizan Internet por igual los ocupados y los parados? ), o reducir el tamaño de la muestra.

Muestreo por conglomerados : La población se divide en grupos (conglomerados) lo más heterogéneos posible, se seleccionan conglomerados al azar y se forma la muestra con todos sus individuos. Ej.: El ayuntamiento quiere saber si los vecinos de una calle con 24 portales están a favor de que se reasfalte la calle pagando parte del coste; para ello, escogen 3 portales al azar y preguntan a todos los vecinos de esos portales. Otro ejemplo sería la facturación de una empresa: si hay 58 lotes de facturas, un auditor puede coger 5 al azar y examinar todas las facturas de esos lotes.

Se busca conseguir la misma representatividad con más comodidad y menos coste: es más rápido preguntar en todos los pisos de 3 portales que preguntar al mismo número de personas repartido por los 24 portales de la calle.

¿Cuál es la diferencia entre muestrear por cuotas, por estratos y por

conglomerados?

En el muestreo por cuotas no necesariamente se selecciona al azar, sino que se toman los individuos que resulte más cómodo siempre que tengan las características que definen esa cuota ( p.ej. ser mujer soltera trabajadora de 40 a 50 años ). En el muestreo por estratos y por conglomerados, se selecciona al azar.

En el muestreo estratificado se divide la población en estratos que son cada uno más homogéneo que toda la población. Por ejemplo, los habitantes de una sección censal (calles cercanas del mismo distrito) presumiblemente tendrán un uso de las nuevas tecnologías más parecido que una muestra de gente de toda España.

Las cuotas no tienen por qué ser más homogéneas que la población. Por ejemplo, en los estudios de audiencia no se definen las cuotas en función de si te gustan más las series, el fútbol o las películas románticas, que es lo que marcaría grupos de audiencia homogéneos, sino en función de variables demográficas como el número de hijos, el lugar de residencia, etc.

En el muestreo por conglomerados se intenta que cada conglomerado sea tan heterogéneo como toda la población. Por ejemplo, para detectar un fraude continuado en el IVA nos vale

Estadístico : cualquier función que se calcula operando con los valores de la muestra. Se suele usar la letra T.

Intervalo de confianza

Es un intervalo en el que es muy fiable afirmar que está en valor verdadero del parámetro. Una cantidad que nos interesa pero no la conocemos.

Como obtener un intervalo de confianza para un parámetro:

a) Media poblacional (μ) b) Proporción poblacional (p)

Pasos:

  1. ¿Para qué parámetro es el intervalo de confianza? ¿Qué estadístico vamos a utilizar? Comprobar que se cumplen las condiciones para usarlo.

Tenemos un estadístico T, que en este caso siempre sigue el modelo N(0,1)  se hará con la tabla se la normal (en otros casos no es así)

  1. Buscamos dos valores “a y b” que cumplen:

P(a ≤ T ≤ b) = “Grado de confianza que queremos tener” = (1 – α)  nivel de confianza : si hacemos muchos intervalos de confianza a la larga nos acercamos ese % de veces (0’9, 0’95, 0’99)

  1. Despejar en esa formula el valor del parámetro. No lo vamos a tener que hacer porque está en la hoja de fórmulas.

¿Cuándo se utiliza cada estadístico?

Dos posibilidades:

  1. Intervalo de confianza para la media μ.

  2. Sustituir

  • (a, b)  por su valor
  • (1-α)  por su valor
  • (T)  por el estadístico elegido

̅ − μ 𝜎 𝑛

  • La desviación típica poblacional (𝜎) es conocida
  • X es normal ó n ≥ 30

̅ − μ 𝑆 𝑛 − 1

  • 𝜎 es desconocida  (S) Desviación típica de la muestra
  • n ≥ 100
  1. Intervalo de confianza para la proporción P.

Si hacemos muchos intervalos de confianza, a la larga acertaremos ese % de veces (90%, 95%, 99%)

𝑝 − 𝑝 𝑝 · ( 1 − 𝑝) 𝑛 − 1

  • necesitamos n ≥ 100

𝑝 − 𝑝 𝑝 · ( 1 − 𝑝) 𝑛 •^ NO SE USA PARA INTERVALOS DE CONFIANZA

  1. En el Principado de Asturias hay 458 empresas que han realizado actividades de innovación en el último año, con un gasto total en innovación tecnológica de 164018€. Supongamos que en una consulta a 25 empresas seleccionadas al azar se obtiene un gasto medio en innovación tecnológica de 384€, con una desviación típica de 121€. ¿Cuál es la media poblacional? ¿Qué estadístico utilizarías para estimarla? ¿Cuál es su valor? El valor de 121€ ¿es la desviación típica poblacional, o la muestral?

SOLUCION : La media poblacional es 358'12€. Utilizaríamos la media muestral. Su valor es 384€. 121€ es la desviación típica muestral.

  1. En los últimos ocho días laborables se ha dado en España una demanda de energía eléctrica (en GWh) de 704, 726, 696, 701, 709, 706, 700 y 683. Sabemos por estudios anteriores que la demanda sigue aproximadamente una distribución normal con una desviación típica de 12 GWh. a) Obtener un intervalo de confianza, al nivel 0'95, para la demanda media de energía eléctrica. b) Interpretar el intervalo obtenido. c) ¿Cuál es el error máximo de estimación en ese intervalo? d) Si quisiéramos que ese error fuese como mucho de 6 GWh, ¿cuáles de las siguientes opciones serían válidas: aumentar el tamaño muestral; aumentar el nivel de confianza; disminuir el tamaño muestral; disminuir el nivel de confianza? cuantos más datos tengamos (n = mayor) y el error será más pequeño (e = menor) e) Si adoptamos un nivel de confianza del 90%, ¿se cumplirá que el error máximo estaría por debajo de 6 GWh? ¿Cuál sería el intervalo de confianza correspondiente?

a) μ = IC = 0’ ̅ = 703’

[ 1 − 1 ]  [ 1 11 ]

b) Es un intervalo de confianza con un 95% de confianza, es decir, si hiciéramos muchos intervalos con este método, el 95% de las veces la demanda media de electricidad estaría dentro del intervalo, y el 5% no, por lo que confiamos en que la media si esta entre 694’81 y 711’45.

c) Margen de error = 8’

e) 1 – α = 0’9  ¿e ≤ 6? No  1

  1. En las pasadas elecciones autonómicas de Cataluña, una encuesta otorgaba a CiU un porcentaje de voto del 39'4% en Tarragona, a partir de una muestra de 250 personas. a) Obtener un intervalo de confianza, al nivel 0'90, para la proporción de votantes de CiU en Tarragona. b) ¿Cuál es el error máximo de estimación en ese intervalo? c) La encuesta dice que su margen de error es del 2'94% (es decir, 0'0294). ¿Es lo mismo que te sale a ti? ¿A qué crees que se puede deber?
  1. En una encuesta realizada a 200 empresas farmacéuticas se obtiene que el 74'1% de ellas ha realizado innovaciones tecnológicas en el último año. a) Obtener un intervalo de confianza, al nivel 0'99, para la proporción de empresas farmacéuticas que han realizado innovaciones tecnológicas en el último año.

N = 200 𝑝 = 0’ 741

Condición n ≥ 100 como n = 200 la condición se cumple

√ ̂ (̂^ )

[ 1 1]

INTERPRETACION:

Podemos afirmar con una confianza del 99% que la proporción de empresas que han realizado innovaciones tecnológicas en el último año, esta entre 66’1 y 82’1 de las empresas. Es decir, si hiciéramos muchos intervalos con este método el 99% de ellos acertarían, por lo que tenemos la confianza de estar dentro de ese 99%.

  1. Una persona ha anotado 36 veces el tiempo que ha esperado por el autobús Nº1. Por término medio ha esperado 6'2 minutos. Sabemos que la desviación típica del tiempo de espera en esa línea es de 3'7 minutos. Obtener un intervalo de confianza para el tiempo de espera, con una confianza del 80%.

̅ =6’ 2 𝜎 = 3’ 7

Condiciones:  𝜎 conocidaX normal ó n ≥ 30 como n = 36 la condición se cumple

α = 0’2  λα = 1 ’ 282

) (−1 ̅√ 1 )

4) [ ̅ −̅ ]
√𝑛^
[ − ]  [ 1 ]

1) IC para la media μ • •^ 𝜎𝜎^ conocida (nos dadesconocida (nos da S)^ 𝜎 )^ ^ 1º estadistico

  1. Un auditor del Estado ha examinado las concesiones de ayudas al estudio por parte de una comunidad autónoma. De un total de 47148 ayudas concedidas, ha seleccionado 343 expedientes al azar resultando que en 9 casos los solicitantes no reunían todas las condiciones establecidas en la convocatoria. a) Obtener un intervalo de confianza para la proporción de solicitantes que recibieron la ayuda sin cumplir todas las condiciones, con una confianza del 95%.

SOLUCION : El intervalo sería [0'0093, 0'0431]. (El dato de 47148 no se usa para nada en este apartado.)

b) Multiplicando por 47 148, obtener un intervalo de confianza para el número de solicitantes que recibieron la ayuda sin cumplir todas las condiciones.

SOLUCION : Al multiplicar por 47 148 resultan 438'48 y 2032'08. Como el número de solicitantes tiene que ser entero, podemos dar como intervalo [439, 2032]

c) ¿Qué quiere decir que la confianza de ese intervalo es el 95%?

SOLUCION : Quiere decir que al calcular un gran número de intervalos por el mismo método, basados cada uno en 343 expedientes, el 95% de ellos contendrían al verdadero número de solicitantes que recibieron la ayuda sin cumplir todas las condiciones. No sabemos si realmente ese número está entre 439 y 2 032 o no, pero confiamos en no estar en el 5% de intervalos que se equivocan y sí en el 95% de intervalos que aciertan.

  1. Se vuelca un saco que contiene 400 monedas, resultando 213 caras. Obtener un intervalo de confianza, al nivel 0'95, para la probabilidad de obtener cara con una de esas monedas.

SOLUCION : El intervalo sería [0'4835, 0'5815].

TEMA 5

Contrastes de hipótesis

El objetivo es llegar a una conclusión a partir de los datos, normalmente para tomar una conclusión.

Ejemplo :

1) Un auditor examina las facturas de una empresa para averiguar si ha producido un fraude en el IVA.

2) En un juicio hay 2 hipótesis (inocente y culpable)

Datos  estadístico  Decidir qué hacer con la hipótesis

Las hipótesis son:

 H 0  hipótesis nula ( inocente ) escoger siempre en caso de duda.  H 1  hipótesis alternativa ( culpable )

Procedimiento:

  1. Se parte de suponer que H 0 es cierta ( inocente )
  2. Se examinan los datos – muestra- ( pruebas )
  3. Si los datos se contradicen rechazamos H 0 y queda “demostrado” que H 1 es cierta ( culpable – si las pruebas indican que es culpable, rechazamos que sea inocente)

Juicio =

(Más importantes) juicio = liberar culpables

 ERROR TIPO 1: H 0 es cierta y la rechazamos. ( es inocente y lo declaramos culpable )  ERROR TIPO 2: H 0 es falsa y la aceptamos. ( es culpable y lo declaramos inocente )

Intentamos que el porcentaje de errores sea el menor posible. Como no se pueden reducir las dos a la vez, se reduce el más importante. (ERROR TIPO 1)

Nivel de Significación

Es la probabilidad de cometer el error tipo 1 que vamos a admitir.

2 decisiones

  • a) actuar bien no hacer nada
  • b) actuar mal  abrir un expediente hipótesis

Aceptar H 0 Rechazar H 0

H 0 Cierta Acierto ERROR TIPO 1

H 0 Falsa ERROR TIPO 2 Acierto

CONDENAR INOCENTES