Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Descriptiva: Elementos Básicos y Probabilidad, Apuntes de Estadística Inferencial

Estadistica descriptiva preguntas

Tipo: Apuntes

2019/2020

Subido el 08/05/2023

lany-perez
lany-perez 🇸🇻

4 documentos

1 / 29

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
gina 1 de 29
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
PROBABILIDAD Y ESTADÍSTICA
UNIDAD I: ESTADÍSTICA DESCRIPTIVA
Temas:
1.1 Elementos y definiciones básicas de estadística descriptiva.
1.2 Análisis descriptivo de datos empleando herramientas
informáticas.
1.3 Elementos de muestreo.
OBJETIVO DE LA UNIDAD
Aplicar el análisis descriptivo a un conjunto de datos usando una herramienta
informática.
INTRODUCCIÓN
Los temas a desarrollar en esta unidad son los siguientes:
1.1. Elementos y definiciones básicas de estadística descriptiva.
1.2. Análisis descriptivo de datos empleando herramientas informáticas.
1.3. Elementos de muestreo.
1.4. Análisis exploratorio de datos parte gráfica.
1.5. Análisis exploratorio de datos parte tabular.
1.6. Medidas de Tendencia Central.
1.7. Medidas de dispersión y forma.
Estudiaremos estos contenidos en tres semanas. La primera semana estudiamos
los numerales 1.1 a 1.3, los numerales 1.4 y 1.5 en la segunda semana y finalmente en la
tercera semana los numerales 1.6 y 1.7.
1.1. ELEMENTOS Y DEFINICIONES BÁSICAS DE ESTADÍSTICA DESCRIPTIVA
Mostramos la importancia de la estadística, simplemente haciendo un recorrido
por lo que uno puede apreciar en los noticieros televisivos, la prensa escrita, los informes
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d

Vista previa parcial del texto

¡Descarga Estadística Descriptiva: Elementos Básicos y Probabilidad y más Apuntes en PDF de Estadística Inferencial solo en Docsity!

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 1 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del

PROBABILIDAD Y ESTADÍSTICA

UNIDAD I: ESTADÍSTICA DESCRIPTIVA

Temas:

1.1 Elementos y definiciones básicas de estadística descriptiva.

1.2 Análisis descriptivo de datos empleando herramientas

informáticas.

1.3 Elementos de muestreo.

OBJETIVO DE LA UNIDAD

Aplicar el análisis descriptivo a un conjunto de datos usando una herramienta informática.

INTRODUCCIÓN

Los temas a desarrollar en esta unidad son los siguientes: 1.1. Elementos y definiciones básicas de estadística descriptiva. 1.2. Análisis descriptivo de datos empleando herramientas informáticas. 1.3. Elementos de muestreo. 1.4. Análisis exploratorio de datos parte gráfica. 1.5. Análisis exploratorio de datos parte tabular. 1.6. Medidas de Tendencia Central. 1.7. Medidas de dispersión y forma. Estudiaremos estos contenidos en tres semanas. La primera semana estudiamos los numerales 1.1 a 1.3, los numerales 1.4 y 1.5 en la segunda semana y finalmente en la tercera semana los numerales 1 .6 y 1.7.

1.1. ELEMENTOS Y DEFINICIONES BÁSICAS DE ESTADÍSTICA DESCRIPTIVA

Mostramos la importancia de la estadística, simplemente haciendo un recorrido por lo que uno puede apreciar en los noticieros televisivos, la prensa escrita, los informes

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 2 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del que ofrecen las diferentes instancias y organizaciones tanto locales como mundiales en revistas científicas y a través de Internet. Nos muestran casos como, por ejemplo, el del control epidemiológico de enfermedades que nos afectan no solo como país, sino que también como región, tales como la del Zika y el dengue, por mencionar algunas. Lo mismo sucede al escuchar las estadísticas provenientes de organizaciones que se encargan de observar los cambios atmosféricos para elaborar sus pronósticos del tiempo. También los informes de las instituciones financieras que se encargan de observar el movimiento del flujo de valores. Así como también el de las empresas que se interesan por los pronósticos de demanda y venta de los productos que ofrecen. Sin dejar de mencionar el interés de los institutos políticos por las encuestas de opinión que les ayudan a descifrar sus oportunidades de nominación en próximas elecciones. Y estoy seguro que el lector será capaz de incrementar este listado de casos en los que la estadística hace su aparición en escena, en temas de educación, seguridad, violencia, trabajo infantil, etc. Vale la pena mencionar que, como un valor agregado como parte de nuestro estudio de esta asignatura, está el de entender lo que otros publican en lo que a estadísticas se refiere, o al menos, tener un sano juicio para realizar una evaluación objetiva a de los resultados estadísticos que otros ofrecen. Hay que tomar en cuenta que cuando uno habla de estadística, inmediatamente viene a nuestra mente que es algo que tiene que ver con datos o información numérica, y que los resultados expuestos están sujetos a error. Entonces vamos a proceder a definir lo que entenderemos por la disciplina científica denominada “Estadística”. Existen varias definiciones, como era de esperarse. Así como también hay toda una historia relacionada con su nombre, su procedencia, su primer uso y sus principales impulsadores puede leer (Levin & Rubin,2004) para encontrar algo al respecto. No nos vamos a enfocar en esta historia, ni vamos a dedicar mucho esfuerzo a comparar las distintas definiciones, sin embargo, mencionaremos las que a nuestro juicio son las que mejor identifican el concepto y que resultan ser las de mayor aceptación. Definición 1 : Es la ciencia que se encarga del diseño de estudios o experimentos, la colección de datos y el modelaje/análisis de dichos datos para el propósito de tomar decisiones y hacer descubrimientos científicos cuando la información disponible es tanto

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 4 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del votantes. Porque resultaría extremadamente caro realizar esta actividad, y siempre habría oportunidad de error, debido a que durante el tiempo en el que se desarrolle dicha actividad, muchos de los entrevistados ya no estarán para las votaciones (por muerte o migración). Además del riesgo que correrían los entrevistadores en algunos lugares de nuestro país, lo cual podría hacer que dichos votantes no se incluyan en la población de votantes total. En este caso el procedimiento que ellos utilizan es, por ejemplo, elegir a unos 1000 habitantes de la población activa para votar, para estimar las preferencias de los votantes en todo el país. Lo que resulta sorprendente en este tipo de casos, es que, si las personas se eligen apropiadamente, y las preguntas se les hacen evitando la ambigüedad y no son preguntas orientadas a obtener respuestas prefijadas, entonces la fracción de personas que comparten una opinión particular será muy próxima a la fracción de personas de toda la población de votantes que comparten dicha opinión. Ejemplo 3: Suponga que una empresa de fabricación de productos farmacéuticos está tratando de probar el efecto que un nuevo medicamento tendrá en pacientes de cierta patología. Para ello, luego de superar todos los aspectos relativos al protocolo de aplicación en pacientes humanos, decide aplicar el medicamento a un cierto grupo de pacientes, digamos unos 250 pacientes. Y con los resultados observados en ellos, hacer una inferencia a cerca del efecto que este nuevo medicamento tendrá en todos los futuros pacientes que tengan esta patología. Ahora trataremos de identificar los conceptos básicos que son comunes o afines en estos tres ejemplos. En primer lugar, debemos tomar en cuenta que existe algo que no se puede determinar con anticipación en cada caso, y eso es debido a la presencia de azar o aleatoriedad en los procesos. Sabemos que los artículos producidos pueden estar en buen estado o dañados, pero no sabremos antes de la observación del artículo, si está bueno o dañado. Sabemos las posibilidades de votación que tienen las personas antes de la votación, sin embargo, no podemos predecir con certeza por quién votará cada una. Y como el voto en general en un sufragio es secreto, incluso luego de la votación no sabremos en realidad por quién votó, a menos que vayamos a revisar papeleta por papeleta y verifiquemos con los respectivos números de identificación personal. Pero eso es un privilegio que solo lo tienen las instituciones a cargo de las elecciones y no es de conocimiento común. Para el último caso, la aplicación del medicamento puede ser que en algunos pacientes funcione y en otros no funcione, esto debido a otras características de las personas aparte de la patología. Así que, se sabe que puede tener un efecto positivo o no, pero no se puede apreciar sino hasta después de haber realizado el experimento y tomado la observación.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 5 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del En todos los ejemplos podemos también notar que hay un grupo mayor y un grupo menor de objetos o personas observadas. Al grupo mayor se le denomina “población” y al grupo menor se le llama “muestra”. La muestra es entonces una parte de la población. Para elegir a la muestra de la población se usa una metodología llamada “muestreo” (“sampling” en inglés), hablaremos de este tema un poco más adelante. Así, podemos identificar la población del primer ejemplo, como la producción total de un día de trabajo de la fábrica, las 10,000 unidades producidas. Para el segundo ejemplo, la población está formada por todas las personas en edad de votar de un país o región. Y en el último ejemplo, la población es indeterminada, pero consiste de todas las personas que poseerán la patología que se está tratando con el nuevo medicamento. Otro elemento a tomar en cuenta es que todos tienen que ver con la recopilación de datos o mediciones. Se toma una medición para cada elemento de la muestra. Estas observaciones en ocasiones son datos cuantitativos (cuando se registran edades, niveles de ingresos, pesos, tallas, etc.). Pero en ocasiones son datos cualitativos como el género, el sexo, la preferencia política, estado operacional, etc.). Generalmente lo que se hace es asignar un equivalente numérico a las categorías cualitativas de la variable. Por ejemplo, al sexo se le puede asignar el valor - 1 para hembra y un 1 para macho, o un 0 para el género femenino y un 1 para el masculino o viceversa, basta definirlo y ser consistente con dicha definición. Otro elemento a considerar en la toma de las observaciones es que a veces para caracterizar mejor a los sujetos bajo observación habrá necesidad de tomar otros datos que son propios de los objetos o personas investigadas tales como sexo, edad, talla, peso, nivel educativo, etc. Para que al comparar las respuestas de la variable principal de observación se pueda hacer contrastes de opiniones con diferentes grupos de sujetos, por ejemplo, si se diferencian entre hombres y mujeres, o por ciertas edades, o si hay diferencias para ciertas tallas, o por cierto nivel educativo, o de ciertas zonas geográficas, etc. Finalmente, un cuarto aspecto a considerar es el objetivo que se pretende con este estudio, y es el de obtener a partir de la muestra observada conclusiones para el total de la población, este procedimiento se llama “inferencia estadística”. Para ello será necesario hacer un análisis de los datos obtenidos, interpretar dicho análisis y comunicar adecuadamente los resultados obtenidos. Ahora procedemos a concretizar las definiciones anteriores. Pero ampliaremos dichos conceptos en el numeral 1.3, cuando veamos los elementos del muestreo.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 7 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del toda la población de peces, y selecciona una cantidad de 50 tilapias del total que se encuentra en un criadero, para alimentarlas con el concentrado. a. Identifique la población de mediciones que son de interés para el empresario. b. Identifique la muestra. c. ¿Cuáles son las características de la población que son de interés para el empresario? d. Si las mediciones de la muestra se usan para hacer inferencia, acerca de cierta característica de la población, ¿Por qué sería importante una medida de la confiabilidad de la inferencia?

1.2. ANÁLISIS DESCRIPTIVO DE DATOS USANDO HERRAMIENTAS

INFORMÁTICAS

La herramienta informática a usar se llama Scilab 6.0.0^1 ©. Scilab, es un software en la categoría de open source distribuido gratuitamente bajo la licencia GNU GPL 2.0 y puede descargarse libremente del sitio http://www.scilab.org. Existen versiones para diferentes sistemas operativos, del sitio oficial, específicamente del área de descarga: http://www.scilab.org/download, se puede descargar para sistemas de 32 y 64 bits tanto bajo Linux, Mac o Windows.

UN VISTAZO DE SCILAB

Scilab es un lenguaje de programación asociado con una rica colección de algoritmos numéricos cubriendo muchos aspectos de problemas de cálculo científico. Desde el punto de vista del software, Scilab es un lenguaje interpretado. Esto generalmente permite tener desarrollo de procesos más rápidos, porque el usuario accede directamente a un lenguaje de alto nivel, con un rico conjunto de características provistas por la librería. El lenguaje Scilab está pensado para que sea extendido de tal (^1) Scilab es publicado bajo los términos de la licencia de GNU General Public License 2.0. Anterior a esta versión, Scilab se licenció bajo los términos de Cecill v. 2. Y continúa siendo disponible bajo dichos términos. Copyright 2011-2017 Scilab Enterprises, 1989-2012 Inria, 1989-2007 ENPC.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 8 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del forma que los tipos de datos definidos por el usuario puedan ser definidos posiblemente con operaciones sobrecargadas. Los usuarios Scilab, pueden desarrollar sus propios módulos, de tal forma que ellos puedan resolver sus problemas particulares. El lenguaje Scilab permite compilar dinámicamente y enlazar otros lenguajes tales como Fortran y C: De esta manera las librerías externas se pueden usar como si fueran parte de las características internas de Scilab. Scilab también tiene interface con LabVIEW, una plataforma y ambiente de desarrollo para lenguajes de programación visual de National Instruments. Desde el punto de vista del licenciamiento, Scilab es un software libre, en el sentido de que el usuario no tiene que pagar por él y Scilab es un software open source, provisto bajo la licencia GNU GPL v2.0. El software se distribuye con código fuente, de tal forma que los usuarios tienen acceso a los aspectos más internos de Scilab. La mayor parte de las veces, los usuarios descargan e instalan una versión binaria de Scilab puesto que el consorcio Scilab provee versiones ejecutables para los sistemas operativos Windows, Linux y Mac. La ayuda en línea se provee en muchos idiomas. Desde el punto de vista científico, Scilab viene con muchas características. Desde los orígenes de Scilab, las características se enfocaron en álgebra lineal. Pero, rápidamente, el número de características se extendió hasta cubrir muchas áreas del cálculo científico. La siguiente es una corta lista de sus capacidades:

  • Algebra lineal, Matrices espaciadas.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 10 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del Fig. 1. Pantalla principal de Scilab. Podemos notar que hay secciones y ventanas identificadas que tienen funciones muy particulares. En el identificador numerado 1, se tiene el menú principal y la barra de iconos. Estos cambiarán dependiendo de la ventana que se encuentre activa. Las ventanas están numeradas con los identificadores 2 a 6. En la figura 1 , la ventana activa es la número 3, que es la consola de Scilab. Por lo tanto, el menú principal y la barra de iconos corresponden a la consola. La ventana activa se identifica por el color celeste en la barra de título de la ventana. Las otras ventanas son:

  • La número 2, el navegador de archivos, una especie de browser para navegar entre las carpetas del computador.
  • La número 4, el explorador de variables, aquí se mostrará el registro de toda variable que se cree durante una sesión de Scilab. Este espacio conservará las variables únicamente durante la sesión activa, al cerrar la sesión y salir de Scilab se eliminarán.
  • La número 5, el historial de comandos, guarda un registro de todos los comandos emitidos durante las sesiones de Scilab, los va identificando por fecha y hora, desde el momento que se instaló el software. Esta ventana puede ser borrada con una instrucción de parte del usuario. Pero siempre es buena práctica dejarla sin modificar, por si alguna vez se quiere repetir un comando ya emitido en alguna sesión anterior.
  • La número 6, es una novedad de esta versión, si Ud. cuenta con conexión a Internet, le mostrará noticias de los desarrolladores de Scilab, es como un

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 11 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del canal de noticias en línea, conectado directamente a la página principal del consorcio Scilab.

  • La número 3, es la consola de Scilab. Funciona al estilo de una ventana de comandos del sistema de Windows o una ventana de terminal de Linux. En ella se le dan órdenes al compilador de Scilab para que las ejecute y muestre los resultados en la misma consola. El prompt de la ventana es (--> ) Indica el punto de inserción del siguiente comando. Intente escribir el comando --> help y presione la tecla “Enter”. Obtendrá una nueva ventana de ayuda como la de la Figura 2. Note que en la ventana que se le muestra ya se ha activado la ayuda para la sección de estadística. Intente reproducir la imagen de la Figura 2. Luego, comience a desplazarse por todos los temas de la ayuda, que tienen que ver con Estadística. Ponga especial énfasis a las medidas de tendencia central (Central Tendency), estadística descriptiva (Descriptive Statistics), medidas de dispersión (Measures of Dispersion) y medidas de forma (Measures of shape). Serán de las que haremos mayor uso en este curso.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 13 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del Fig. 4. Ventana Consola/Editar/Preferences Nos aparecerá una ventana similar a la siguiente figura: Fig. 5. Ventana Preferencias de Scilab. En esta ventana se controlan las opciones de Presentación tanto de la Consola, el Scinotes (El editor de programas de Scilab) y el Xcos (el ambiente para realizar modelaje y simulación de sistemas híbridos). Tiene varias secciones, en la parte izquierda se muestran todas opciones que se pueden ajustar (General, Web, Preferences, Fonts, Colors, Console, Command History, Scinotes y Xcos) y en la parte derecha, se van mostrando los parámetros que se pueden cambiar.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 14 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del Para cambiar el idioma, en la opción “General” se elige el idioma deseado, en nuestro caso “español” (Spanish, en inglés). Como lo muestra la siguiente figura: Note que al cambiar esta opción el sistema Scilab debe reiniciarse para que el cambio surta efecto. Fig. 6. Cambio de preferencias de Idioma, a Idioma español (Spanish). Como un ejercicio adicional, retorne a la ventana “Preferencias de Scilab” y modifique las fuentes (Fonts, en inglés) y los colores (colors, en inglés). Modifique las fuentes del Desktop (escritorio), use Monospaced 18 bold. Use este mismo tipo de fuente, para la Consola y el editor Scinotes. Ahora hablaremos un poco sobre el editor de programas de Scilab, denominado Scinotes. Es una ventana similar a la siguiente figura: Al examinar la estructura de la ventana es muy similar a las otras ventanas vistas anteriormente. Excepto que se van agregando pestañas por cada código que se agregue al editor (en la figura están identificadas por los nombres “Restore”, “*Sin Título 1” hasta

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 16 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del representativa de una población cuya información permita inferir propiedades o características de toda la población cometiendo un error medible y acotable”. (Pérez, 2005 p. 3). La siguiente secuencia muestra los pasos a realizar durante la fase de planeación del muestreo: Los pasos posteriores a la obtención de una muestra consisten en resumir los datos, analizarlos, interpretarlos y comunicar los resultados. Ya hemos hablado un poco acerca del concepto de población y muestra, en el numeral 1.1. Necesitamos profundizar un poco en dichos conceptos, para formalizar los

PASO 1:

DEFINIR LA POBLACIÓN

PASO 2:

IDENTIFICAR EL MARCO

MUESTRAL

PASO 3:

DETERMINAR EL TAMAÑO

DE LA MUESTRA

PASO 4:

ELEGIR EL MÉTODO DE

MUESTREO

PASO 5:

OBTENER LA MUESTRA

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 17 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del conceptos del procedimiento de muestreo. Lo haremos mencionado una serie de características que se requieren en este contexto. Pero antes, solo mencionaremos el caso cuando el estudio se hace tomando en cuenta a todos los objetos que forman una población, en este caso al estudio se define como “ censo ”. En algunos casos el censo es recomendable, especialmente si el número de objetos a considerar como población de estudio no supera las 50 unidades. Unidades elementales (o elementos): Se definen como las unidades acerca de las cuales se quiere realizar una investigación o investigar características de ellas. Son las que suministran la base del análisis. “Son las unidades que representan las partes más pequeñas de los elementos capaces de presentar una característica particular” (Organización de las Naciones Unidas [ONU], (1957)). Se denota por 𝑢 1 un elemento (o unidad) sobre la cual se realiza una medición de una variable bajo estudio 𝑋, Sea 𝑋 1 el valor que toma la característica 𝑋 sobre la unidad 𝑢 1. Ejemplo: Se desea realizar un estudio sobre el consumo de leche en polvo de las familias del país. En este caso, los elementos de muestreo (o unidades elementales) son las familias del país. Y para cualquier familia elegida del país, el gasto aproximado en leche de dicha familia, será la medición para este estudio. Unidades de muestreo : Son las unidades que sirven de base para las operaciones de muestreo, pueden ser: (i) las mismas unidades elementales o (ii) grupos de elementos que conforman un conglomerado de unidades elementales. (ONU, 1957). Como bien lo dice la definición, en ocasiones los mismos elementos son las unidades de muestreo, pero existen casos en los que las unidades de muestreo son grupos de estos elementos. Ejemplo: Siguiendo el ejemplo anterior, ya se identificó que los elementos del muestreo son las familias del país, sin embargo, hay casos en donde la única persona que habita en la vivienda es soltera, entonces se reúnen a los habitantes solteros en grupos y se les considera como una familia. Otro caso sería lo contrario, que en una misma casa habiten varias familias, entonces se identifica a los habitantes de la casa como si fueran una sola familia.

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 19 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del Aunque también el muestreo puede hacerse sin incluir este concepto de aleatoriedad, como en los casos de muestras auto-seleccionables (por selección razonada), o seleccionadas por conveniencia, o por simple juicio u opinión (opinático), o el muestreo por cuotas, donde al entrevistador se le han dado cuotas (o un número predeterminado de formularios que llenar) para sub-grupos especificados de población. Esto por supuesto tiene sus debilidades, ya que puede generar sesgo en la investigación e incluso, darse el caso que los datos obtenidos no sean representativos de toda la población. Para que el muestreo sea aleatorio, se requiere un procedimiento de aleatorización de los objetos a muestrear. Es decir, un mecanismo que les otorga a los objetos a muestrear la misma probabilidad de ser tomados como parte de la muestra. Aquí se puede usar un procedimiento de generación de números aleatorios, ya sea con el apoyo de tablas de números aleatorios pre-existentes o con el uso de programas que generan números aleatorios (o pseudoaleatorios, propiamente dicho).

1.3.1. ELECCIÓN DEL TAMAÑO DE LA MUESTRA

La elección del tamaño de la muestra es un tema de mucho interés. La lógica nos indica que, a mayor tamaño de muestra, más confianza en la exactitud de los resultados. Lo contrario también es cierto, a menor tamaño de muestra, menos confianza en la exactitud de los resultados. Aún más, el mayor tamaño que la muestra podría llegar a tomar es el tamaño mismo que el de toda la población. Lo que significaría un costo muy elevado para el estudio y en ocasiones imposible de realizar. Por el otro lado, lo menos que se puede llegar a elegir en el tamaño de la muestra es “no elegir a nadie”, en cuyo caso no tiene sentido el experimento. Esto nos induce a que haya que pensar en un balance, pero eso no significa el punto medio, sino un balance razonado en términos de los parámetros estadísticos que se desea calcular y de los niveles de confianza que se desea tener en los resultados, y del error admisible en el método de muestreo usado. En general, el tamaño de la muestra, dependerá de varios factores, tales como: La estabilidad de la población (¿qué tan variable resulta ser con respecto a la variable de observación?, la lógica y la observación juegan un papel esencial en todo esto: Por ejemplo, si se quiere estimar la estura promedio de un grupo de habitantes de una región y cierta edad, y se observa que toda la población tiene aproximadamente la misma estatura, entonces un solo miembro será representativo de toda la población para tomar dicha medición), requerimientos estadísticos (el grado de confianza o exactitud con los que se quieren obtener los resultados y el margen de error permitido), factores

FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA

Página 20 de 29 Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del económicos (de que tanto presupuesto se cuenta para la realización del experimento), la disponibilidad de los elementos a muestrear y por supuesto la importancia que pueda tener el problema (o la necesidad de resolverse). Introducimos un par de conceptos antes de ver las fórmulas más comunes para calcular el tamaño de la muestra. Lo haremos a través de analizar el siguiente caso: Suponga que se tomará una muestra de un Centro Escolar (CE) en el que hay 560 estudiantes. Se tomará una muestra de 28 alumnos. Lo que se quiere investigar es la proporción de estudiantes que cuentan con el servicio de internet en sus casas, con el propósito de iniciar un plan de refuerzo académico usando recursos de internet. Pero, ¿Qué significa elegir a 28 de 560? ¿Qué proporción de la población se entrevistará? Y a la hora de obtener conclusiones sobre la población ¿a cuántos alumnos de la población total representa cada uno de los estudiantes de la muestra? Para calcular la proporción de estudiantes que se entrevistará, se divide el tamaño de la muestra entre el tamaño de la población: 28/560 = 0.05, eso quiere decir que se está considerando al 5% de la población. Para calcular a cuántos estudiantes representa cada uno de los elementos de la muestra. Se hace la división contraria, se divide el tamaño de la población entre el tamaño de la muestra: 560/28 = 20, lo que significa que cada uno de los elementos de la muestra representa a 20 de la población. Los dos conceptos que acabamos de ver tienen la siguiente definición formal: Definición de Factor de elevación: Es el cociente entre el tamaño de la población (N) y el tamaño de la muestra (n), es decir: Factor de elevación = N / n. Y representa el número de elementos de la población representado por cada elemento de la muestra. Definición de Factor de muestreo: Es el cociente entre el tamaño de la muestra (n) y el tamaño de la población (N), es decir: Factor de muestreo = n / N. Y si se multiplica por 100, obtenemos el porcentaje de la población que se representa en la muestra. Error de muestreo: Es el error admisible en el muestreo, se comete por el hecho de sacar conclusiones sobre cierta realidad a partir de la observación de solo una parte de ella, establecido por el investigador, se presenta por E y se expresa por lo general en porcentaje (algunos textos lo identifican por e, pero aquí usamos ese símbolo para identificar el error de estimación, que también se suele expresar en porcentaje). Error de estimación: Originado por los errores que se puedan dar en el proceso de estimación de los parámetros, su valor viene dado por el cálculo: 𝑒 = 𝑍𝛼 ∗ 𝐸 , donde 𝐸 es el Error de muestreo y 𝑍𝛼 es el valor en tablas de la distribución normal asociado al nivel de significancia deseado en el cálculo.