






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Apuntes de fundamentos para estudiar.
Tipo: Apuntes
1 / 11
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







La distribución normal es una distribución basada en una variable continua Dada la siguiente distribución creada: n=1000, mu=0, sigma=1, y=rnorm (n, mean= mu, sd=sigma). La función de la distribución normal se simplifica si utilizamos puntuaciones típicas en vez de puntuaciones directas, ya que en el exponente de e hay una puntuación típica elevada al cuadrado. La ventaja adicional de expresar la función en puntuaciones típicas en vez de en puntuaciones directas es que esta función ya no dependerá de la media y la desviación típica de la variable. Al no depender de estos parámetros, los valores de la función yi siempre serán los mismos para cualquier variable. LA CURVA NORMAL COMO DISTRIBUCIÓN DE FRECUEN CIAS Esta función define que la línea que caracteriza a la distribución normal es curva y se le denomina como “curva de la normal”, lo más importante es que esta línea es un polígono de frecuencias. El polígono de frecuencias es una gráfica con dos ejes: en el eje horizontal están los
valores ordenados de la variable y en el eje vertical están las frecuencias de los valores. Por lo que la curva normal define la distribución de una variable bajo la cual estarán el 100% de las puntuaciones, además como es simétrica a cada lado de la media estará el 50% de los valores. FÓRMULA DE LA DISTRIBUCIÓN NORMAL PROPIEDADES DE LA DISTRIBUCIÓN NORMAL Algunas características de la distribución son: o Tiene forma de campana, lo que junto al nombre de su descubridor, Gauss, hace que se llame “campana de Gauss” o Bajo la curva normal hay un 100% de puntuaciones. o La media, la mediana y la moda son iguales ▪ A la izquierda de la media hay un 50% de puntuaciones, a la derecha el otro 50%. ▪ A la izquierda de la media hay un 50% de casos, a la derecha el otro 50%. o Es simétrica. El coeficiente de asimetría es 0. (As=0) o Es mesocúrtica. El coeficiente de apuntamiento es cero. (Ap.=0) Con respecto a las puntuaciones típicas o El porcentaje de puntuaciones a la izquierda de una zeta positiva es mayor que el 50% y a la derecha de una zeta positiva es menor que el 50%. o El porcentaje de puntuaciones a la izquierda de una zeta negativa es menor que el 50% y a la derecha de una zeta negativa es mayor que el 50%. o En puntuaciones típicas el porcentaje de puntuaciones comprendidas entre la media y +zi es el mismo que entre la media y - zi. o Aproximadamente: ▪ Un 68% de los datos caerán dentro de +- 1 desviaciones típicas. ▪ Un 95% dentro de +- 2 desviaciones típicas. ▪ Un 99,7% dentro de +- 3 desviaciones típicas. Con respecto a las puntuaciones diferenciales o En puntuaciones diferenciales el porcentaje de puntuaciones comprendidas entre la media y xi es el mismo que entre la media y - xi.
La distribución uniforme continua es útil para describir una variable con probabilidad constante a lo largo de un intervalo. X∼U(a, b). (VER EJEMPLOS EN JAMOVI EN EL AULA VIRTUAL) FÓRMULAS Consejos para resolver problemas: o Identificar los parámetros de la distribución: N(μ,σ) U(a, b). o Pensar que mecanismo te puede ayudar mejor a calcular la probabilidad que te piden. Resumen de las fórmulas utilizadas:
Empezaremos haciendo un repaso a los conceptos de distribuciones que hemos visto, para poder llegar a las distribuciones muestrales basadas en un estadístico. En la estadística descriptiva partíamos de las distribuciones de frecuencias, tanto para las variables cualitativas como cuantitativas, y vimos, más concretamente, como las frecuencias relativas o proporciones de una tabla de frecuencias indicaban con qué probabilidad cabe esperar encontrar cada uno de los valores o rango de valores de la variable, según fueran estas cualidades o cuantitativas discretas o continuas. Ahora bien, en ambos casos estamos hablando de distribuciones empíricas, es decir, de distribuciones construidas a partir de los datos observados. Pero también sabemos y hemos estudiado en el capítulo anterior, que existen distribuciones teóricas, como la binomial, la normal etc. distribuciones que, aunque no están generadas a partir los datos sino a partir de una función matemática, son representaciones de los datos que tienen una enorme utilidad para ayudar a interpretarlos mejor, más cuando hemos dicho que la mayoría de los fenómenos aleatorios se podían describir a partir de estas distribuciones. En concreto, lo decíamos de la distribución normal. JAMOVI no permite el cálculo para la distribución uniforme. Se mostrará con R en el texto con un ejemplo.
Por tanto, tanto las distribuciones de probabilidad empíricas como teóricas son importantes porque contienen toda la información relativa a una variable, sobre su centro, dispersión y forma de la distribución; y eso, como ya sabemos es todo lo que necesitamos para caracterizar una variable. El término distribución muestral se refiere a la distribución de probabilidad o de densidad de un estadístico. Por tanto uno de los estadísticos más útiles y utilizados en el contexto de la inferencia estadística es la media, y ya sabemos que como estadístico que es, su valor concreto depende de la muestra concreta en la que se le calcula. TEOREMA CENTRAL DEL LÍMTE Como ya hemos dicho, la distribución normal es, sin duda, la distribución teórica más importante en la estadística. Muchos de los procedimientos estadísticos que estudiaremos asumen que los datos proceden de poblaciones normales. Pero, además, la distribución normal sirve como referente para describir cómo se distribuyen muchos de los datos que recogemos, ya que muchos de los fenómenos aleatorios que interesa estudiar tienen distribuciones empíricas que se parecen a la distribución teórica normal. La justificación de esta regularidad se encuentra en el Teorema Central del Límite , uno de los resultados más importantes de la estadística, especialmente para la parte de inferencia, que nos dice: Si los datos que se recogen son debidos a la suma/promedio de cierto número de causas independientes entre sí, cada una con su efecto parcial, la distribución de los datos recogidos se asemejará tanto más a la distribución normal cuantos más datos se recojan (cualquiera que sea la distribución original de esos efectos parciales y siempre que la desviación típica de esos sea infinita). Con lo cual, la DM es una buena aproximación cuando sumamos o promediamos variables aleatorias iguales. Nosotros nos centraremos en construir la distribución de las medias que DM es una distribución teórica que asigna una probabilidad (o una densidad) concreta a cada uno de los valores que puede tomar un estadístico en todas las muestras del mismo tamaño que es posible extraer de una determinada población.
Por último, en la mayoría de las ocasiones no se conoce la desviación típica de la población σ. Es por ello por lo que se tiene que dar un estimador de la desviación típica de la población y este es la desviación típica insesgada de la muestra Sn- 1 o cuasidesviación típica. En estas condiciones la distribución muestral de la media no se ajusta a la distribución normal sino que sigue la distribución t de Student. Visto esto, tendremos en cuenta dos aspectos importantes:
La teoría de la probabilidad es el mecanismo en el que se basa la estadística para mejora la descripción de los datos y sobre todo para hacer inferencia. La inferencia estadística es un tipo de razonamiento que procede de lo particular a lo general: intenta extraer conclusiones sobre la forma de una población o alguno de sus parámetros, a partir de unos pocos datos particulares, nos estamos refiriendo a una muestra de esa población o a alguno de sus estadísticos. Esto es debido a que en la práctica es muy difícil o caro acceder a todos los individuos de la población y por eso el conocimiento de esta lo va a proporcionar la muestra. Por lo tanto, es lógico que la muestra no se pueda tomar de forma arbitraria sino que se debe representar adecuadamente a toda la población, de esto se encarga la teoría del muestreo. Luego la estadística inferencial hace afirmaciones acerca de las poblaciones basándose únicamente en el estudio de muestras de esas poblaciones. Y las afirmaciones son probabilísticas, ya que cuando se estudian poblaciones mediante muestras no se hacen afirmaciones exactas sobre el valor concreto del parámetro, sino que se da una horquilla de valores entre los que puede estar el parámetro poblacional, con un cierto nivel de confianza y una determinada probabilidad. En la estadística inferencial se pate de un estadístico y se llega a unos posibles parámetros. Se parte de una muestra y se llega a una población. Nos planteamos ¿pertenece una muestra a una población? Obtenido un estadístico, ¿entre qué valores estará el parámetro? Y para responder a estas preguntas hay que recorrer el camino inverso: ir de la población a las muestras, del parámetro a los estadísticos. Dada una cierta población con un parámetro mu, hay que analizar lo que ocurre cuando se extraen muestras de la población y de cada muestra se obtiene un estadístico, por ejemplo una media. INTERVALOS CONFIDENCIALES Si la distribución se distribuye normalmente X~N(100,20), ¿entre qué dos puntuaciones directas está encerrando el 95% central de los casos que componen esta población? Sabemos que las puntuaciones típicas que encierran el 95% central de una distribución N(0,1) es zi=+-1.96. Luego las puntuaciones directas serán Xi=1.96*20+100=13.92 → el 95% de los casos está entre las puntuaciones 60.8 y 139. 2. Si lo aplicamos a la DMM, ¿entre qué medias está encerrada el 95% central de las medias que componen la distribución muestral de medias DMM? Adaptando la fórmula anterior de
utilizado para estimarlo. Como la amplitud del intervalo es la diferencia entre los límites de confianza superior e inferior, y el IC esta centrado en la media, la amplitud es dos veces EME. La utilidad de esa estrategia radica justamente en que permite conocer la probabilidad (nivel de confianza 1 - α) con la que cabe esperar que el intervalo construido incluya el verdadero valor del parámetro, es decir: NC: 1 - α=p (Li≤μ≤Ls) probabilidad de construir un intervalo entre cuyos límites se encuentre el verdadero valor del parámetro α o nivel de significación: 1 - NC probabilidad de construir un intervalo entre cuyos límites no se encuentre el verdadero valor del parámetro. FACTORES QUE INFLUYEN EN LA AMPLITUD DEL INTERVALO DE CONFIANZA Los factores que hacen que la amplitud del IC sea más o menos grande son: la puntuación típica z, la desviación típica de la población o la cuasidesviación típica de la muestra y el tamaño de la muestra (elementos que intervienen en su fórmula): o Cuanto mayor es el nivel de confianza mayor la amplitud del IC. Cuanto menor el nivel de confianza menor la amplitud del IC. o Cuanto mayor es la desviación típica de la población mayor es la amplitud del IC. o Cuanto menor el tamaño de la muestra mayor la amplitud del IC. o Cuanto mayor el error típico de la media mayor la amplitud del IC INTERPRETACIÓN DEL IC Un intervalo con una confianza, por ejemplo, del 0,95 puede interpretarse como: " estimamos, con una confianza del 95% que el verdadero valor del parámetro μ se encuentra entre los límites del IC construido". Y lo que esto significa realmente es que se ha utilizado un procedimiento que permite extraer que de cada 100 intervalos que se construyan en las mismas condiciones, 95 de ellos incluirán el verdadero valor del parámetro y 5 no lo harán (eso si, tenemos una confianza del 95% que nuestro IC es uno de los correctos). FÓRMULAS Consejo para resolver problemas: o Identifica bien los parámetros poblacionales y los estadísticos muestrales. o Calcular el error típico DMM~N(μ,error_tipico) y EME en los IC. o Pensar que mecanismo te puede ayudar mejor a calcular la probabilidad que te pidan Resumen de las fórmulas utilizadas