







Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Aprenda sobre la variable aleatoria, sus tipos discretas y continuas, y cómo medir su posición central y dispersión mediante medidas como media, mediana, moda, cuartiles, deciles, percentiles, rango y desviación típica. Este documento también introduce la distribución de probabilidad y distribuciones discretas como Bernoulli y Poisson.
Tipo: Apuntes
Subido el 15/11/2022
1 documento
1 / 13
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!








1.) Conceptos básicos:
Estadística : Es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de un equipo de baloncesto, temperatura de los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Es una de las ciencias que permite conocer, o al menos entender, la realidad en la que nos desenvolvemos. A través de la estadística podemos obtener información de gran valor que nos ayudará en la toma de decisiones en cualquier ámbito de nuestra vida. El análisis de la información pasada para tomar la decisión más correcta, de cara al futuro, es el objeto de la estadística.
Variable aleatoria : Conjunto de distintos valores numéricos que adoptan un carácter cuantitativo. Es aquel dato susceptible de tomar diferentes valores en determinadas circunstancias. La estadística es el estudio cuantitativo de las variables, por lo que podemos considerar éstas como la materia prima de los estudios estadísticos. Toda variable que tiene asociada una determinada ley de probabilidad; cada uno de los valores que puede tomar le corresponde una probabilidad específica.
Las variables pueden ser cualitativas o cuantitativas,
Variables cualitativas (o categóricas): aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos).
Variables cuantitativas: las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Variables cuantitativas según el tipo de valores que pueda tomar pueden:
Discretas : Aquellas que toman valores aislados (números naturales), y que no pueden tomar ningún valor intermedio entre dos consecutivos fijados. Por ejemplo; nº de goles marcados, nº de hijos, nº de discos comprados, nº de pulsaciones,...
t = 0
No Quiebra
1-Prob
Prob
t = 1
Quiebra
Continuas : Aquellas que toman infinitos valores (números reales) en un intervalo dado, de forma que pueden tomar cualquier valor intermedio, al menos teóricamente, en su rango de variación. Por ejemplo; talla, peso, presión sanguínea, temperatura, ..
Frecuencia: Número de veces en que se repite un dato. Distinguimos dos clases de frecuencias:
Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable.
Frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa , que es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
(Componentes de una Investigación Estadística)
Población: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc. ). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones.
Individuo: Se llama unidad estadística o individuo a cada uno de los elementos que componen la población estadística. El individuo es un ente observable que no tiene por qué ser una persona, puede ser un objeto, un ser vivo, o incluso algo abstracto.
x
-
∞
∞
−∞
Valores posibles
Distribución estadística
El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cual de los resultados se va a presentar. Ejemplo: Lotería de Navidad.
Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la probabilidad.
Modelo de distribución de probabilidad: especificación de los valores de la variable aleatoria con sus probabilidades respectivas
2.) Medidas de variables aleatorias
En muchas ocasiones es mucho más eficaz, sencillo y preciso el estudio de una variable utilizando valores numéricos que la descripción visual de la distribución de una variable mediante tablas y gráficos, ya que los valores numéricos dan una idea de la ubicación o del centro de los datos (medidas de posición), y usando cantidades que informen de la concentración de las observaciones alrededor de dicho centro (medidas de dispersión).
a) Medidas de posición central:
Informan sobre los valores medios de la serie de datos. Una medida de centralización es un valor, que es representativo de un conjunto de datos y que tiende a situarse en el centro del conjunto de datos, ordenados según su magnitud.
Media: Es el valor medio ponderado de la serie de datos o valores que toma la variable estadística. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. Y se calcula como;
n
x
n
x x x x x X
n
i
i n n
∑ = 1 +^2 +^3 +.... −^1 + = =^1
Si el valor xi de la variable X se repite ni veces, aparece en la expresión de la media aritmética de la forma:
n
xn X =∑ i i
Siendo xi las variables, n (^) i las veces que aparece la variable xi y N la suma de todas las n (^) i. Es decir;
N = Σn (^) i
A la media aritmética se la denomina también CENTRO DE GRAVEDAD de la distribución.
Mediana: Es uno de los cálculos más representativos de la muestra. La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan. La mediana se calcula ordenando los datos de menor a mayor y tomando el valor del medio que es el que deja un 50% de observaciones a su izquierda y un 50% a su derecha.
El lugar que ocupa se determina dividiendo el nº de valores entre 2: 2
n
Cuando hay un número impar de valores de la variable, la mediana será justo el valor de orden central, aquel cuya frecuencia absoluta acumulada coincida con
2
n (^). Por tanto la mediana coincide con un valor de la variable.
El problema está cuando haya un número par de valores de la variable. Si al
calcular 2
n resulta que es un valor menor que una frecuencia absoluta acumulada,
el valor de la mediana será aquel valor de la variable cuya frecuencia absoluta
cumpla la siguiente condición: N (^) i − < n ≤ Ni ⇒ Me = xi (^1 )
Por el contrario si coincide que N^ = Ni 2
, para obtener la mediana realizaremos el
siguiente cálculo: 2
Me = xi^ + xi +^1
Moda: Es el valor más frecuente de la variable estadística; valor que se
corresponde al máximo del histograma. Ejemplo: El conjunto 2,2,5,7,9,9,9,10,10,11,12 y 18 tiene moda 9. Ejemplo: El conjunto 3,5,8,10,12,15 y 16 no tiene moda.
Ejemplo: El conjunto 2,3,4,4,4,5,5,7,7,7 y 9 tiene dos modas, 4 y 7 y se llama bimodal.
Una distribución con moda única se dice unimodal.
Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles, ya que podemos definir Decil como“percentil cuyo valor que indica su proporción es un múltiplo de diez. Percentil 10 es el primer decil, percentil 20 el segundo decil, etc”.
El primer decil D1: indica que sólo existe un 10% de probabilidad de que el valor de la variable esté por debajo de esa cifra.
Quinto decil D5 o denominado también “Caso Base”: indica que existe igualmente un 50% de probabilidad de que el valor esté por encima como por debajo de esa cifra. Representa la Mediana de la distribución.
Percentiles o centiles: Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Sencillamente Percentil es el valor del recorrido de una variable, bajo el cual se encuentra una proporción determinada de la población.
Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99, muestran la variable que deja detrás una frecuencia acumulada igual al valor del percentil:
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
c) Medidas de dispersión:
Son aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Estudian la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.
Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.
Re = xmax - xmin
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El resultado obtenido se divide por el tamaño de la muestra.
( )
r
i
i i x x
(^2) = σ (^2) = 1
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
Desviación Típica: es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística.
3.) Distribuciones de probabilidad
Como ya hemos mencionado anteriormente una variable aleatoria es aquella que toma diversos valores o conjuntos de valores con distintas probabilidades. Existen 2 características importantes de una variable aleatoria, sus valores y las probabilidades asociadas a esos valores. Una tabla, gráfico o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria.
La inferencia estadística (es decir, el proceso que realiza la herramienta Riesgómetro) se relaciona con las conclusiones que se pueden sacar acerca de una población de observaciones basándose en una muestra de observaciones. Entonces intervienen las probabilidades en el proceso de la selección de la muestra; en este caso se desea saber algo sobre una distribución con base en una muestra aleatoria de esa distribución.
De tal manera vemos que trabajamos con muestras aleatorias de una población que es más grande que la muestra obtenida; tal muestra aleatoria aislada no es mas que una de muchas muestras diferentes que se habrían podido obtener mediante el proceso de selección, por ello es de gran relevancia el uso de distribuciones de probabilidad.
σ= std ( X )=+ var( X )
Distribuciones continuas:
Son que presentan un número infinito de posibles soluciones.
Tipos distribuciones:
Uniforme ; es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.
Características:
Normal ; Se utiliza para medir y representar multitud de variables como el peso, la altura, la calificación de un examen..., cuya distribución es simétrica con respecto a un valor central, alrededor del cual toma valores con gran probabilidad, sin existir apenas valores extremos.
Es el modelo de distribución más utilizado en la práctica. La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal (tallas, pesos, envergaduras, consumo de cierto producto, puntuaciones de examen, grado de adaptación a un medio, etc.), multitud de fenómenos se comportan según una distribución normal.
Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss , en torno a un valor central que coincide con el valor medio de la distribución
Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda.
0,
0,
0,
0,
0,
0,
-3 -2 -1^0123 90,0% -2,250 2,
Esta distribución viene definida por dos parámetros:
es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).
^2 : es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.
Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.
Características:
Triangular ; La distribución triangular es útil como una aproximación inicial en situaciones par las que no se dispone de datos confiables. Nos permite estimar las duraciones de las actividades de un proyecto usando las tres estimaciones: optimista, muy pesimista, y pesimista.
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
-3 -2 -1^0123 5,0% 90,0% 5,0% -1,709 1,