Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística: Concepto de Variable Aleatoria y Medidas Centrales y Dispersión, Apuntes de Lenguaje y práctica musical

Aprenda sobre la variable aleatoria, sus tipos discretas y continuas, y cómo medir su posición central y dispersión mediante medidas como media, mediana, moda, cuartiles, deciles, percentiles, rango y desviación típica. Este documento también introduce la distribución de probabilidad y distribuciones discretas como Bernoulli y Poisson.

Tipo: Apuntes

2021/2022

Subido el 15/11/2022

usuario desconocido
usuario desconocido 🇲🇽

1 documento

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
ESTADÍSTICA BÁSICA
1.) Conceptos básicos:
Estadística: Es una ciencia que analiza series de datos (por ejemplo, edad de
una población, altura de un equipo de baloncesto, temperatura de los meses de
verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas
variables. Es una de las ciencias que permite conocer, o al menos entender, la
realidad en la que nos desenvolvemos. A través de la estadística podemos
obtener información de gran valor que nos ayudará en la toma de decisiones en
cualquier ámbito de nuestra vida. El análisis de la información pasada para tomar
la decisión más correcta, de cara al futuro, es el objeto de la estadística.
Variable aleatoria: Conjunto de distintos valores numéricos que adoptan un
carácter cuantitativo. Es aquel dato susceptible de tomar diferentes valores en
determinadas circunstancias. La estadística es el estudio cuantitativo de las
variables, por lo que podemos considerar éstas como la materia prima de los
estudios estadísticos.
Toda variable que tiene asociada una determinada ley de
probabilidad; cada uno de los valores que puede tomar le corresponde una
probabilidad específica.
Las variables pueden ser cualitativas o cuantitativas,
Variables cualitativas (o categóricas): aquellas que no aparecen en forma
numérica, sino como categorías o atributos (sexo, profesión, color de ojos).
Variables cuantitativas: las que pueden expresarse numéricamente
(temperatura, salario, número de goles en un partido). Variables cuantitativas
según el tipo de valores que pueda tomar pueden:
Discretas: Aquellas que toman valores aislados (números naturales), y
que no pueden tomar ningún valor intermedio entre dos consecutivos
fijados.
Por ejemplo; nº de goles marcados, nº de hijos, nº de discos
comprados, nº de pulsaciones,...
Función de
masa de
probabilidad:
P(X=xi)
Discretas
Sólo se toma un
conjunto finito valores
{x1, x2, ...}
t = 0
No Quiebra
1-Prob
Prob
t = 1
Quiebra
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Estadística: Concepto de Variable Aleatoria y Medidas Centrales y Dispersión y más Apuntes en PDF de Lenguaje y práctica musical solo en Docsity!

ESTADÍSTICA BÁSICA

1.) Conceptos básicos:

Estadística : Es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de un equipo de baloncesto, temperatura de los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Es una de las ciencias que permite conocer, o al menos entender, la realidad en la que nos desenvolvemos. A través de la estadística podemos obtener información de gran valor que nos ayudará en la toma de decisiones en cualquier ámbito de nuestra vida. El análisis de la información pasada para tomar la decisión más correcta, de cara al futuro, es el objeto de la estadística.

Variable aleatoria : Conjunto de distintos valores numéricos que adoptan un carácter cuantitativo. Es aquel dato susceptible de tomar diferentes valores en determinadas circunstancias. La estadística es el estudio cuantitativo de las variables, por lo que podemos considerar éstas como la materia prima de los estudios estadísticos. Toda variable que tiene asociada una determinada ley de probabilidad; cada uno de los valores que puede tomar le corresponde una probabilidad específica.

Las variables pueden ser cualitativas o cuantitativas,

Variables cualitativas (o categóricas): aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos).

Variables cuantitativas: las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Variables cuantitativas según el tipo de valores que pueda tomar pueden:

‰ Discretas : Aquellas que toman valores aislados (números naturales), y que no pueden tomar ningún valor intermedio entre dos consecutivos fijados. Por ejemplo; nº de goles marcados, nº de hijos, nº de discos comprados, nº de pulsaciones,...

Función de

masa de

probabilidad:

P(X=x i )

Discretas

Sólo se toma un

conjunto finito valores

{x 1 , x2 , ...}

t = 0

No Quiebra

1-Prob

Prob

t = 1

Quiebra

‰ Continuas : Aquellas que toman infinitos valores (números reales) en un intervalo dado, de forma que pueden tomar cualquier valor intermedio, al menos teóricamente, en su rango de variación. Por ejemplo; talla, peso, presión sanguínea, temperatura, ..

Frecuencia: Número de veces en que se repite un dato. Distinguimos dos clases de frecuencias:

‰ Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable.

‰ Frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa , que es el cociente entre la frecuencia absoluta y el tamaño de la muestra.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

(Componentes de una Investigación Estadística)

Población: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc. ). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones.

Individuo: Se llama unidad estadística o individuo a cada uno de los elementos que componen la población estadística. El individuo es un ente observable que no tiene por qué ser una persona, puede ser un objeto, un ser vivo, o incluso algo abstracto.

Continuas

Se toma

cualquier

valor de un

intervalo

Función de

densidad

f(x):

F(x)= f(t) dt

x

-

−∞

f ( t ) dt = 1

f(x) ≥ 0

Valores posibles

Distribución estadística

El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cual de los resultados se va a presentar. Ejemplo: Lotería de Navidad.

Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la probabilidad.

Modelo de distribución de probabilidad: especificación de los valores de la variable aleatoria con sus probabilidades respectivas

2.) Medidas de variables aleatorias

En muchas ocasiones es mucho más eficaz, sencillo y preciso el estudio de una variable utilizando valores numéricos que la descripción visual de la distribución de una variable mediante tablas y gráficos, ya que los valores numéricos dan una idea de la ubicación o del centro de los datos (medidas de posición), y usando cantidades que informen de la concentración de las observaciones alrededor de dicho centro (medidas de dispersión).

a) Medidas de posición central:

Informan sobre los valores medios de la serie de datos. Una medida de centralización es un valor, que es representativo de un conjunto de datos y que tiende a situarse en el centro del conjunto de datos, ordenados según su magnitud.

Media: Es el valor medio ponderado de la serie de datos o valores que toma la variable estadística. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. Y se calcula como;

n

x

n

x x x x x X

n

i

i n n

∑ = 1 +^2 +^3 +.... −^1 + = =^1

Si el valor xi de la variable X se repite ni veces, aparece en la expresión de la media aritmética de la forma:

n

xn X =∑ i i

Siendo xi las variables, n (^) i las veces que aparece la variable xi y N la suma de todas las n (^) i. Es decir;

N = Σn (^) i

A la media aritmética se la denomina también CENTRO DE GRAVEDAD de la distribución.

Mediana: Es uno de los cálculos más representativos de la muestra. La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan. La mediana se calcula ordenando los datos de menor a mayor y tomando el valor del medio que es el que deja un 50% de observaciones a su izquierda y un 50% a su derecha.

El lugar que ocupa se determina dividiendo el nº de valores entre 2: 2

n

Cuando hay un número impar de valores de la variable, la mediana será justo el valor de orden central, aquel cuya frecuencia absoluta acumulada coincida con

2

n (^). Por tanto la mediana coincide con un valor de la variable.

El problema está cuando haya un número par de valores de la variable. Si al

calcular 2

n resulta que es un valor menor que una frecuencia absoluta acumulada,

el valor de la mediana será aquel valor de la variable cuya frecuencia absoluta

cumpla la siguiente condición: N (^) i − < nNiMe = xi (^1 )

Por el contrario si coincide que N^ = Ni 2

, para obtener la mediana realizaremos el

siguiente cálculo: 2

Me = xi^ + xi +^1

Moda: Es el valor más frecuente de la variable estadística; valor que se

corresponde al máximo del histograma. Ejemplo: El conjunto 2,2,5,7,9,9,9,10,10,11,12 y 18 tiene moda 9. Ejemplo: El conjunto 3,5,8,10,12,15 y 16 no tiene moda.

Ejemplo: El conjunto 2,3,4,4,4,5,5,7,7,7 y 9 tiene dos modas, 4 y 7 y se llama bimodal.

Una distribución con moda única se dice unimodal.

Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles, ya que podemos definir Decil como“percentil cuyo valor que indica su proporción es un múltiplo de diez. Percentil 10 es el primer decil, percentil 20 el segundo decil, etc”.

El primer decil D1: indica que sólo existe un 10% de probabilidad de que el valor de la variable esté por debajo de esa cifra.

Quinto decil D5 o denominado también “Caso Base”: indica que existe igualmente un 50% de probabilidad de que el valor esté por encima como por debajo de esa cifra. Representa la Mediana de la distribución.

Percentiles o centiles: Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Sencillamente Percentil es el valor del recorrido de una variable, bajo el cual se encuentra una proporción determinada de la población.

Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99, muestran la variable que deja detrás una frecuencia acumulada igual al valor del percentil:

Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.

El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

c) Medidas de dispersión:

Son aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Estudian la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.

Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

Re = xmax - xmin

Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El resultado obtenido se divide por el tamaño de la muestra.

( )

N

x x n

S

r

i

i i x x

(^2) = σ (^2) = 1

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más

concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Desviación Típica: es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística.

3.) Distribuciones de probabilidad

Como ya hemos mencionado anteriormente una variable aleatoria es aquella que toma diversos valores o conjuntos de valores con distintas probabilidades. Existen 2 características importantes de una variable aleatoria, sus valores y las probabilidades asociadas a esos valores. Una tabla, gráfico o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria.

La inferencia estadística (es decir, el proceso que realiza la herramienta Riesgómetro) se relaciona con las conclusiones que se pueden sacar acerca de una población de observaciones basándose en una muestra de observaciones. Entonces intervienen las probabilidades en el proceso de la selección de la muestra; en este caso se desea saber algo sobre una distribución con base en una muestra aleatoria de esa distribución.

De tal manera vemos que trabajamos con muestras aleatorias de una población que es más grande que la muestra obtenida; tal muestra aleatoria aislada no es mas que una de muchas muestras diferentes que se habrían podido obtener mediante el proceso de selección, por ello es de gran relevancia el uso de distribuciones de probabilidad.

σ= std ( X )=+ var( X )

Distribuciones continuas:

Son que presentan un número infinito de posibles soluciones.

Tipos distribuciones:

Uniforme ; es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.

Características:

  • La totalidad de los posibles valores a tomar por la variable, situados entre las cantidades máximas y mínimas, presentan las mismas posibilidades de ser alcanzados
  • El emprendedor identifica un rango de valor para las variables
  • Variables exógenas
  • Parámetros de carga identificables y cuantificables por el emprendedor.

Normal ; Se utiliza para medir y representar multitud de variables como el peso, la altura, la calificación de un examen..., cuya distribución es simétrica con respecto a un valor central, alrededor del cual toma valores con gran probabilidad, sin existir apenas valores extremos.

Es el modelo de distribución más utilizado en la práctica. La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal (tallas, pesos, envergaduras, consumo de cierto producto, puntuaciones de examen, grado de adaptación a un medio, etc.), multitud de fenómenos se comportan según una distribución normal.

Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss , en torno a un valor central que coincide con el valor medio de la distribución

Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda.

0,

0,

0,

0,

0,

0,

-3 -2 -1^0123 90,0% -2,250 2,

Esta distribución viene definida por dos parámetros:

X: N ( 2 )

 es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).

^2 : es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.

Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Características:

  • Mínimo predeterminado
  • Máximo predeterminado
  • Todos los valores entre el mínimo y el máximo de la distribución son igualmente probables.

Triangular ; La distribución triangular es útil como una aproximación inicial en situaciones par las que no se dispone de datos confiables. Nos permite estimar las duraciones de las actividades de un proyecto usando las tres estimaciones: optimista, muy pesimista, y pesimista.

0,

0,

0,

0,

0,

0,

0,

0,

0,

0,

-3 -2 -1^0123 5,0% 90,0% 5,0% -1,709 1,