
























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos de la combinatoria, incluyendo propiedades, cálculo de parámetros y distribuciones. Se abordan conceptos como la media aritmética, cuantiles, variancia y distribuciones bidimensionales. Además, se explica el concepto de sucesos aleatorios y su relación con la probabilidad.
Tipo: Apuntes
1 / 32
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

























Introducción : La combinatoria estudia las diferentes formas en que se pueden realizar la ordenación o agrupamiento de unos cuantos objetos siguiendo unas determinadas condiciones o reglas. Una forma de hacer estos recuentos es utilizar los diagramas en árbol. Estos recuentos están intimamente relacionados con la probabilidad.
Número factorial : es el producto de nos consecutivos naturales
n! = (n)·(n−1)·(n−2)·.........3·2·
Todo producto tiene al menos dos factores , luego debemos admitir que 0! = 1 y que 1! = 1
Variaciones ordinarias :
Se llama variaciones ordinarias de m elementos tomados de n en n ( n m ) a los distintos grupos formados por n elementos de forma que :
Vm,n =
Variaciones con repetición : se llama variaciones con repetición de m elementos tomados de n en n a los distintos grupos formados por n elementos de manera que :
VRm,n = mn
Permutaciones ordinarias : se llama permutaciones de m elementos a las diferentes agrupaciones de esos m elementos de forma que :
Pm = m!
Permutaciones con repetición : se llama permutaciones con repetición de m elementos donde el primer elemento se repite a veces , el segundo b veces , el tercer c .......... a los distintos qrupos que pueden formarse con esos m elementos de forma que :
PRma,b,c... =
Combinaciones : se llama combinaciones de m elementos tomados de n en n ( n m ) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que :
Cm,n =
= número combinatorio
Combinaciones con repetición : se llama combinaciones con repetición de m elementos tomados de n en n , a los distintos grupos formados por n elementos de manera que :
CRm,n =
Por ejemplo las combinaciones con repetición de los elementos (a,b,c,d) tomados de dos en dos son :
aa ab ac ad
bb bc bd
cc cd
dd
Otro ejemplo : en una bodega hay 12 botellas de ron , 12 de ginebra y 12 de anís .Un cliente compró 8 botellas en total. ¿Cuántas posibilidades hay?
CR8,3 = 120
Resumen :
Triángulo de Tartaglia o Pascal :
Binomio de Newton :
(a + b) = a + b
(a + b)2 = a2 + 2ab + b
(a + b)3 = a3 + 3a2b + 3ab2 + b
(a + b)4 = a4 + 4a3b + 6 a2b2 + 4ab3 + b
Si nos fijamos atentamente , los coeficientes coinciden con los del triángulo de Pascal , los exponentes de a van disminuyendo desde n hasta 0 y los de b van aumentando desde 0 hasta n , y en cada término la suma de los exponentes de a y b es igual a n.
Generalizando :
(a + b)n =
anb0 +
an−1b1 + ......................+
a1bn−1 +
a0bn
Definición de Estadística : la palabra estadística procede del vocablo "estado" pues era función principal de los gobiernos de los estados establecer registros de población , nacimientos , defunciones , etc. Hoy en día la
Los puntos medios de cada clase se llaman marcas de clase.
Además se debe adoptar el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
Ejemplo : Las notas de Matemáticas de una clase han sido las siguientes :
Construir una tabla :
xi fi Fi hi Hi 0 2 2 2/30 2/ 1 3 5 3/30 5/ 2 1 6 1/30 6/ 3 1 7 1/30 7/ 4 1 8 1/30 8/ 5 3 11 3/30 11/ 6 2 13 2/30 13/ 7 5 18 5/30 18/ 8 7 25 7/30 25/ 9 5 30 5/30 30/ 30 1
Representaciones gráficas : para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos , que pueden ser :
Diagramas de barras ( datos cualitativos y cuantitativos de tipo discreto ). En el eje y se pueden representar frecuencias absolutas o relativas.
Histogramas ( datos cuantitativos de tipo continuo o discreto con un gran número de datos ). El histograma consiste en levantar sobre cada intervalo un rectángulo cuyo área sea igual a su frecuencia absoluta
área = base · altura fi =
luego la altura de cada rectángulo vendrá dada por ni que se llama función de
densidad. Si por ejemplo un intervalo es doble de ancho que los demás su altura ni debe ser la mitad de la frecuencia absoluta y así no se puede inducir a errores. Normalmente la amplitud de los intervalos es cte por lo que ni será
proporcional a fi y por tanto podemos tomar fi como la altura ni ya que la forma del gráfico será la misma , aunque ahora el área del rectángulo ya no sea exactamente la frecuencia absoluta ( a no ser que la amplitud del intervalo sea igual a 1 ).
Medidas de centralización :
si son pocos datos
si son muchos valores pero se repiten mucho
En el caso de que los datos estén agrupados en clases , se tomará la marca de clase
como xi.
No siempre se puede calcular la media aritmética como por ejemplo cuando los
datos son cualitativos o los datos están agrupados en clases abiertas.
Ejemplo : hacer los cálculos para el ejercicio de las notas
Moda : es el valor de la variable que presenta mayor frecuencia absoluta. Puede haber más de una. Cuando los datos están agrupados en clases se puede tomar la marca de clase o utilizar la fórmula :
M0 = Linf +
donde : Linf = límite inferior de la clase modal , =amplitud
del intervalo , d1= diferencia entre la fi de la clase modal y la fi de la clase anterior y
d2 = diferencia entre la fi de la clase modal y la fi de la clase posterior.
También se puede hacer gráficamente :
Varianza s2 : es la media aritmética de los cuadrados de las desviaciones respecto a la media ( desviación respecto a la media d = xi − ).
s2 =
s2 =
Al igual que la media en el caso de que los datos estén agrupados en clases , se tomará la marca de clase como xi.
Otra forma de calcular s2 es :
s2 =
Se llama desviación típica s a la raíz cuadrada de la varianza. Es más útil que la varianza ya que tiene las mismas dimensiones que la media
Ejemplo : Hacer los cálculos para el ejercicio de las notas
Coeficiente de variación : es el cociente entre la desviación típica y la media aritmética. Valores muy bajos indican muestras muy concentradas.
Variables estadísticas bidimensionales : es cuando al estudiar un fenómeno obtenemos dos medidas x e y , en vez de una como hemos hecho hasta ahora.
Ejemplo : pulso y tª de los enfermos de un hospital , ingresos y gastos de las familias de los trabajadores de una empresa , edad y nº de días que faltan al trabajo los productores de una fábrica.
Tipos de distribuciones bidimensionales :
Tipos de tablas :
x1 x2 ...... xn fj y1 f11 f21 ...... fn1 f y2 f12 f22 ...... fn2 f* ..... ..... ...... ...... ...... ...... ym f1m f2m ...... fnm fm fi f1* f2* ...... fn* f**=N
Diagramas de dispersión :
Si hay pocos datos ( tabla de dos columnas ), se representan las variables en los ejes x e y.
Si hay muchos datos pero muy agrupados ( tabla de tres columnas y tablas de doble entrada ), se hace igual pero con los puntos más gordos según la fi ,o se pintan muchos puntos juntos , o se pinta en tres dimensiones x , y , fi , con lo que obtendríamos un diagrama de barras en tres dimensiones.
Si hay muchos datos y muchos valores posibles , se pueden agrupar en clases , y se utilizan los estereogramas ( 3 dimensiones ) en los que el volumen de cada prisma es proporcional a la frecuencia. También se puede tomar la marca de clase de los intervalos y tratar la variable continua como si fuese discreta .
Cálculo de parámetros :
Aparece un parámetro nuevo que es la covarianza que es la media aritmética de las desviaciones de cada una de las variables respecto a sus medias respectivas.
Si representamos las variables matemáticas− física en un diagrama y matemáticas−filosofía en otro vemos que la correlación es mucho más fuerte en el primero que en el segundo ya que los valores están más alineados.
Coeficiente de correlación lineal : es una forma de cuantificar de forma más precisa el ttipo de correlación que hay entre las dos variables.
r =
Regresión : consiste en ajustar lo más posible la nube de puntos de un diagrama de dispersión a una curva. Cuando esta es una recta obtenemos la recta de regresión lineal , cuando es una parábola , regresión parabólica , cuando es una exponencial , regresión exponencial , etc. ( logicamente r debe ser distinto de 0 en todos los casos ).
La recta de regresión de y sobre x es :
en la cual se hace mínima la distancia entre los valores yj obtenidos experimentalmente y los valores teóricos de y.
A valor
se le llama coeficiente de regresión de y sobre x ( nos da la pendiente de la recta de regresión ).
La recta de regresión de x sobre y es :
en la cual se hace mínima la distancia entre los valores xi obtenidos experimentalmente y los valores teoricos de x.
A valor
se le llama coeficiente de regresión de x sobre y ( su inversa nos da la otra pendiente ).
Métodos de muestreo : para no tener que trabajar con toda la población se utiliza el muestreo. Puede ser :
Muestreo no probabilístico : no se usa el azar , sino el criterio del investigador , suele presentar grandes sesgos y es poco fiable.
Muestreo aleatorio simple (es el más importante ) : cada elemento de la población tiene la misma probabilidad de ser elegido , las observaciones se realizan con reemplazamiento , de manera que la población es identica en todas las extracciones , o sea , que la selección de un individuo no debe afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que algún individuoo pueda ser elegido más de una vez. ( "se hacen tantas papeletas numeradas como indivuos hay , se coge una y se devuelve , se vuelve a coger otra y se devuelve , etc" )
Muestreo sistemático : es cuando los elementos de la población están ordenados por listas. Se elige un individuo al azar y a continuación a intervalos constantes se eligen todos los demás hasta completar la muestra. Si el oreden de los elementos es tal que los individuos próximos tienden a ser más semejantes que los alejados , el muestreo sistemático tiende a ser más preciso que el aleatorio simple , al cubrir más homogeneamente toda la población.
Muestreo estratificado : es cuando nos interesa que la muestra tenga la misma composición a la de la población la cual se divide en clases o estratos. Si por ejemplo en la población el 20% son mujeres y el 80% hombres , se mantendrá la misma proporción en la muestra.
Distribuciones de muestreo : al obtener conclusiones de la muestra y las comparamos con las de la población puede que se aproximen o no. No obstante , las medias muestrales se comportan estadísticamente bien y siguen leyes perfectamente previsibles , esto nos permitirá hacer inferencias precisas a partir de ellas , incluso determinar el riesgo que asumimos al hacerlas.
Si una población está formada por N elementos , el nº de muestras diferentes de tamaño n que se pueden obtener , si se pueden repetir los elementos ( m.a.s.) sería :
VRN,n=Nn
Distribución de medias muestrales : aunque al tomar una muestra no podemos estar seguros de que los parámetros obtenidos sean buenos estimadores de los parámetros poblacionales si se puede afirmar que :
Esto significa que la distribución de medias muestrales de tamaño n extraidas de una población ( normal o no normal ) se distribuye según una N(
Ejemplo : Supongamos que tenemos los elementos 2,4,6,.
por lo tanto solo un 2'28% de las muestras tendrá una media por encima de los 3130gr
Intervalos de probabilidad : inferencia estadística ; Como la distribución de medias muestrales es
se tendrá por ejemplo que :
Esto significa que por ejemplo el 68'26% de las muestras de tamaño n extraidas de una población de media
tendrán una media perteneciente al intervalo
En general el 100·(1− )% de las muestras de tamaño n tendrán una media comprendida entre :
siendo el valor de la probabilidad que queda a cada lado del intervalo. O lo que es lo mismo :
(nivel de confianza)
Así por ejemplo si =0'05 entonces el 95% de las muestras tendrán una media comprendida entre
Sin embargo lo normal será que se desconozca la media y la desviación típica de la población y que mediante técnicas de muestreo se busque estimarlas con la fiabilidad necesaria.
Por lo tanto si nos hacen la pregunta de otra forma ( ¿ cuál es la probabilidad de que la media poblacional se encuentre entre ...? ) podremos transformar la desigualdad obteniendo :
(nivel de confianza)
A este intervalo se le llama intervalo de confianza para la media poblacional. A lo que está fuera del intervalo se le llama regíon crítica.
Al valor se le llama nivel de confianza.
Al valor se le llama nivel de significación.
Por lo tanto el nuevo dibujo sería :
Por lo tanto podemos afirmar que en ese intervalo tenemos una probabilidad del 95
% de que está la media poblacional.
Como ya hemos dicho lo normal será que se desconozca la desviación , por lo que debemos sustituir por sn−1=
donde sn−12 es la cuasivarianza muestral.
La relación entre la varianza muestral y la cuasivarianza muestral es :
despejando
Analogamente se puede hacer para la distribución de proporciones.
Ejemplo : se desea realizar una investigación para estimar el peso medio de los hijos de madres fumadoras. Se admite un error máximo de 50 gr , con una confianza del 95%. Si por estudios se sabe que la desviación típica es de 400 gr ¿ Qué tamaño mínimo de muestra se necesita en la investigación?
El tamaño mínimo de la muestra debe ser n =
Contraste de hipótesis sobre la media poblacional : La media muestral ppuede ser diferente de la media poblacional. Lo normal es que estas diferencias sean pequeñas y estén justificadas por el azar , pero podría suceder que no fuesen debidas al azar sino a que los parámetros poblacionales sean otros , que por los motivos que sea , han cambiado.
El contraste de hipótesis es el instrumento que permite decidir si esas diferencias pueden interpretarse como fluctuaciones del azar ( hipótesis nula )o bien , son de tal importancia que requieren una explicación distinta ( hipótesis alternativa ). Como en los intervalos de confianza las conclusiones se formularán en términos de probabilidad.
Comparando la media poblacional y la media muestral ¿ Podemos asegurar que esa muestra procede de una población de media 0? La respuesta será no cuando 0 no pertenezca al intervalo de confianza de , para el nivel de significación prefijado , por el contrario la respuesta será sí cuando sí pertenezca a tal intervalo.
Sí pertenece a la población.................
se acepta la hipótesis nula. Otra forma de verlo es que :
No pertenece a la población .............
se rechaza la hipótesis nula. Otra forma de verlo es que :
Error de tipo I : es el que cometemos cuando rechazamos la hipótesis nula siendo verdadera.
Error de tipo II : es el que cometemos cuando aceptamos la hipótesis nula siendo falsa.
Podemos hacer todavía dos preguntas :
¿ La muestra procede de una población con media mayor que la supuesta?
Se acepta que la media poblacional es mayor que la supuesta
cuando :
desarrollando la igualdad obtenemos que :
La media poblacional debe de estar por encima de
y por lo tanto por encima de
La rechazamos en caso contrario.
¿ La muestra procede de una población con media menor que la supuesta?
Se acepta que la media es menor que la supuesta cuando :
desarrollando la igualdad obtenemos que :
La media poblacional debe de estar por debajo de
y por lo tanto por debajo de
La rechazamos en caso contrario.
Nota : No olvidemos que en todas las ecuaciones anteriores si se desconoce la deviación típica de la población debemos sustituirla por la cuasivarianza de la muestra.
Contraste de hipótesis sobre la proporción p : por analogía con el apartado anterior par responder a la pregunta : ¿ Puede asegurarse que esa muestra de proporción procede de una población con proporción p0?