








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
El concepto de estadística y sus dos significados: colecciones de datos numéricos presentados esquemáticamente y ordenadamente (estadísticas) y estadística como ciencia. Se incluyen ejemplos de fenómenos aleatorios y se explica el proceso de obtener muestras aleatorias. Además, se presentan conceptos básicos de estadística descriptiva como frecuencias absolutas y relativas, tablas de distribución de frecuencias, medidas centrales (media aritmética y mediana) y medidas de dispersión (recorrido, desviación media y varianza). Se incluyen ejemplos con tablas y gráficos.
Tipo: Apuntes
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









II.
El pensamiento estadístico será un dia tan necesario para el ciudadano como la capacidad de leer o escribir. H.G. Wells
1.-Fenómenos aleatorios y determinísticos
¿ Que es la estadística?.
La palabra estadística se emplea con dos significados distintos :
a) Estadísticas ( en plural ) selecciones de datos numéricos presentados en forma esquemática y ordenada. b) Estadística como ciencia.
Para el alumno la estadística debe tener el significado de la opción b) y desde este punto podemos dar la definición de estadística como:
" la ciencia que estudia la técnica o método que se sigue para recoger, organizar, resumir, representar, analizar, generalizar y predecir resultados de las observaciones de fenómenos aleatorios. "
Partes de la estadística, en esquema:
Encuestas. Organización datos. Tabulación. Representaciones. Cálculo de parámetros.
Interpretación de resultados. Conclusiones y predicciones.
Decimos que un fenómeno o experimento es aleatorio si reúne las siguientes características: a) Podemos realizarlo el número de veces que deseemos sin alterar las condiciones del experimento. b) No se puede predecir el resultado.
Ejemplos : lanzar una moneda al aire, un dado, extraer una carta de la baraja, hallar el número de tornillos defectuosos entre 10 elegidos al azar en una caja.
Si no cumple alguna de las condiciones establecidas, estamos ante un fenómeno o experimento determinístico. Son ejemplos de este tipo: tirar una piedra al vacío y medir su aceleración. Se caracteriza por que podemos preveer su resultado, en contra de los fenómenos aleatorios.
Los fenómenos que estudia la estadística son los aleatorios.
Otros conceptos como población estadística, unidad estadística, muestra, tamaño muestral, son estudiados con más profundidad en Métodos Estadísticos.
2.-Variable estadística monodimensional: tipos
Consideramos un experimento o muestra de una población cualquiera y realizamos 'n' pruebas o 'n' observaciones, de esta forma obtenemos un conjunto de observaciones que llamaremos muestra aleatoria de tamaño 'n'. Los valores o cualidades que representan los 'n' resultados de las 'n' pruebas realizadas le llamaremos variable estadística.
Hemos visto que un carácter estadístico es una propiedad que permite clasificar a los individuos de la población.
Hay dos tipos:
a) Caracteres estadísticos cuantitativos: Se dice que un carácter estadístico es cuantitativo cuando sus modalidades son medibles (expresables como números y cumpliendo unas propiedades de medida.). Ejemplos: peso, talla, pulso, edad, etc.
b) Caracteres estadísticos cualitativos: Se dice que un carácter estadístico es cualitativo cuando sus modalidades no pueden ser medidas. Ejemplos: raza, sexo, profesión, estado civil, etc. Nota: Es evidente , por ejemplo, que si el carácter es el estado civil, podiamos asignarle a sus modalidades los siguientes números:a los casados 1 , solteros 0 , viudos un 2, etc, pero este carácter no es medible en el sentido de que el 1>0 por ejemplo , expresión que no tiene sentido.
Ejemplos: La profesión es un carácter cualitativo. Dentro de el podemos tener modalidades: profesor, peón, abogado, etc.
Si realizamos un experimento o tenemos una muestra de de tamaño n , que tiene por variable estadística xi y el valor de una de las variables es n' , o el suceso ha ocurrido n' veces, entonces:
Llamamos frecuencia absoluta del valor xi al número de veces que se repite dicho valor (n')
fr. abs (x (^) i )= fi =n'
frecuencia absoluta acumulada del valor xi a la suma de las frecuencias absolutas de todos los valores anteriores a xi más la fr. absoluta de xi.
Llamamos: frecuencia relativa del valor xi al cociente entre el número de veces que se repite xi (frecuencia absoluta) y el número de pruebas realizadas (n'/n).
Fr. rel (x (^) i )= h (^) i =n'/n
frecuencia relativa acumulada del valor xi a la suma de las frecuencias relativas de todos los valores anteriores a xi más la fr. relativa de xi.
Llamamos Distribución de frecuencias absolutas a la aplicación que asocia a cada valor de la variable estadistica su frecuencia absoluta. Análogamente sería para frecuencias relativas.
Tablas estadísticas a una presentación en forma de tabla de la distribución de frecuencias absolutas, que suele ir acompañado de las frecuencias relativas. Este primer ejemplo es una tabla estadistica simple.
Una tabla estadística simple es la siguiente:
Not xi
F.abso.f (^) i F.Relat. h (^) i
Tabla estadisticas acumulativas La tabla la podemos hacer con las frecuencias acumuladas, tanto relativas como absolutas
Var. Fr. absolutas Fr. Relativas
Nota xi
F.abso f (^) i
Acumlad F (^) i
F. rel. h (^) i Acumula Hi
0 1 2 3 4 5 6 7 8 9
Ejemplo 3.2.1 : de variable aleatoria continua y con los intervalos de igual tamaño
Experimento: Muchas personas experimentan reacciones alérgicas a las picaduras de insectos. Estas reacciones difieren de paciente a paciente, no solo en la gravedad sino también en el tiempo de aparación de la reacción. En 40 personas se han obtenido los siguientes resultados: 10'5 11'2 9'9 15'0 11'4 12'7 16'5 10'
Histograma
D. de Sectores
Histogramas
Utilizado sobre todo para distribuciones de variable estadistica continua, donde dividimos en intervalos generalmente de igual amplitud. Si hacemos de distinta amplitud hemos de cuidar en el diagrama que tengan la misma área los rectangulos determinados. Si representa a una variable discreta, como es este caso, es conveniente que los rectangulos no estén 'pegados'.
Diagrama de sectores
Consiste en representar, mediante sectores circulares, las distintas modalidades de un carácter, teniendo en cuenta que los sectores han de tener un ángulo central proporcional a la frecuencia absoluta correspondiente. En consecuencia, el área del sector circular será proporiconal a la frecuencia absoluta.
Gráficos con las tablas acumuladas
4.-Medidas caracteristicas
Tenemos la representación en forma de tabla de una distribución de frecuencias, hemos visto alguna de sus representaciones gráficas más caracteristicas, pero todavia no es suficiente. Por un lado las tablas pueden ser muy costosas para su interpretación y no resumen adecuadamente la información. Por otro lado, es dificil comparar dos distribuciones distintas. Por otro lado con las graficas pueden hacerse distorsiones y manipulaciones en: -Alteración de las escalas. -Inicio de las escalas -Mantenimiento de la proporcionalidad de lineas.
Utilizaremos dos tipos de medidas, que llamaremos características. =Unas de medidas son para medir los valores centrales (medidas centrales). =Otras nos darán valores de cuan dispersos están los datos respecto de los valores centrales (medidas de dispersión) =Y por último, otra para poder comparar distintas distribuciones entre sí.
De tamaño : Media aritmética
De posición: Mediana.
De frecuencia : Moda
Recorrido Desviación Media
Varianza
Desviación Típica.
Coeficiente de variación de Pearson
Objetivo perseguido con las medidas : resumir y sintetizar un conjunto de datos mediante un único número o unos pocos.
Se llaman Medidas de centralización a los valores que tienden a situarse en el centro del conjunto de datos ordenados respecto a su magnitud.
Las medidas centrales más importantes son:
Media aritmética, Mediana, Moda.
Se llama mediana de una variable estadística, y se representa por Me , a un valor de la variable, tal que existen igual número de observaciones mayores que menores de Me. Es decir, el número de datos que preceden a la media es igual al número de datos que le siguen, por lo tanto, es el valor central en caso de que el número de valores a tomar sea impar, o los dos centrales si son pares.
Ejemplo: Hacemos las frecuencias acumuladas +)))))))0))))))))))))))0))))))))))))),
La mediana se utiliza especialmente en los siguientes casos: -Cuando se vea que los valores extremos son excepcionales. -Cuando los datos están agrupados en clases y las clases extremas son ( al menos una de ellas) abiertas.
Se llama moda de una distribución de frecuencias, y representamos por M (^) o, al valor de la variable estadística que presenta mayor frecuencia. Es por tanto, el valor que más se repite.
Ejemplo: En nuestro caso será el 5 pues se repite 15 veces.
Ventajas e inconvenientes de la moda:
Evidentemente este parámetro no es tan representativo como la media, pero es útil en muchas ocasiones. Por ejemplo cuando la moda se destaca preferentemente. En geografía puede ser la expresión de un estructura determinada, caracterizar una región, al darnos de un clima dominante , etc. Por otro lado es el único valor cantral que puede calcularse en las series nominales.
Ejemplo :
En un grupo se procede a la elección del cargo X al que lleve el máximo número de votos:
La elección resulta asi:
Personas a elegir: Número de votos:
Juan Pérez Maria López Carmen Vazquez
Aquí en este ejemplo unicamente tendría sentido calcular la moda.
Las medidas dispersión más importantes son:
Recorrido, deviación media, varianza y desviación típica.
Las medidas centrales de una distribución nos hablan de como es por los valores medios, puediendo haber dos distribuciones muy distintas que tengan valores medios similares. Queda pues la investigación incompleta, siendo necesario conocer en qué medida los datos númerico están agrupados o no alrededor de los valores centrales
Ejemplo en donde el alumno puede observar la necesidad de las medidas de dispersión:
Al.<------Notas ------->
x 9 2 3 0 4 8 2 8
y 6 5 6 4 4 5 4 2
Nota Media de X =4.5 Y= 4.
Se llama recorrido o rango de una distribución a la diferencia entre el mayor y el menor valor de la varible estadística.
Ejemplo: En el ejemplo que seguimos desde el principio de notas el recorrido=10-0=
números positivos. 2: Cuanto mayor es la dispersión le corresponde mayor varianza, y, en consecuencia, menor es la representatividad de los valores centrales. 3: La varianza depende de todos los valores de la variable.
La expresión de la varianza mediante operaciones obtenemos la siguiente, que resulta más facil para el cálculo.
Ejemplo:
Inconvenientes de la varianza: El inconveniente principal es que utiliza unas medidas distintas a las que tratamos en la variable. Al estar elevado al cuadrado perdemos referencia respecto a las variables.
raiz cuadrada positiva de la varianza.
Sus expresiones según los casos es la siguiente:
fórmula que usaremos en la construcción de las tablas
Otras ventajas de la desviación típica:
Es interesante saber que así como para calcular la desviación típica hemos elegido la
media, si se tomase otro valor, como por ejemplo la moda, la mediana , o un valor m cualquiera puede desmostrarse que la media aritmética es el valor que hace mínima la expresión. Dicho con otras palabras , de todas "las posibles desviaciones típicas
En el estudio de la estadística inferencial, veremos tambien la importancia que tiene la desviación típica en las distribuciones normales.
El coeficiente de variación (de Pearson) Cv=des.tip/media
No tiene unidades y se utiliza para comparar distribuciones con distintas medidas. Por ejemplo tallas y pesos. Suele expresarse en %. Tambien se utiliza cuando al comparar dos distribuciones sobre la misma variable están medidas en distintas unidades, por ejemplo en m y Km. En definitiva, que nos mide la dispersión relativa de una distribución.
Ejemplo: con unas notas 3' notas 1: =4'5 F =3'16 ==> C (^) v= )))))) = 0'70-->70% 4'
1' notas 2: =4'5 F =1'2 ==> C (^) v = )))))) = 0'26-->26% 4'
Ventajas Permite comparar distribuciones distintas, incluso con medidas distintas. Desventajas Deja de ser representativa y no debe utilizarse cuando la media de una de las distribuciones sea muy baja.