




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica 1, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UB
Tipo: Apuntes
1 / 181
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Victoria Alea Riera
Ernest Jiménez Garrido Carme Muñoz Vaquer
Núria Viladomiu Canela
Tema 1. CONCEPTO Y CONTENIDO DE LA ESTADÍSTICA
Objeto de la estadística Estadística descriptiva e inferencia estadística Población y muestra Datos. Clasificación y escalas de medida Instalación del programa R-Commander
La ESTADÍSTICA da respuesta a preguntas como son:
La estadística permite reducir la incertidumbre en el proceso de toma de decisiones en el ámbito empresarial, económico, político, etc.
El proceso estadístico comienza identificando el grupo cuyo comportamiento se quiere describir. Este grupo recibe el nombre de POBLACIÓN. La población estadística está formada no sólo por personas, sino por cualquier tipo de objetos o entidades sobre los cuales pueda observarse alguna característica.
Por ejemplo, se quiere averiguar la proporción de electores de Badalona que votarán a un determinado candidato en las próximas elecciones municipales. En este caso la población está formada por todos los habitantes censados en Badalona con capacidad de voto.
Un fabricante quiere calcular el porcentaje de unidades defectuosas con que opera su proceso de producción. En este caso la población la constituyen todas las unidades fabricadas mientras el proceso se mantenga en su actual estado. En este caso el número de elementos de la población es teóricamente infinito.
Dada la naturaleza limitada de la información muestral, al inferir (inducir) el comportamiento de la población a partir de la descripción de la muestra, es necesario evaluar la fiabilidad de los resultados en términos probabilísticos.
La TEORÍA DE LA PROBABILIDAD permite calcular el margen de error con el que puede aceptarse el modelo matemático o teórico de comportamiento propuesto para la población.
La observación de la característica de interés en la muestra proporciona los DATOS. Los datos pueden consistir en un conjunto de valores numéricos o modalidades. Por ejemplo, si se sondea a la población de electores de Badalona sobre su intención de votar a determinado candidato los datos presentan dos modalidades: SI/NO. En el caso de que se analicen los resultados académicos de los estudiantes de Andalucía, los datos serán valores numéricos, de 0 a 10. En el caso de que se analice el importe del alquiler de las viviendas de una localidad, los datos son valores numéricos en Euros.
Las VARIABLES son las características de los individuos que se quieren estudiar y pueden tomar distintas modalidades o valores.
Los DATOS son el conjunto de observaciones de una o más características obtenidas de una población o de una muestra.
Es importante distinguir entre los distintos tipos de datos con los que podemos tratar. Sus diferencias determinan la selección y aplicación de las técnicas estadísticas
Tema 2. DISTRIBUCIÓN DE FRECUENCIAS Y REPRESENTACIÓN GRÁFICA
Tabla de frecuencias simple: variable discreta Diagrama de barras y de frecuencias acumuladas Tabla de frecuencias con valores agrupados: variable continua Histograma y polígonos de frecuencias Análisis exploratorio de datos: diagrama de tallo y hojas (Stem and Leaf)
Recoge de forma resumida el conjunto de datos resultantes de la observación de una variable en un colectivo o muestra de n individuos.
Elementos de una tabla de frecuencias
Xi ni fi Ni Fi x1 n1 f1 N1 F x2 n2 f2 N2 F …. … … … … xi ni fi Ni Fi … … … … … xk nk fk Nk=n Fk= n 1
Interpretación de las columnas de la tabla:
1
k ∑i = ni^ =n La suma de todas las frecuencias absolutas es igual a n.
1
k ∑i = fi^ = La suma de todas las frecuencias relativas es igual a 1.
Si se multiplican las frecuencias relativas por 100 se obtienen los correspondientes porcentajes.
i
i
Si las frecuencias relativas acumuladas se multiplican por 100 se obtiene los porcentajes acumulados.
Li-1-Li Xi (ci) ni fi Ni Fi L0-L1 (^) x1 ni f1 N1 F L1-L2 x2 n2 f2 N2 F …. (^) …. …. .... …. …. Li-1-Li (^) xi ni fi Ni Fi .... … .... .... .... .... Lk-1-Lk (^) xk nk fk Nk=n Fk= n 1
Interpretación de las columnas de la tabla
L i (^) − + Li.
k
Diagrama de Escalera
El diagrama en escalera se utiliza para representar las distribuciones de frecuencias absolutas o relativas acumuladas correspondientes a una variable discreta que toma pocos valores diferentes.
Para construir el diagrama se sitúan en el eje de abscisas los valores de la variable y en el de ordenadas las frecuencias acumuladas. Se marca los puntos de coordenadas (xi, Ni) o (xi, Fi) según se quiera representar las frecuencias absolutas o relativas. Desde cada uno de estos puntos se traza una recta paralela al eje de abscisas hasta el valor siguiente de X, es decir, hasta el punto (xi+1, Ni), dado que entre dos valores consecutivos no hay acumulación de frecuencia. Los puntos extremos de las líneas horizontales se unen con líneas verticales dando al diagrama el aspecto de escalera.
Por ejemplo, para una variable X que toma únicamente los valores x1, x2, …, x6, el diagrama de frecuencias relativas acumuladas podría ser:
Histograma
Se construye colocando en el eje de abscisas los intervalos en los que se agrupan los valores de la variable. Sobre cada intervalo se dibuja un rectángulo cuya área debe ser igual o proporcional a su frecuencia.
En el histograma:
Polígono de Frecuencias
Es un gráfico que sintetiza el perfil del histograma y suele presentarse superpuesto a éste.
El polígono se construye situando en el eje de abscisas los límites de los intervalos definidos en la tabla y en el de ordenadas las frecuencias acumuladas. Se señalan los puntos correspondientes a los límites superiores y sus frecuencias acumuladas, (Li, Ni) o (Li, Fi), y con trazo continuo se unen dichos puntos, empezando por el punto (L0, 0) (límite inferior del primer intervalo, frecuencia acumulada 0) y acabando en el punto (Lk, n) o (Lk, 1) (límite superior del último intervalo, frecuencia total acumulada.
Al realizar el gráfico, dado que ya no se dispone de las observaciones correspondientes a cada intervalo, se supone que éstas se reparten uniformemente en el intervalo, por lo tanto, la frecuencia se acumula de forma lineal.
Por ejemplo, para una variable X se ha tabulado en K intervalos, el diagrama de frecuencias absolutas acumuladas podría ser:
Este tipo de gráfico es adecuado si se quiere:
Diagrama Stem-and leaf (Gráfico de tallo y hojas)
El diagrama de tallo y hojas es una técnica para presentar datos cuantitativos en formato gráfico.
Esta técnica proporciona simultáneamente:
Al igual que el histograma, mediante el diagrama de tallo y hojas se visualizan diferentes rasgos de la distribución como son:
Comparándolo con el histograma presenta las siguientes ventajas:
Para construir este diagrama:
Si se subdividen en 2 partes, a la primera le corresponderán las hojas del 0 al 4 y a la segunda del 5 al 9.
ni Tallo Hojas 5 3 22244 10 3 5555777789 15 4 001222222233333 10 4 5555577899 5 5 00111
Unidades de las hojas: 1 3|2 representa 32
En el diagrama de tallo y hojas anterior se observa que la distribución es poco dispersa, los valores centrales están alrededor del 42, no presenta saltos o lagunas ni valores extremos y es simétrica.