Vista previa parcial del texto
¡Descarga Estadística descriptiva y más Apuntes en PDF de Estadística solo en Docsity!
ESTADÍSTICA DESCRIPTIVA. Es la parte de la estadística que a través de la acumulación de información, su análisis y síntesis permite describir el comportamiento de un fenómeno. El objetivo formal de la descripción estadistica es la masa estadistica o población. Sobre esa población que tenemos que defirur es preciso elegir la característica desde la cual se quiere estudiar la población. De esta forma, la caracteristica divide o clasifica a la población original en masas parciales o subpoblaciones estadisticas. No sienpre se puede hacer ua investigación exhaustiva de la población y en ese caso tendremos que recurrir al sondeo e al estudio de la misma a través de una muestra que es un subconjunto del total de casos de la población, pero es imprescindible que la nuestra sea representativa del total de casos de la población. Para el proceso «e muesteo se suele hacer mediante tablas de números aleatorios, de forma que todos los elementos de la población tienen la misma probabilidad de pertenecer a la muestra. Este proceso se conoce como MUESTREO ALEATORIO SIMPLE (MAS). Se denominan individnos o elementos poblacionales a todos los elementos que constituyen la población. Los caracteres de un individuo pueden presentar dos o más modalidades que sou las diferentes situaciones posibles de un carácter. Una propiedad de las modalidades de una nusma característica es que deben ser incompatibles y exhaustivas, es decir, cada individuo presenta una y sólo una de las modalidades del carácter. Tipos de Caracteres o Caracteristicas. Se distinguen entre caracteristicas cualitativas y cuantitativas. a) Características Cualitativas: Son las que expresan una cualidad que generalmente no tiene representación. mumérica. También se las denomina Atributos, y clasifican a la población en categorías. Ejemplo: MORENO Color RUBIO de CASTAÑO Pelo PELIRROJO b) Caracteristicas Cuantitativas: Son las que peruiten asignar a cada elemento de la población un número real. Se las denomina también Variables Estadisticas, pueden ser de tipo Discreto o de tipo Contimuo. Variables Estadísticas Discretas: Aquellas que solo pueden tomar valores muméricos enteros. Ejemplo: 1 2 NN” de hijos 3 5 Variables Estadísticas Continuas: Son aquellas en las que la variable tiene la posibilidad de adoptar cualquier número real. En general son continuas todas las variables relacionadas con tiempo, longitudes, volimenes, etc..... Ejemplo: LONGITUD DE SALTO [Menos de 5 [Se denonunan Limite Infenor y Linute Superior a sus extremos. [5-55 Si se diera el caso de que una longitud fuese 5'5 se colocaría aquí. [Mas de 90 Cuando estamos trabajando con variables de naturaleza continua es preciso agrupar los infinitos valores que pueden tomar la variable mediante intervalos de clase. Estos intervalos pueden ser, o tener, de amplitud constante o variable. TEMA?. SERIES Y ESTADISTICAS, L Tablas de Distribución de Frecuencias. a) Datos sin agrupar. El examen de los elementos de una muestra, o toma de datos, da lugar a una serie de valores adoptados por la varigble, en el orden en el que se van obteniendo. Seguidamente si el rango o recorrido de la vanable no es excesivamente grande, los valores se colocan por orden de magnitud creciente, en forma de Tabla de Distribución de Frecuencias. Warores pe [FRECUENCIAS|FRECUENCIAS [FRECUENCIA [FRECUENCIA [FRECUENCIA [ABSOLUTA — RELATIVA PAVARIABLE lassoLutas [RELATIVAS |PORCENTUAL [ACUMULADA |ACUMULADA pa hi pi=5+100 [u Fi lx har [er Ni=m E El ln [Pp SEL Pi az es atadas 81-045 J = 7 Es] 3 S [ni =30 A=1 [pi =100 REPRESENTACIONES GRAFICAS. A) Para Datos sin agrupar: L Diagrama de barr unos segmentos verti : Enel eje de abcisas se señalan los valores de la variable, construyendo sobre estos es de longitud igual a cada una de sus frecuencias, E sá nl 15 X1X2X3 X4X5 Xi 2. Diagrama de Lineas: Se realiza miendo mediante segmentos los puntos: (X1 11) (2,12) 03 13) mu FE] X1X233 X4X5 Xi B) Para Datos Agrupados: 1. Histogramas: $e marcan en el eje de abcisas los extremos de los intervalos de clase y sobre cada intervalo se construye un rectángulo cuya base comcide con la amplitud del intervalo y cuya altura es igual a la frecuencia de dicho intervalo. Si la amplitud de los intervalos no fuera la misma en todos los intervalos, la altura de clase la tendríamos que calcular. hi=0mi/ai E 5] ml n5 0112 BM15Xi » Polígonos de Frecuencias: $e obtiene al wur por segmentos los puntos medios de las bases superiores de los rectángulos del Histograma. Se debe prolongar la linea poligonal hasta las marcas de clase, inferior y superior, a los que 8guran en el Histograma, para cerrar el polígono con el eje de abcisas. 5 E m4 al m5 2 5x1 C) Otras Representaciones Gráficas: L Pictogramas: Se utilizan dibujos para representar la variable, no son precisos. 2. Cartogramas: Lo mismo que el anterior pero en vez de con dibujos con colores, se utilizan cuando se está estudiando sobre zapas. 3. Diagrama de Vectores: Es aquel que asigna a un sector de un circulo proporcional a la frecuencia del dato. seutiliza en pocas categorías Ejercicio 3: En las elecciones de um país han sido elegidos 200 candidatos de los partidos A, B, C y D VOTOS + PARTIDOS la E E 65 l 30 p 15 7] nl 10251415%X TEMA3. MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL. Son valores alrededor de los cuales se agrupan los valores de la variable y que en muchos casos se toman como representantes de la disibución. A) Datos sin Agrupar: 1. Media Aritmética Simple: Es la suma de los valores adoptados por la variable dividida por el número de ellos. xi x= N Ejercicio l: En un curso hay 8 chicos y 6 chicas. la nota final de curso fue: Chicos: 2,3,4,5, 6,6, Chicas: 3,4,5,6,7.8 A Media de los chicos 0 x= 3 3+445+6+H8 Media de las chicas dx= 6 2. Media de Medias: Si ni datos tiene por media el valor xi media, n2 tienen por media x7 y mu tiene por media xn. A -xi-mi N Ejercicio 2: En 4 institutos se ha calculado el peso medio de los estudiantes, en el instituto A. que tiene 120 alumnos. el peso medio es 674 Kg; en el B, con 140 alumnos, el peso medio es 39'5 Kz; en el €, con 90 alumnos, el peso medio es 642 Kg y en el D, con 130 alunmos el peso medio es 36 Kg. 1005624 1406 595x= 20064 1306 56 290)+(56-130) FALTA ALGO*** 3. Media Aritmética Ponderada: Ejercicio 3: Al principio de un curso se especifica a los alunanos que realizaran 3 exámenes parciales y un final. El segundo parcial tendrá una importancia doble que el primero, el tercero doble que el segundo y el final triple que el tercero. Un alumno obtiene un 10 en el primer parcial, 7 en el segundo, 3 en el tercero y un 4'%5 en el final. ¿Cuál será su nota final de curso? XL [3 x4 10 7 y E Pi [p [P3 Pa p Pp Hp 12p 5-4p)+(4'25-12p) 95p p2p+4p+12p 1 B) Datos Agrupados en Intervalos: L- La suma algebraica de las desviaciones de un conjunto de números respecto de su media aritmética es 0 n55 3-9) H6-D)w8-9)4C10-9)-H(18-9) =6-3-1+1+9=-10+10=0 2. $1 suponemos, antes de calcularla que la media de un conjunto de números es cualquier valor Á resulta que ladera media aritmética sería: Desviaciones de cada observación respecto de la media, partido por el número de observaciones. 36-78-7107) 18-7) 41+1+3+11 10 555 METODOS PARA CALCULAR LA MEDIA, 1.— Método Directo: Consiste en aplicar la formula de la media ponderada con la única salvedad de que se toman como valores representativos de la variable, las marcas de clase de cada intervalo. Xmmni Í= N=m Xin : Marcas de clase. ni : Frecuencia de cada intervalo. Ejemplo: Intervalos —— Jai Ximni 10-14 1 [7] 14-18 7 12 18-27 10 200 p2->6 16 584 dni3 x=A+-T=24+-4=24-(004) =2376 N50 Mediana: Ordena los datos en una distribución de menor a mayor, la mediana es el valor central de esa serte, es decir, el valor de la variable que deja 50% de la distribución a la izquierda y el otro 50% a la derecha. a) Datos sin agrupar: Serie: 5, 6, 9, 11,15, 19, 23, 26, 27 0 El 15 seria la mediana Serie: 5, 7, 10, 15, 20, 21, 24, 274 El 15 y el 20 serían la mediana 1520 Me==175 1/3 =033 Me=4'16 Serie: 5, 6, 8,8,8,8, 10,12, 138 El 8el 8 y el 8 serían la mediana m+l Posición: 1: Diferencia entre la frecuencia del intervalo modal y la frecuencia de la clase contigua inferior 2: Diferencia entre la frecuencia del intervalo modal y la frecuencia de la clase contigua superior. I: Amplitud del intervalo modal. Ejemplo: [CLASES] ni 10-20 1 20-30 14 30-40 E 1=30-21=9 ] 40-50 [30 50-60 18 >= 30-18=12 ] (60-70 Lo 70-80 7 80-90 B 19 Mo=1+-1=40=-10=4428 1+29-12 RELACION EMPÍRICA ENTRE X, Me Y Mo. Existe una relación empirica o de tipo experimental, entre las tres medidas de tendencia central más Importantes. Esta relación viene expresada por la siguiente igualdad: X-Mo = 3(X-Me) Esta relación se verifica con tanta mayor exactitud cuanto más simétrica sea la distribución. Cuando una distribución es asimétrica se verifica que: X=Me=Mo Asimetria Posi Mo MeX Mo Me=>X Ejemplo: [CLASES [ni d [dni [NI 10-20 11 3 (33 11 20-30 14 2 [28 [23 30-40 [21 ml ll 46 40-50 50 [O [0 76 [50-60 18 1 18 [94 [6070 15 2 Bo 101 70-80 [7 3 [21 116 80-90 B 4 12 119 119 ml dmi-1 x=A+-1=45+-10=44'91 N119 IN10 Me=l+-i=40+(5 Me230 9 Mo=1+-1=40- -10=44'18 1+29+12 X-Mo = 3(X-Me) 445) 244491) =43'68 [EMPIRICOS X=4'61 0 3Me-Mo (3:44'5)-4428 0 2X-Mo (244914478 Pl=1+4 £P1 100 P25=0Q1 P50=D5=02=Me [El 199N P00=1+-4 1P99 100 Ejercicio 5: Hallar Q1, Q3, D2, D7, P8, P62. hni ú 5 [5 [Ps [9 14 [Dz Q1 14 28 E ES [D7q3 Le 74 18 E] 7 po E 110 110=5 IN -14)= 3482801 4 118 (875-740) =47'36 14) =37'85 ( CLASES £D7 10 ISN P3=1+-4=25 3/9(88-5) = 2714 1P3 100 I62N P62=1+-£i= 1P62100 MEDIA GEOMETRICA. Es otra medida de tendencia central. Se utiliza en vez de la Media Aritmética para evitar la distorsión que puede darse en la media cuando la frecuencia de los valores extremos es alta. También se utiliza cuando es conveniente trabajar con escalas logarímcas. Ejemplo 3 Calificar de 0 a 10. El 0 y el 10 serian los valores extremos. A) Datos sin Agrupar: Xó=X1, X2.........Xn Ejemplo: Sene 5, 6,8, 109 X=56-8-10=6'99 log Xi logXG= n Ejemplo 8 log XG=1'55 6 XG=amtilog 155 B) Datos Agrupados: log Xmni log XG= n Ejemplo: log Xmni 91'81 log XG === 1'53 [1 SEMANA 7 SEMANA 10 30 po 40 Bo 50 [50 50 [60 60 [30 60 100 60 830 350 La dispersión mide cuanto se dispersan, en media, los datos de una distribución respecto una media de tendencia central XxX - Dispersión muy alta Dispersión baja Además la dispersión sirve para explicarnos como se comportan los datos respecto de la media de tendencia central MEDIDAS DE DISPERSIÓN MAS UTILIZADAS. Rango Semiintercuartilico: Es la senudiferencia entre el tercer y el primer cuartil. 03-Ql Q= Esta medida tiene el inconveniente de que sólo se fija en el 50% de las observaciones y además desprecia los valores extremos, por lo que su uso debe ir acompañado de la medida del rango o recorrido de la variable Se suele recomendar su uso cuando la medida de posición más representativa sea la mediana; también cuando trabajemos con una distribución que presente concentración de valores alrededor de algún valor central. Ql Me Q3X1 Ejercicio 1: Calcular el rango semiintercuartilico CLASES — [Ni Ni B 3 [5 8 [Q1 10 18 13 36 |: 60 [03 Lo [80 13 93 55-60 7 100 ] 100 ] Q1=1+(4 4) =35=+ 5/18 05-18) =36'9 £01 03=1+(3N/4- fi) =45 + 5/20 (15-60) =48'75 103 03-01 4875 Q===392 1) 22 Ra=60-00=40 Desviación Media: Es la media aritmética de las desviaciones de cada uno de los valores de los valores de la variable con respecto a una media de tendencia central de la distribución. A) Datos sin Agrupar: Xi Xi XI DM= N B) Datos Agrupados: m-X] «mu DM= N Ejemplo con Datos sin Agrupar: (Xi—XJ18 DM===18 N10