Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica, Apuntes de Estadística

Asignatura: estadistica, Profesor: Orti Mario, Carrera: Trabajo Social, Universidad: UCM

Tipo: Apuntes

2013/2014

Subido el 07/10/2014

boidan-1
boidan-1 🇪🇸

2.7

(12)

15 documentos

1 / 27

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b

Vista previa parcial del texto

¡Descarga estadistica y más Apuntes en PDF de Estadística solo en Docsity!

da y los Capi fínlos 5, 4 y Antonia Vallejos 5 por Autor ss Ly ó han ado r fs par Bar > Welejos endo conjumamerte por Yolatd MÉTODOS Y TÉ DE INVESTIGACIÓN EN indice OOOY ÁMBITO DEL Dosicón a reniidad tetcticas normalizadas de aplicación dl octal 3 Una ate Hora puedo teproducires Corea ss Ñ pico, nelesendo Pata Capítulo z > islormación . . . sistensa de vesogeriór 41 Centre de LLL ÓN cn Y a Bamán areres, > 2 La eruueste como proneso de irves mia rigoa finción y léncos 2. de cucuesia COLMO TÍO ys y errevista tomás Brotón, 9 > 208015 Madrid 3, E cuestionan » Teleton MA ESA 6. Ll trabajo de canipo . Anúlisis du datos o 8. Li Questrá co Lo yl ren los ancrestas por MILEsSTT O ea le cuestionado piola Embcratos entre cor A dican ElUn Dare desu Hempa ata di ah render la niñas o general ehablar mg, ES PrOmtO : Nótese que Hihgana de: estás. cuestiones. tal cómo Pasido | una de suivartables lleva o produzca , daiplicid ná hipórivis de qu y An - plantean derentes, is pueguntas que: implica el Os procedimia nes sociológicas, Según cuáles sean los objetivos de las investiga mpre desde una óptica cuantitativista, podemos distinguir entre: estu- 3s expleratorios, que utilizamos para introducirnos en el conocimiento un fenómeno o llegar a nuevos aspectos de éste, con el uhjetivo de for- dar vo problema o un tema de partida con mayor precisión o con el fin poder explicitar alguna hipótesis; estudios descriptivos, con 108 que se stende normalmente describir las características de una determinada blación (determinar la Frecuencia con la que algo ocurre en ella) y tam- 3 establecer asociaciones o relaciones entre esas características; y estu- as explicativos, en donde se formulan y se verifican hipótesis causales, decir, hipótesis de relación causal, que afieman que un cambio en una terminada característica es uno de los factores que determinan la apari- 3n de otra característica Lo que aquí vamos a desarrollar afecta sobre todo a los estudios de rácter descriplivo. LA MATRIZ DE DATOS En este tema continuamos describiendo la lógica que subyace en el cuantitativista de la investigación social, centrado en la investi- aradigma O ación por encuesta y su específico proceso de producción/registro de datos, Y Selitiz er al.: Métodos de investigación en 976). pp. 148-149. Es éste no manual clásico cuya primer a con Paul Luzarstela), Morton Dentsch y Start Couí 959, incorporó a Claire Selltiz. Es su tercera edición, de 1976 (ya sin Jahoda ni Deutsch), a ges tano. Posteriormente, en 1981, oste manual conoce una cuarta edición. 2 Ibid, pp. 132-133 y 165 las relaciones sociales, Madrid, RIALP, 1980 versión elaborada por Marie Jakiuda se remonta u 1951. La seganda edición, + El especítico proce ñ : do cn O de producción de datos estadísticos está asocia- tarjetas pertoradas A ma de registro, iniciado a finales del siglo XIX de litar el cálo Hollerith, cuyo modelo adoptó IBM, capaces de fai ar el cálculo mecánico-informático a aran escala o capaces de faci- expresión analítica en la mattiz de datos Y que encuentra su Todo saber e tomo nos recordaba Foucault 5 Fctis . ault— está incardi práctica espec S; Mt está incardinado e, litativa O le Y el desarrollo metodológico de la investigació en una sociado al desarrollo tecnológico que la hace sit il ena osible La mutri ; posible. clara, duatrio de datos es lo que permite el cálculo. Y es : sá a que estructura la investigación de: e ativa. Es la me A osos en des de todas las tablas. Los datos siempre so prese ta a a en la matriz de datos original y en las bol sentarán hace lao partir de ésta. Insertar una población en una tabla 4 doo e peración estadística, es reducirla a términos maneje Los es lo que 5. in matriz de datos esto no sería posible e menciabies, calcula. Ñ Por eso la pieza sde la perspectiva cuanti- La matriz de datos es el cruce de unid para las unidades que se desca explorar utilizadas para explorarlas. lades con variables: tiene “n” filas y “ra” columnas para las variables La reculección/producción de datos. o lu que es 1 ción de la matriz de datos -base del análisi o músmo, la produc a ode se sustenta en dos principios: nio de Z ción, stsado en el momento de la elaboración nai Cola oración del esquelna matricial en el que se inser- ta po Ñ 2 sin el cual cada su Ijeto debe poder dar una y sólo a pres sd o presunta (según los principios de exhaustivi- do lación e los que ya hemos hablado), o dicho de otro tidad debe poder tomar un solo valor en cada variable. 2. Eveipio de integridad, centrado en el proceso de interacció da tado O de entrada de datos en el esquema male dy según e De e Mamos encontrar empíricamonte un valor dentro de ar al le para todas las unidades, 08 decir, no debe- $ encontrar coldas vacías (sin respuesta) en la me triz Me hay que hacer lo posible para reducir las celdas y AAN Esto nos lleva al tema de las “no-re: MI que “no sabon/no contestan”. Sólo $ ce mínimo. Spuestas” y al qué hacer con los €n raras ocasiones las “no-res- 3 Pone: : oucasll, M.: La verdad y las formas jurídicas (1972), Barcelona, Gedisa, 1991 Colocamos a los sujetos en las filas, de manera que a un sujeto le wresponderá una lila; y a las variables en las columnas, de manera gue a da variable le corresponda una cotumna. El valor que toma ula sujeto en 1a variable aparecerá en el cruce de ese sujeto con esa variable. La matriz de datos presentará, por lo tanto, este aspecto: / y ” : : Y, LA Y; e Va a S, Tr la la y TE Ton S a Ta e Es To $, Sa Us “ Ty ... Cxtn-L E Ls Ea Sa e 5, E) Lim Bra mbr Ena > Toa . Tasa Fin 5 Pt Pxz Ina me iy o aa Im La matriz de datos estricta será la que componen las respuestas. Tenemos una fila para cada sujeto y una columna para cada variable”. 7 Si digitalizamos la matriz (tarea necesaria para la ausomatización de los cálculos), redu- jendo sus contenidos a "unos" (1) y “veros” (0), las variables sc descompondrían, eu las colurmas, á sus valores. Si nos fijamos en Ja variable V,, que divide a la pobiación en k valores y). y subeividimos en sus valores la columns de la matriz correspondiente a los registros de la matriz guedan reducidos a unos" y “cesos”. Como cada unidad lo puede tomar un valor dentro de cada variable, sería éste el único marcado con un “uno” en la la que corresponde a esa unidad, Así, pur ejemplo, pará dicha variable y para una determinada la sigwente submatriz de datos empírica. Para cada variable de Ja _ a $, 0 , o o S, , 0 ú 2 S, 0 “ 0 ñ 0 1 > 0 Sus 0 o 2] 5, 0 1 € 0 Suponga » an eo amos que tenemos una encuesta en la que hemos en m ividuos [N = 127. 8 vista tenido e Ros ÍN 1 Supongamos que una de las variablez "treyista 0 n consideración para clasificar a los individuos es el EU hemos SExo” A esta variable la podemos llamar, por cj ó > ejemplo, Y. e ¿homhre/ o /mujer?. Por ejemplo, Y. Y, puede tomar los valores V, = (Hombre, Mujer] ] Supongamos que los individuos en cuestión tom: res, de manera que la columna de la variable la matriz de datosé: eo nan Los sigmientes yalo- Sexo” queda como sigye en _AA— a —_—Á SEXO eo [Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Majer So | Hombre Hombre Mujer 0 i ió stribuye según la De esta manera podemos decir que la población se distribuye seg; ariable “sexo” de la siguiento manera; SEXO 1 Hombres 7 Majeres 5 My 1 istrad s 12 sujetos Supongamos que otra de las variables registrada en los ! e nvostigados es el “estado civil”. Así, añadiendo la colma o e o líente a esta variable a la anterior, la matriz de datos quedaría como SIgue: SEXO ESTADO CIVIL e 7 | omar Solera S, — Mujer S, | Hombre S, | Mujer Divorciada S. | Hombie Casado S, | Hombre Divorciado S, Hombre Casado S, Mujer Casada S, | Mujer — Soltera Si | Hombre Divorciado S, , ombre Divorciado Su Mujer Casada i A 1Ó o ne Por lo tanto, agregando los valores iguales, esta población se COMPO! según su “estado civil” de la siguiente manera: A ESTADO CIVIL. 1 2 6 Divorciados 4 Viudos 0 Jotal (N) 2 EIC Y si combinamos los valores de las variables “sexo” y “estado civil”, el resultado sería el siguiente: SEXO | ESTADO CIVIL n Solteros 1 'asados 3 Hombres | CAsidos Divorciados 3 vi 0 Solteras 1 Casadas 3 Majes OS Divorciadas 1 Viudas a Total (N) Y Después de grabar los datos y de depurarlos” (pues siempre se come- ten errores fanto cn la cumplimentación del cuestionario como cn el pra- ceso de grabación de datos), una vez. hemos fijado la matriz de datos, entramos en la fase de análisis. Normalmente, los estudios realizados con encuesta contienen una fase exploratoria, que nos sirve para ver en un primer momento cómo funcionan las variables y realizar las pertinentes agrupaciones en los valores de éstas que hagan más visibles las posibles asociaciones entre variables, por ejcm- plo. El análisis se suele centrar, en un momento posterior. en el ámbito des- eriptivo del tema o del colectivo que nos acupe en la investigación. En este punto, se elabora un plan de tabulación y análisis, que parte de nuestras hipótesis iniciales y que ya está contenido en el momento en que se elaho- ta el cuestionario. Así, casi siempre el contenido del informe final en el que se presentan los resultados del estudio suele seguir el orden del cuestiona rio. Se pretende observar la variación conjunta de las variables más rele- vantes. Para cilo, con las variables “estructurales”, que suelen scr las que consideramos “explicativas”, recorremos todo el cuestionario, para observar cómo influyen en el resto de variables “temáticas o específicas del estudio. Tenemos, por lo tanto, dentro del análisis, momentos explicativos. $ Tisto se lleva a cabo a través de an proceso de cruces entre veriabl les para comprobar la eon- sistencia inerna de Jos datos. AN a proporción o un porcentaje es una 1458. Una tasa es una medida Tabla 4.2, Edad Tabla 4.3 a Necesitamos tasas para poder comparar poblaciones de distinto abla 4.3. Edad agrupada en intervalos +. Las tasas se elaboran a partir de los rocuentos de casos. Una tasa Edad a % fracción de un conjunto de casos. Una fasaá Cs la fracción de un : Edad n % ; ijunto sobre un conjunto poblacional v sobre otro subconjunto. Así ! 237 47 De 15 a 19 años. 1 60. 205 tener, por ejemplo, la proporción de mayores de 65 años en una 16 266 53 De 20224 año! 306 260 sión (que se obriene ul dividir el púmero de mayores de 65 años 1 284 57 De2 _ i 5 1.758 35,1 ¿total de la población), o la tasa de paro (que es el número de para- 18 266 o de 25 429 años 1930 38,9 existe por cada 100 activos y que se obtiene al dividir el número o 3 Total 5.014 ados de una población entre el número total de sus activos y multi- 19 252 50 - 100.0 el resultado por 1001*), o la tasa de feminidad (que es el número de 20 362 32 ves que existe por cada 100 hombres en una determinada población). 21 360 22 je) es la que aparece en el o r 2 323 64 Ñ Tabla 4.4. Nivel de estudios blación base de una tasa (o un porcen ye En el caso de los porcentajes, la “población base” representa siern- 100 %. En cada una de las tablas ha de aparecer la población base” 23 328 66 úmeros absolutos) sobre la que trabajamos, sobre todo en el caso de 24 384 77 Estudi astas muestrales, ya que sobre bases muy pequeñas es imposible afiz- 25 447 ! o a Te rada. % ! $9 Hasta Primaria un SAT . . 361 7,2 cundaria P , Ñ se la encuesta Juventud 2004, realizada por el lastituto de la Juventud 27 359 Ñ Secundaria 1? stapa 2.045 8 spaña, hemos entresacado, como ejemplo, las siguientes distribucio- _ > 72 Secundaria 2" tapa +, a paña, emp! 2 3 pi 1.778 38,5 le variables, que también podemos amar tablas univariables ES 342 68 Enseñanza Superior 035 e 29 44 a + 141 8,8 No contesta $s 00 Fotal 5014 1000 Total 5 b14 ) 5D 400,0 Tabla 4.1. Sexo Sexo n AO Tubla 4.5 Enteión ratios Hombro 2,566 14.5. Autodefinición religiosa Mujer 2.448 a ujes Religión m 7 Total 5.014 100.0 _ 2 Católico practicante 10 Católico no practicante 2.455 Creyente de otra religión 144 Ñ - : Noa e 1% La Iincuesta de Pablación Activa (EPA) define la tasa de paro como el cociente entre el '0 creyente 410 sempados” de los "parados" (a pawtr de fa subvariablo: “relación cos la ocnpación”), Para da: N 216 activo” y *parado” puede consufTarse: lO contesta 216 Total 5014 aición, según la EPA, de "a yr uo arwwine.esidacoldacod res 'umetepa.pdf, arden y reagrupación de valores mérica (como la “edad”), sus walorcs ntarán en la tabla siempre ordenados (normalmente en orden cre- y en ocasiones reagrupados en intervalos!5, para hacer más visible “ífica distribución de la variable. Las variables cualitativas también 1 la reagrupación de valores bajo criterios de proximidad concep- mo, por ejemplo, la «“autodefinición religiosa” tal como aparece en 15, en donde podemos agrupar los valares “no creyente”, “ndite- “ateo” y “agnóstico” bajo la rúbrica de “indiferente, alco O similar”, reduciría la variable a 4 valores). Los límites de los intervalos cuan- »s también se establecen con criterios conceptuales O empíricos que, e ser abstractos, se enmarcan el la realidad sociohistórica sobre la tajamos. La línea que separa la infancia y la juventud, por ejemplo, históricamente, igual que la que separa la juventud y la madurcz., sore los criterios meramente cuantitativos se imponen criterios cua- as (de orden cultural) que cambian de una sociedad a otra 0 que dis- -n determinados momentos históricos. La línea que separa Un deter- lo nivel de ingresos de otro puede ser la línea que marca la “pobreza crea efectos jurídicos determinados por la estructura sociopolítica omento: exención de impuestos, acteso vivienda protegida, justicia ta, acceso a determinados servicios sociales, etc. La línea que sepa- oros significativos no es automática y está lejos de ser arbitraria, ¡variable es cuantitativa O nu Comparaciones vos datos de lu investigación nOs sirven para comparar dos poblacio- tel mismo nivel clasificatorio (generadas por dos valores distintos de determinada variable: distintas provincias de residencia, distintos gru- te edad, distintos sexos, elc.), COn el objetivo de establecer diferencias valo en dos sentidos distintos: (1) para los valores :scgados, nn intervalo será la distancia entro dos valores; (2) para los valores agregados, uN “alo será una categoría de valores agregados y el recorrido del intervalo será la distancia ente lores extremos de esa categoría. En el primer caso, tomando la tabla 2, podernos decir que los 17 y los 21 años existo un intervalo de 4 años. En el segundo caso, podemos decir que dis" imos (agrupamos) la edad de los jóvenes españoles en tres intervalos: el gue va do los 15 alos ños, el gue va de los 20 a los 24 años y el que va de los 25 a los 29 años, En este C8s0, el tacos » de cada intervalo es el mismo. Debemos distingwr que 58 habla de inter y similitudes entre ellas, De i mm comparar X s. De igual modo, tambici , Ped » ión podemos para Ñ bi o de ana Población con la población total, con el fl de [e Lo. erizar la especificidad de un determinado grupo o socto! mm me ector. No . - rmalmente nos interesan las diferencias, más que las similitudes al d sq 8 sLenil 5. En un primer car nada, as cabe 5 os centramos en lo descriptivo, Antes de expli cómo so disteibuyon ,s o o que pasa; en este caso, necesitamos conos o cómo estas Estribnol . va lores de las variables en una población, es di ci clones caracterizan una determinada población A Dentro de AN población scada misma encuesta podemos comparar, por ejempl a nr ulina z la población femenina cn el modo en IS o. la ateria religiosa. O, en relació se auto- - O, ación a esta misma e is mos comparar el $ ; misma cuesti ; para el subconjunto de la población femenina cx ón, pode. la población total. na con el conjunto de Y si hacemos plo, podemos € A DO encuesta en Andalucía y otra en Cataluña por ej Cel iotal de ancla e po se autodefinen estas distintas poblacion: "> . us y el total de catalanes va relioi os Los subgrupos de éstas (como, por ejempl » esta religiosa o distin- tural cn alucí: tato Ñ » los que viven ámbi nal : Andalucía y en Cataluña o los universitarios y en el ámbito versitarios catalanes). 3 s andaluces y Jos uni- Igualmente o a Ñ ad o ye ns comparar una misma población en dos inomento: 5 . E la encuesta muestral, e. S á ' o S ama stral, cstv se hará o aplic: e o el stionario sobre dos muestras de características a ñ 'srua muestra istl a ¿ ad ca en dos momentos distintos (en este caso hablan a pane pu én se pueden considerar dos momentos distintos de 1 Pobla ciendo en una encuesta preguntas de carácter retrosp aa spectiyo!S, Para poder 5 í e o o dos grupos entre sí o dos momentos distintos del valor de la variable). rambién Na o deernizado y a variabl bié: s observar cómo istri todos los: caos e e vanable en cada uno de los IA dd po te DU caso, necesitamos un valor que resuma el o de a sta o le valores, esto es, que represento toda la dis- ción: vna me la de centralización, u “de concentración”, o, se conoce (en nefasta expresión), *de tendencia Co 166 e a laboral hac 'omo, por ejemplo, “¿cuál es situa al hace al a si ón labor 10? que no sólo apenas hay diferencia entre los jóvenes de 20 a 24 años de la muestra y los del censo sino que tampoco la hay entre las dos distribuciones de edad en sn conjunto, No es extraño que esto sex así, todo lo contrario: no podía ser de otro moda, teniendo en cuenta que la muestra (de 2004) se había establecido fijando cuotas de edad y sexo que se derivaban directamente de los datos censales (de 2001). Si atendemos al “nivel de estudios”, y obviamos los estudiantes que sólo tienen “estudios primarios”, al ser un resto insignificante los jóvenes que se encuentran en esa situación, observamos una clara coherencia en los datos: a medida que aumenta cl nivel de estudios encontramos cada vez menos jóvenes en un porcentaje que parece suficientemente significativo. Aquí podríamos pergueñar una inter- pretación/explicación de estos resultados. Podemos aventurar la hipótesis de que la función selectiva del propio sistema escolar genera esta “distribución pisamidal”: a medida que subimos de nivel encontramos cada vez monos casos. Tabla 4.8 Estudios n % j 171 3,4 2,045 1.778 . 935 No contesta 85 Total 5.014 100,0 3. Si nos fijamos en cómo se consideran co materia religiosa los jóve- nes españoles entrevistados, vemos que la mitad de éstos se consi- deran “católicos no practicantes”. Esto nos induce a suspechar que bajo dicha rúbrica se cubren casos muy heterogéncos, es decir, que dicha categoría no es nada homogénea. Esta sólo lo descubriremos cuando utilicemos esta variable como estructural, para explicar comportamientos, opiniones O actitudes. Hubiese sido conveniente, por lo tanto, haber establecido más distinciones dentro de los *cató- licos no practicantes”, puesto que en el caso de que entre estas sub- divisiones hubiésemos encontrado homogeneidad siempre pod: mos reagruparlas con posterioridad. Un caso inverso a se esel mue tencinos con los no creyenl indiferentes”, “aicos' y “a nio cos”. En el caso do que dichas categorías actúen de manera Similar sobre otras variables, podemos agruparlas, Siempre será mej recoger los datos con la mayor desagregación posible (dentro de e os a Porque de pa manera siempre podremos agre- limitar y obstaculizar la capacidad del análiic. tmposble y puedo Tabla 4.9 Religión To le 142 490 Creyente de atra religión 2.59 Indiferentes, ateos y similar 29,6 No contesta 43 Total (5.014) 1000 2.5, Medidas de centralización y dispersión de datos: media aritmética y desviación típica mos que para comparar dos grupos entre sí podíamos también ener en cuenia la total distribución de la variable, ubservando cómo se distribuyen todos los valores en cada uno de los grupos. Para esto se ha se necesario un valor que resuma el conjunto de la distribución esto o que la represente, Necesitamos una medida de centralización to “de concen. tración”) de los datos. Y esto sólo es posible en variables que presente, > * nivel de medición “intervalar”, es decir, variables de tipa a” 2 > nando tenemos una variable cuantitativa, podemos obtener un “valor . medio” que nos resuma la distribución de los datos. Comparamos distin- ; tas poblaciones a través de la comparación de sus valores medios doo a La media aritmética (el valor medio) de una distribución, de una varia- , se obtiene sumando los valores de todas las unidades (una a na) y idiendo el resultado entre el total de casos o unidades. St llamamos X a la variable (compuesta de k valores) y x, al valor que 2 cada unidad i de una población total de N unidades. El valor medio X 0) será: XFA Aye exe E A N Supongamos que tenemos una población de 12 individuos con las uientes edades (en años): 19, 22, 28, 27, 25, 27, 27, 29, 22, 28, 29 y 34. edad media de esta población será: 194224+28427425427427429422428434429 317 - . = 7 26,41 años Ñ 12 2 Podemos agrupar las unidades con el mismo valor: Tabla 4.10 Edad n 19 o 1 22 2 25 1 27 3 28 2 29 2 34 1 Total 12 Entonces sumamos cada valor de la variable con su peso en la pobla- «n, es decir, asociado al número de casos que contiene, o, lo que es lo smo, a $u frecuencia en la población: 19422-2425+27-3428-2429-24+34 317 o A — o 26,41 años 12 12 La fórmula del valor medio nos quedaría así: E en donde ÑN =E2, T o St tomamos Jos datos de la encuesta de Juventud, la edad media Jóvenes entrevistados se calcularía de la siguiente manera; delos Tabla 4.2, Edad — o r 16 53 o 284 37 18 266 5,3 19 252 50 20 362 22 2 360 72 22 323 64 3 323 66 24 384 7.7 25 447 89 26 361 72 2 359 72 23 342 68 29 441 88 Total S.014 400,0 37+16-266+17-284+...+27.3594-28 342429441 $.014 -= 22,64 años e en lugar de tomar las frecuencias absolutas hubiésemos tomado las 'ativas (proporciones o porcentajes), el resultado hubiese sido el mismo ¿Con qué frecuencia asiste Ud. a misa u otros oficios religiosos, sin contar las ocasiones relacionadas con ceremonias de tipo social, por ejemplo, bodas, comuniones O funerales? Asistencia Co nm Ca nunca 48,7 921 Varias veces al ajo 19.0 359 Alenna vez al mos 118 22 Casi todos los domingos y festivos 17,3 339 Varias veces a la semana 19 36 No contesta yl 13 Total 100,0 1.891 hook os eo Decíamos que una media resume una población: es una PI e sentativa de toda una población. Resume tado un conjunto e da o. an único dato, pero heruos que conocer en qué medida es más > INE » MN sentativa del conjunto de la población. Fsto depende de la PLN e los datos en torno a ese valor central que supone la media, j los da tos están muy agrupados en torno a la media, ésta sorá muy represental: conjunto poblacional. tralidad de los datos alrededor de la media, D. lo que utilizamos medidas como la desviación media, a. Estas medidas son resúmenes de las des- Para conocer la cem es lo mismo, su dispersión, la varianza o la desviación típico viaciones de todos los valores con relación a la media. media (dni) es la media (arimética) de las desviacio- odos os ética de la variable, ves de todos los valores en relación con la media aritm La desviación de un valor en relación a la media es la distancia que le separa de la media ( | Ax ES ñ EIA dm, = — y z El valor medio del cuadrado de tas desviaciones de todos los valores en relación a la media aritmética es la varianza (52), A la raíz cuadrada de la varianza le llamamos desviación típica (8). Normalmente para establecer la dispersión de los datos en torno a la media se suele utilizar la desviación típica, par su decisivo papel cn la estadística inferencial para permitir fijar la extrapolación de las medidas obtenidas en una muestra al total de la población. FET ¡0% S.L Y Como las desviaciones dependen dol valor de la media, podemos estandarizar la medida de la dispersión, con el fin de facilitar cumparacio- nes. Así obtenemos un coeficiente de variación (EV), de dispersión de los datos estandarizado, medido en unidades de media. A las medias les damos en cada población el valor 1 y vemos en torno a éste valor la dis- persión de los datos >< Si tuviésemos una población A con una edad media de 35 años y una desviación típica de 5 años y otra población B con una medía de edad de 35 años y una desviación de 10 años, no cabe duda de que Ja media de la población A representa mejor las edades de toda la población A que la medía de B las suyas: los datos están cn A más concentrados alrededor de la media que en B. Esto es inmediatamente visible. Pero si tenemos una población C con una media de 55 años y una desviación de 7 años, ten- dremos que calcular el coeficiente de variación para ver cuál es la distri- bución más dispersa. Si comparamos A con (, vemos que el coeficiente de variación de la población A es de 0,14, mientras que dicho coeficiente para la población ( es de 0,13. Los datos están en términos relativos más con- centrados en torno a la media en la población C que en la población A. Con variables cuantitativas, podemos resumir una población en su valor medio y su desviación típica. El objetivo del lratamiento estadístico de datos es resumir en medidas claramente visibles una totalidad de datos inaharcahle. ¡ Ó a ación (en números vasiones, más que la distribución de la población (ea os noo Lorcentajes) en una variable nos interesa la ds rato. dl 9$ 0 pora s via esa la dista le de on determinado estadístico (de otra variable) o medio según el nivel de estudios: “tabla 4.11. Salario medio AS “Fodos los estudios o E Sin estudios nas 11. Educación primera AO IL Educación secundaria E a TV. Educación secundaria 18 2 ÓN . Y. Futmación profesional de grado medio » 000 VL Formación profesional de grado superior Ñ Pe VII Diplomados universitarios o equivalente e eri y dontores VII. Licenciados, ingenieros superiores y dock 2002, INF, ¡Encuesta de estructura salarial 2002, INF) z -spañoles > la edad media con la que se casaban (por primera vez) los esp: 386, según datos del INE: Tabla 4,12 27,15 años 24,88 años Varones Majercs Evolución de una variable en el hempo: serios temporales . íntesis, nOs 1] tratamiento estadístico de los datos, con su tado de ona través te tanbió hservar cambios en una determinada poblacti ión en el mite también 0 o Podemos ver cómo varía (o no) una població » e paso del dideraado una serie de momentos sucesivos y nO sÓl o apo, a al cómo evoluciona un determinado subgrupo d 2mos obs de una población (defi nido por un valor de Una fijamos pues en la evol variable nominal?) Nos ución de un determinado valor, Así se establecen series temporales. Y su re; ; presentación gráfica es decisiva para Ja percepción de las tendencias evol utivas. Para establecer serics nos servimos de livos (como, por ejemplo, censos) o de ca Cámente (como, por ejemplo, la Encuesta metros de CIS, que repiten con cierta peri Tegisiros periódicos administra. Cuestas que se realizan Periódi. de Población Activa U los bará. odicidad las mismas preguntas), Aquí podemos observar la evolu ción de la población reclusa en España desde el 1996 hasta cl 2003, según registro de la Dirección General de Instituciones Penitenciarias del Ministerio del Interior: Tabla 4.13. Población roclusa, Serie 1996-2003 1996 1997 1998 1999 2000 2001 2002 2003 41.903 42,756 443%) 44.197 45.104 TS 51.882 56.090. ] La evolución de un valor en para incrementar o disminuir re Ón: también puede provoc, ar la necesidad de ind: SÍ es interesante a efcctos administrativos Cursos ditigidos a una determin ar interós o alarma (en agación, ada pobla. algún sentido) y 2eno- Aquí vemos la evolución de la £rantes (a través de un “ften” de Una escala de acti 'ambiado la proporción de españoles que considera 'ás personas de otros países Que viven en Españ obtenidos en estudios periódicos actitud de los españoles hacia los insaj- tud), viendo cómo ha In que “son demasiadas a” a través de las Tespues- del CIS. (Véase la tabla 4.14). - En el campo de la investigación e bien poco más allá de la mera constatación de Amparar un valor en momentos distintos de de comparar las evoluciones de dos valore: social. la evolución de un valor nos ésta. Así que, más que tiempo, de lo Que se trataría s de dos variables distintas y 1 Podemos ver cómo evoluciona un intervalo de 28L. AD testar el intervalo tna distribución comrimoa en Aun aístado lo estamos ne contásemos o Eg nantes, abarcasen es q os con dos Ñ Ñ antes, que abarcasen casi la totalidad del círculo 9 Eres muy dom, Esta sería la reprosentación de 1 de civil o situación de Convivencia Or a población joven española según su Esta , obtenida de la encuesta Juventud 2004. 3.1.2. Diagrama de barras o En una línca horizontal disponemos los Os entre sí. A cada valor le corres valente a su frecuencia. ao valores de la variable, SEpara. ponderá una barra cuya altura será equi Ésta será 1 estado civil: a representación de ión j presentación de la población Joven española según y, Según sy Figura 42 3. Diagrama de barras apiladas (o compuestas) En este diagrama se utiliza sobre todo para comparar fácilmente la nposición de dos pablaciones. Se suele utilizar con los porcentajes o »porciones de los datos. De manera que la altura de las dos publaciones hace equivalente y el peso relativo de las clases en el interior de ellas se se más visible. Una población se representa en una barra, en cuyo inte- we se apifan los dilcrentes valores en tramos equivalentes a Su peso. Ésta será la representación del estado civil de dos poblaciones, la blación joven masculina y la femenina, según la encuesta que estamos ilizando. 0 - a A l BY Soltero: ¿18 Casadofa Viviendo en pareja ME sevaraoldivorciado [ Viudo/a Ko contesta Figura 4.3 Ep este caso, hemos utilizado número de casos, ya que las poblaciones año. En todo caso, será preferible el uso de por- sentajes. De manera que cada barra represente el 100 % de la población. Es la única manera de ver algo cuando las poblaciones son de muy diver- so tamaño; como puede observarse ca el siguiente gráfico, que compara la producción mundial de automóviles en 1960 y en 1980 2. son casi iguales de tan: 23 Zeigel, EL: Dígalo con números, México, FCE, 1990, p. 25 8010 Figura 44 3.1.4. Diagrama de barras agrupadas a ci ones podemos realizar un diagrama de barras pa cada Do ción, s lo que hacemos si lo que nos interesa destacar es a ist ción conjunta de los valores y ver cómo ésta cambia o $ en Una y otra población. Pero en ocasiones, para hucer más vii es las diferencias valor a valor entre esas poblaci es diagra. e erenel a 1 blaciones, usamos el disgra- a deba Dl ent múltiples. En este diagrama colocamos pegadas aras quo xEpreS lan un valor en las distintas poblaciones, separando $, para ver las diferencias entre el mismo valor en las distintas poblaciones. Los casos Te Los casos han de presentarse en porcentajes o proporciones,