Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadistica Descriptiva, Teoría, Apuntes de Estadística Descriptiva

Asignatura: Estadistica descriptiva, Profesor: , Carrera: Administración y Dirección de Empresas, Universidad: UAM

Tipo: Apuntes

2014/2015

Subido el 24/06/2015

broxvik
broxvik 🇪🇸

1.5

(2)

1 documento

1 / 70

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46

Vista previa parcial del texto

¡Descarga Estadistica Descriptiva, Teoría y más Apuntes en PDF de Estadística Descriptiva solo en Docsity!

Tema 1 Introducción . Variables, atributos y escalas. e Población y muestra. e Etapas del análisis estadístico. 1. Introducción a. Variables, atributos y escalas. b. Población y muestra. c. Etapas del análisis estadístico. Vs aáfpreN pta Investigador social utiliza los modelos matemáticos para analizar los fenómenos estudiados. Definición de “estadistica” en las variables observadas. Variables no correlacionadas funcionalmente. Dos grandes ramas: descriptiva e inferencia. “Ciencia” estadistica. a. Variables estadísticas. Carácter o magnitud que estamos estudiando. Atributos cualitativos (modalidades) frente a variables cuantitativas (valores). Variables continuas o discretas (distinción teórica importante después y con x, y... frente a xi, yi....) Datos históricos o datos transversales o datos panel. Escalas: Nominal (Sin orden) (Ramas actividad económ., estado civil, profes. liberales...) Ordinal (Con orden, sin escala) (Niveles de estudios, estratos de renta...) De Intervalos — (Con escala, sin cero; colocados [n — (n+1)], están colocados todos) (Salarios, presupuestos, gastos, pasivos financieros...) De Proporción (Con cero y con escala; colocados 0 y 1, están colocados todos) (Edad, número de stocks inventariado...) b. Población y muestra. Conjunto total objeto de estudio o un subconjunto finito. Diseño de muestras para el estudio de la población requiere hacer hipótesis sobre las variables que intervienen en el fenómeno que estudiamos. Ejemplo de encuesta de intención de voto en la Comunidad de Madrid. Diferencia entre censo y encuesta. c. Etapas del análisis estadístico 1. Recogida de datos. Dificultades de diseño, realización técnica, legal e informática Ejemplo de estudio de resultados académicos de alumnos en la UAM 2. Ordenación y presentación. Tablas estadísticas (ejemplo de película de camión de documentos). Gráficos (ejemplo de variaciones de las cifras de paro con barras completas o sólo los tramos últimos). Tema 2 Distribuciones Unidimensionales e Distribuciones de frecuencia unidimensionales » Representaciones gráficas Estadistica Descriptiva para Economía y Administración de Empresas Cuestiones tipo test y ejercicios con Microsoft” Excel Fuensanta Arnaldos García M? Tercsa Díaz Delfa Úrsula Faura Martínez Lourdes Molcra Peris Isabcl Parra Frutos Frofesoras del Departamento de Métodos Cuantitativos para la Economía Fuculiad de Ciencias Económicas y Empresariales Universidad de Murcia pica ACA THORASOmN A A Australla + Canadá - México + Singapur + España «+ ReimoUnido « Esiados Unidos DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES e 51 1.1 Conceptos generales Población: Conjunto de individuos o elementos que poseen ciertas propicdades comunes que se desea estudiar. Muestra: Subconjunto representativo de una población. Subpoblación e estrato: Parte de la población no representativa de la misma. Carácter: Propiedad, rasgo o cualidad de los ciementos de la población. Atributo: Carácter cualitativo, no susceptible de scr medido numéricamente. Tas distintas observaciones de un atributo se denominan modalidades, y pueden venir expresadas en escala nominal (modalidades no susceptibles de ordenación) o en escala ordinal (modalidades susceptibles de ordenación). Variable: Carácter cuantitativo. Sus distintas observaciones se denominan valores, Las variables pueden scr de dos tipos: discretas, cuando no admiten siempre un valor intermedio entre dos cualesquiera de sus valores, y continuas, cuando sí lo hacen. 1.2 Distribuciones de frecuencias unidimensionales Sea un conjunto formado por N elementos y sea X una variable que describe un carácter de los mismos, cuyos posibles valores, ordenados de menor a Mayor, SOB Xp, Agos Apo Frecuencia absoluta de x, es el número », de veces que aparece x, en cl total de los N elementos. Frecuencia relativa de x, es la proporción /; de elementos del conjunto para los cuales la característica considerada toma el valor x,. Se obtiene como f=1/N, y multiplicado por 100 representa el porcentaje de elementos que toman dicho valor. Frecuencia absoluta acumulada de x, es cl número N, de observaciones menores O iguales que Xx; Se calcula, por tanto, como N=n,+H) bo +M =N, +. Frecuencia relativa acumulada de x, es la proporción F, de clementos para los cuales el carácter tora un valor menor o igual que x,. Sc puede calcular como ÑN O TES-Paraninfo 52 e ESTADÍSTICA DESCRIPTIVA PARA ECONOMÍA Y ADMINISTRACIÓN DE EMPRESAS Se denomina distribnción de frecuencias al conjunto de valores de uma variable junto con las frecuencias correspondientes a cada uno de ellos, Le, Mi hi12, , - Podemos hablar de dos tipos de distribuciones dependiendo de la forma en que se presenten los datos: Distribución con datos no agrupados en intervalos. Para variables que toman pocos valores diferentes. Se presentan en tablas con la siguiente forma general: ES O E Alma Ll NE AS Distribución con datos agrupados en intervalos, Se utiliza con variables que toman un número muy elevado de valores diferentes, con: objeto de hacer más manejable la información. La frecuencia absoluta asociada a un intervalo (£,_, £,] será el número total de observaciones pertenecientes al mismo. En este contexto, hay que introducir nuevos conceptos, como son la amplitud del intervalo, a,—£, f,¿,, la marca de clase o punto medio del intervalo, Li + L; : : U : e Xx EE, y la densidad de frecuencia, d, =--- Este tipo de distribuciones se presentan en tablas con la siguiente forma general: AA NA a a, 1 Finalmente, nótese que en el caso de trabajar con un atributo en lugar de una variable, podremos calcular siempre las [rccuencias no acumuladas, micntras que las acumuladas sólo se podrán calcular en el caso de que esté medido en escala ordinal. 1.3 Representaciones gráficas Los gráficos que se utilizan para representar una distribución de frecuencias serán diferentes según la naturaleza del carácter a estudiar. (0 ITES-Paraninfo Tema 3 Medidas en Distribuciones Unidimensionales e Medidas de posición + Momentos e Medidas de Dispersión e Medidas de Forma e Medidas de Concentración e Transformaciones lineales e Tipificación de una variable 1.4 Medidas descriptivas de los datos _ Con cl fin de sintetizar toda la información contenida en una tabla de frecuencias, se definen los estadísticos o medidas descriptivas de los datos. Según la ¡nformación «que éstos nos proporcio- O ITES-Paraninío DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES e BB distribución en cuatro intervalos, cada uno de ellos con el 25% de las observaciones; los deciles, D,, D,,..., Dy, que dividen la distribución en diez partes, y los percentiles, P,.P,..., Lo, que la dividen en cien. Su cálculo es similar al de la mediana, sustituyendo N/2 por pN/q en el caso de calcular el cuantil p-ésimo de orden q, Ej, con 0 ñ De todas las medidas de posición, sólo la moda y los cuantiles (de los cuales la mediana es un caso particular) podrían calcularse para atributos medidos en escala ordinal, y únicamente la moda si la escala fuera nominal, 1.4.2. MOMENTOS Son medidas que permiten caracterizar a una distribución, siendo dos distribuciones tanto más parecidas cuanto mayor sea el gúmero de momentos iguales que posean. Se mtilizan para definir algunas medidas de dispersión y forma. E pol Momento ordinario de orden k; a, = E t ¿ a Y Din, Momento central de orden k: Mm, = EN . 1.4.3. MEDIDAS DE DISPERSIÓN Las medidas de dispersión miden la variabilidad de los datos; esto es, el grado de separación existenle entro Éstos. A. Medidas de dispersión absolutas =x 5 Re=b,-Lp. Q Recorrido: Re=x, Recorrido intercuartílico: R, =Q,— € ITES-Paranirta 56 + ESTADÍSTICA DESCHIPTIVA PARA ECONOMÍA Y ADMINISTRACIÓN DE EMPRESAS San Varianza: 9 = E_—_—- >. N Desviación típica: $ = +? . B. Medidas de dispersión relativas (fadimensionales) *, Coeficiente de apertura: 4=—=; : Ñ Re Recorrido relativo: R, =-—- Xx SB. Q+Qs Recorrido semiintercuartílico: Rs Índice de dispersión respecto a la media aritmética: V, — e Xx PD Me. Me Índice de dispersión respecto a la mediana: V,,, = : tania Ss Coeficiente de variación de Pearson: Cv==+ x Las medidas de dispersión son características propias de la variables y no de los atributos, ni siquiera de los que están medidos en escala ordinal. 1.4,4. MEDIDAS DE FORMA Las medidas de forma pretenden dar una idea general de la representación gráfica de una distribución de frecuencias. En particular, tratan de cuantificar la deformación horizontal (asimetría) y la deformación vertical (curtosis O apuntamiento) de la misma. A. Medidas de asimetría ÍA E Coeficiente de asimetría de Fisher: y = eN Ñ Si g, >0, la distribución cs asimétrica positiva (o asimétrica a la derecha); si g, <0, la distribución es asimétrica negativa (o asimétrica a la izquierda); y si la distribución es simétrica, entonces gy =0 (no necesariamente se da al revés; esto es, existen distribuciones asimétricas con 2 =0). 6 ITFS-Paraninfo 58 e ESTADÍSTICA DESCRIPTIVA PARA ECONOMÍA Y ADMINISTRACIÓN DE EMPRESAS 1.5 Transformaciones lineales Veamos ahora cómo afectan transformaciones lincales del tipo Y =aX+b, com n>0, a las principales medidas estudiadas cn los epígrafes anteriores: Y=4X,.0>0. Y=aX+b, :a>0 Media aritmética y=a y ax+b Moa) -amo(X) de Fisher Moda MAY) -MOGO) + b | MOV) =aMo(X) + b Mediana me =amevo | man=meaXo +. | MAY) = 0 MAJO + b usina | Ep 80,0) O, (0 =C, (X) + bo Mac, 0 +b Varianza s ss Desviación típica E S,= aS, S,=8S, 5,08, dps de variación GC cur) HE EuY)= e Coeficiente de asimetría | a0M-ax) E)=2 ix) 2 (0=8(X) ] Coeficiente de curlosis— SD O E 00= 224) 2 (0= 200 Indice de Gini LA 71 (A) AMAS a LADA ÓN, yA, COS Orb 2D =p 0, _au(XO+bN, (Y 240) au (X)+bN € ITES-Paraninfo Tema 4Distribuciones Bidimensionales Distribuciones de frecuencia bidimensionales Representaciones gráficas Distribuciones marginales Distribuciones condicionadas Independencia estadistica s Momentos bidimensionales e Covarianza e. Coeficiente de correlación DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES e 139 A Distribuciones de frecuencias bidimensionales . ido un conjunto de N individuos o elementos, se desea estudiar dos características de los ismos, medidas por las variables X e Y, cuyos posibles valores son Xx 2 Y, € y,, respectivamente, También podría darse el caso de que alguno de los caracteres Yan. ara cualitativo, O incluso los dos. 'ecuencia absoluta conjunta del par (x,, »,) es el número my de elementos en el total de los N considerados que presentan el valor x, para la primera característica y el valor y, para la segunda. ecuencia relativa conjunta del par (x,, y,) es la proporción .f, de elementos del conjunto para los cuales la primera característica toma el valor x, y la segunda el valor y,. Se obtiene 1. o . . como f, y y multiplicada por 100 representa el porcentaje de elementos con dichos NÑ valores en las características consideradas. Se denomina distribución de frocuencias bidimensional al conjunto de pares (x,, y,) Junto n las frecuencias asociadas a cada uno de ellos, (e Y: 1) . . Dicha 100 fa stribución de frecuencias suele presentarse en una tabla de doble entrada, que recibe el nombre tabla de correlación si los dos caracteres son cuantitativos, y tabla de contingencia si al anos uno de ellos es cualitativo. Además, para el caso de las variables, los datos pueden venir rupados en intervalos o no, según proceda. Y Y, Po o MY, A, Mar Moo ys Mas A, Pa Br Hr E ITES-Paraninto 140 + ESTADÍSTICA DESCRIPMVA PARA ECONOMÍA Y ADMINISTRACIÓN DE EMPRESAS 2.2 Representaciones gráficas Diagrama de rectángulos tridimensional. Generalización del diagrama de rectángulos al caso bidimensional. Diagrama de barras tridimensional. Generalización del diagrama de barras al caso bidimensional. y Estereograma o esculograma. Generalización del histograma al caso bidimensional. Diagrama de dispersión o nube de puntos. Grálico sólo para variables que representa los pares de observaciones como puntos en un sistema cartesiano, donde cada uno de los ejes corresponde a una de las variables. Esta representación ayuda a descubrir visualmente la existencia de algún tipo de relación entre dos variables. 2.3 Distribuciones marginales Son cada una de las dos distribuciones de frecuencias unidimensionales que se obtienen a partir le la distribución bidimensional Í (y): mb al estudiar el comportamiento de ,5 ed sada una de las dos componentes de (X, Y) por separado. Así, en el caso de la distribución zorrespondiente a X, que denotaremos por Lx ML, Lao a frecuencia marginal 7, represciita 21 número de elementos para los cuales la primera característica tora el valor x,, sea cual sea cl valor de Y, esto €s, : Y np isbesr, a mientras que en la distribución correspondiente a Y, bs Ab, , , la frecuencia marginal £,, jalo denota el número de elementos para los cuales la segunda característica toma el valor y;, inde- rendientemente del valor que tome X, S ny. i=lL..,s, . Esta información se puede representar en la siendo entonces N — y y Aj = Sa = y 7 pol A ran abla de doble entrada: 9 ITES-Paraninto