Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística I, Apuntes de Estadística

Asignatura: Estadística I, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UA

Tipo: Apuntes

2010/2011

Subido el 02/04/2011

ktulu
ktulu 🇪🇸

4.3

(9)

3 documentos

1 / 48

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística
Tema 1 (9/2/10)
Una estadística: Cualquier colección de datos ordenados y clasificados según un
determinado criterio.
Estadística: Es la ciencia que estudia el comportamiento de los fenómenos llamados
colectivos. Está caracterizada por:
Una información acerca de un colectivo o universo -objeto material-.
Un modo propio de razonamiento, el método estadístico -objeto formal-.
Unas previsiones de cara al futuro lo que implica un ambiente de incertidumbre -objeto
final-.
La Estadística es la ciencia de los datos. El objeto de la estadística es el razonamiento a
partir de datos emíricos. Los datos no son sólo números, sino números en u contexto.
Estadística Descriptiva. Tiene como fin presentar resúmenes de un conjunto de datos y
poner de manifiesto sus características mediante representaciones gráficas.
Los datos se usan para fines comparativos o explicativos y no se usan con principios de
probabilidad.
El interés se centra en describir el conju nto de datos que se tienen y no se plantea el
extender las conclusiones a otros datos diferentes o a una población.
Población: Conjunto de todos los elementos que cumplen una o varias propiedades
específicas.
Muestra: Un subconjunto de la población.
Variables Estadísticas: Son las propiedades o características de los elementos de la
población objeto de estudio.
Cuantitativas (medibles) → Se describen con números.
VARIABLES
Cualitativas (no medibles) → Se describen con palabras.
Variables de medida → Valores
Variables categóricas → Categorías
Las variables cualitativas se llaman también atributos y sus distintas formas, modalidades.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30

Vista previa parcial del texto

¡Descarga Estadística I y más Apuntes en PDF de Estadística solo en Docsity!

Estadística

Tema 1 (9/2/10)

Una estadística : Cualquier colección de datos ordenados y clasificados según un determinado criterio.

Estadística : Es la ciencia que estudia el comportamiento de los fenómenos llamados colectivos. Está caracterizada por: − Una información acerca de un colectivo o universo -objeto material-. − Un modo propio de razonamiento, el método estadístico -objeto formal-. − Unas previsiones de cara al futuro lo que implica un ambiente de incertidumbre -objeto final-.

La Estadística es la ciencia de los datos. El objeto de la estadística es el razonamiento a partir de datos emíricos. Los datos no son sólo números, sino números en u contexto.

Estadística Descriptiva. Tiene como fin presentar resúmenes de un conjunto de datos y poner de manifiesto sus características mediante representaciones gráficas.

− Los datos se usan para fines comparativos o explicativos y no se usan con principios de probabilidad. − El interés se centra en describir el conju nto de datos que se tienen y no se plantea el extender las conclusiones a otros datos diferentes o a una población.

Población : Conjunto de todos los elementos que cumplen una o varias propiedades específicas.

Muestra : Un subconjunto de la población.

Variables Estadísticas : Son las propiedades o características de los elementos de la población objeto de estudio.

Cuantitativas (medibles) → Se describen con números.

VARIABLES

Cualitativas (no medibles) → Se describen con palabras.

Variables de medida → Valores

Variables categóricas → Categorías Las variables cualitativas se llaman también atributos y sus distintas formas, modalidades.

Tema 2

Variables categóricas

Sea una muestra de tamaño n de una población. Sea X una variable categórica (color ojos). Sean x1,x 2 ,x 3 ,...,xk a las modalidades o categorías de X. Cada elemento pertenece a una categoría.

DEFINICIÓN : Se llama Frecuencia Absoluta de la categoría xi al nº de veces que aparece xi en la muestra. La representamos con ni.

0 ≤ ni ≤ n

DEFINICIÓN : Se llama Frecuencia Relativa de la categoría xi a su frecuencia absoluta dividida por el tamaño de la muestra. La representamos con fi.

Variable(color ojos)

Códigos ni fi fi x 100 o %

….. x 1 1 n 1 f 1 f 1 x 100 …...x 2 2 n 2 f 2 f 2 x 100 .... .... .... .... .... …..xk k nk fk fk x 100 n 1 100

REPRESENTACIONES GRÁFICAS

− Diagrama de barras(ejes coordenadas).

fi ni %

x1 x2 x

INTERVALOS DE CLASE

Los valores de una variable se pueden agrupar en intervalos denominados “intervalos de clase”.

Para ello se divide el intervalo que contiene todos los valores en sibintervalos: I 1 , I 2 , …, Ih de tal forma que x 1 Є I 1 , y xk Є Ih.

DEFINICIÓN : Se llaman marcas de clase a los puntos medios de cada intervalo.

TABLA DE FRECUENCIA:

Intervalos Marcas de Clase*

ni fi Ni Fi (%)

I 1 (eo, e 1 ) c 1 n 1 f 1 N 1 F 1 I 2 (e 1 , e 2 ) c 2 n 2 f 2 N 2 F 2 …. …. …. …. …. …. Ih(eh-1, eh) ch nh fh Nh Fh n 1(100) =n =1(100)

− *Límites de clase y fronteras de clase. − Las frecuencias se refieren a los intervalos (si es posible lo expresaremos con la misma amplitud). − Hay diversas formas de obtener intervalos. Según sean éstos así serán las tablas de frecuencias.

REPRESENTACIONES GRÁFICAS

− Diagrama de barras (si no hay intervalos). fi ni %

x1 x2 x

− Histograma (Gráfico formado por rectángulos). − La base de los rectángulos son los intervalos y la altura de cada rectángulo es tal que su área es proporcional a la frecuencia del intervalos que representa.

− Polígono de frecuencias. − Se forma uniendo los puntos medios de la base superior de cada rectángulo del histograma.

− Se suele prolongar hasta el eje de abscisas para que el área bajo el polígono sea la del histograma. − Se representa sin el histograma.

Fila 1 Fila 2 Fila 3 Fila 4

0

2

4

6

8

10

12

Fila 1 Fila 2 Fila 3 Fila 4

0

1

2

3

4

5

6

7

8

9

10

0

1

2

3

4

5

6

7

8

9

10

Gráfico 8 2 9 10 5 7 11 4 5 0 0 0 0 12 2 5 5 0 5 5 5 0 5 0 0 13 3 3 3 0 14 5 0 0 15 5 16 0 3 17 5 0 5 5 18 0 0 19 20 5

INTERVALOS A PARTIR DEL GRÁFICO TALLO Y HOJA

− Cada tallo define una clase. − Límites de clase: Valores mínimos y máximos posibles de cada intervalo:

8 0 a 9 80- 9 0 a 9 90- 10 0 a 9 100- ... 0 a 9 110- 20 0 a 9 120-

− Para que exista continuidad en los gráficos se utilizan las fronteras de clase que se obtienen ampliando convenientemente los límites de clase a la izquierda y a la derecha.

IMPORTANTE: Las fronteras de clase son las que se usan como intervalos para representar el histograma y el polígono acumulativo. (Tabla pag.9 del Tema 2).

Se puede modificar el número de intervalos:

− Para disminuir el número de intervalos: se agrupan intervalos: 80-99, 100-119, etc. − Para aumentar el número de intervalos: − Dos filas por tallo:

8* 0 a 4 80- ● 5 a 9 85- 9* 0 a 4 90- ● 5 a 9 95- …. …. ….

− Cinco filas por tallo:

8* 0 y 1 80- t 2 y 3 82- f 9 y 5 84- s 6 y 7 86- ● 8 y 9 88- 9* …. t f s ●

t→ two, three f → four, five s → six, seven. (Se puede cambiar por a, b, c. etc).

CURVAS POBLACIONALES DE FRECUENCIAS Y SUS FORMAS

Se utilizan para representar las distribuciones de toda la población de las variables de media.

Son versiones suaves de los polígonos de frecuencias.

Nos permiten observar las formas de las distribuciones. Para ello se compara la distribución poblacional de frecuencias de la variable en estudio con la distribución normal.

Derecha Cortas Leptocúrticas. − Simetría-asimetría - Colas - Apuntamiento Mesocúrticas. Izquierda Largas Platicúrticas.

Media Aritmética.

Sea una muestra de tamaño n de una población. Sea X una variable de medida. Sean x 1 , x 2 , x 3 , … , xn los valores de los variable de la muestra.

Se define la media aritmética como el número que se obtiene al dividir la suma de todos los valores por el tamaño de la muestra.

Se expresa en las mismas unidades que los valores de la variable.

Ejemplo: Media aritmética de la variable “peso” del ej.8 del tema 2.

Si los valores vienen expresados en intervalos:

Disposición Práctica:

Intervalos ci ni cini fi (%) cini(%) I 1 c 1 n 1 c 1 n 1 f 1 c 1 f 1 I 2 c 2 n 2 c 2 n 2 f 2 c 2 f 2 …. …. …. …. …. …. Ik ck nk cknk fk ckfk n ∑ 1(100) ∑

En el ejemplo → Hoja suelta*.

También:

O bien:

También:

La medida aritmética obtenida con los intervalos es un valor aproximado (valor “real” 61,381). El cálculo es análogo si los intervalos son de distinta amplitud.

VALORES ATÍPICOS. MEDIA RECORTADA.

Los valores atípicos son aquellos datos bastante mayores o menores que la mayoría del conjunto de los datos de la muestra.

Un valor atípico puede ser alto o bajo según sea mayor o menos que el conjunto de datos. En inglés: Outlier → High(H) o Low(L).

Una medida resumen es resistente cuando la eliminación o la inclusión de unos pocos valores apenas afecta al resultado.

La media aritmética es poco resistente.

Media aritmética recortada. Es la que se obtiene calculando la media aritmética de los datos una vez eliminado un porcentaje de ellos, llamado fracción de recorte , de cada una de las colas de los datos.

Es una medida resistente ya que elimina los valores atípicos (Outlayers), si los hay. La fracción de recorte suele ser el 5% o el 10% y se redondea por exceso.

Los datos iniciales sin los datos atípicos.

xi ni xini 150 20 3000 180 10 1800 30 4800

Conclusión: − El precio medio de las viviendas es de 160.000 €. − Y hay dos viviendas con un precio, cada una, de 750.000 €.

SE UTILIZA TODA LA INFORMACIÓN

OTRAS MEDIAS

Media Armónica. H

Es el recíproco de la media aritmética de los recíprocos de los valores de la variable.

Los valores vienen expresados en intervalos :

Media Geométrica. G

Es la raíz del índice el tamaño de la muestra y radicando el producto de los valores de la variable.

También se puede calcular así:

Si los valores vienen expresados en intervalos:

Media Cuadrática. C

Es la raíz cuadrada de la media aritmética de los cuadrados de los valores de la variable.

Si los valores vienen en intervalos:

PROPIEDAD: Si los valores son enteros positivos:

A partir de un gráfico tallo y hojas (2.8):

Obtención de la mediana cuando los valores vienen expresados en intervalos.

A partir del polígono acumulativo:

− Interpolación.

Suponer Me está en I=(ei-1, ei).

Ej. Interpolación. (2.5)

Intervalos ni Ni 0-10 60 60 10-20 80 140 20-30 30 170 30-100 20 190 100-200 10 200 200

El intervalo donde está la mediana es el (10, 20).

Interpolación:

(En este caso coinciden el centro del intervalo, pero no tiene por qué ser así).

También se puede interpolar con las frecuencias relativas o los porcentajes.

Mediante formulación : → Mejor que la interpolación.

Con frecuencias absolutas.

Supongamos que el intervalo donde está la mediana es: Ime = (ei-1, ei)

Tabla de la hoja suelta: …. Ni …. 2 …. 6 …. 11 …. 13 …. 16 …. 20 …. 20 …. 21

Moda. Mo.

La moda es el valor que más veces se repite, el que presenta mayor frecuencia. Se obtiene por observación. Puede haber varias modas.

Si los valores vienen dados en intervalos, el intervalo de la moda es el que presenta mayor altura. Tomaremos como moda la marca de clase de dicho intervalo.

ALGUNAS CONSIDERACIONES.

Media Aritmética poblacional : centro de masa de la distribución poblacional de frecuencias. Punto de equilibrio de la figura.

Mediana poblacional : Divide la gráfica de la distribución de frecuencias (polígono acumulativo) en dos mitades, en dos zonas con la misma área.

Moda poblacional : Valor de la variable al que le corresponde el máximo relativo de mayor altura. Puede haber varias modas.

En distribuciones simétricas unimodales las tres medidas coinciden. En distribuciones moderadamente asimétricas se suele hacer la media aritmética y en distribuciones muy asimétricas la media.

La moda es representativa solo cuando hay un valor que se repite mucho en el conjunto de distribución.(2/3/2010)

PROPIEDADES DE LA MEDIA ARITMÉTICA Y DE LA MEDIANA.

HOJA A PARTE.