Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


analisi de datos upf., Apuntes de Administración de Empresas

Asignatura: Anàlisi de Dades, Profesor: libertat gonzalez, Carrera: Administració i Direcció d'Empreses, Universidad: UPF

Tipo: Apuntes

2015/2016

Subido el 07/01/2016

waer222
waer222 🇪🇸

3.8

(6)

1 documento

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ANÁLISIS DE DATOS.
Moore, páginas 6-54.
Organizar los datos y análisis descriptivo.
1 Hoja de cálculo (individuos, variables).
2 Tipo de variables. (numérico o categórico)
3. Análisis descriptivo de cada variable por separado. (herramientas gráficas y
numéricas)
FASE 1 – estudio por separado de cada variable.
1. tabla de frecuencias.
2. Gráfico.
3. Descripción numérica (solo para los numéricos).
Para cada tipo de variable existe un tipo de gráfico:
F 8
F F
variables cualitativas o categóricas:
Diagrama de barras
Diagrama de sectores.
F 8
F F
Variables cuantitativas o numéricas:
Histogramas
Diagrama de “tallo y hojas”
Descripción verbal:
1. Aspecto general:
Forma
Centro
Dispersión.
2. Observaciones atípicas: son aquellas que se salen de lo normal.
Diagrama de tallos:
Por ejemplo: 14,8 el 14 es el tallo y el 8 es la hoja. (1 dígito)
Fase 1 – determinar el tallo y la hoja, posteriormente hay que colocarlo.
Ordenar de mallor a menor. En horizontal poniendo el tallo a la izquierda y la hoja a la
derecha.
el redondeo nos permite reducir el número de clases.
Para aumentar el número de clases, se puede dividir cada talla en dos.
Descripción numérica de una variable cuantitativa.
1). – medidas de centro: media, Mediana, Moda.
2). – Medidas de posición no centrales: Máximo, Mínimo, cuartiles.
3). – Medidas de Dispersión: Recorrido, Desviación Típica, Varianza.
4). – Medidas de forma: Asimetría y Curtosis
5). Resumen de las medidas de distribución: los 5 números resumen, Diagramas de
caja.
La media es igual al sumatorio de todos los datos partido por el numero de datos.
La mediana es el valor de la variable que ocupa la posición central cuando los valores
de esta variable están ordenados. Es más robusta que la media.
pf3

Vista previa parcial del texto

¡Descarga analisi de datos upf. y más Apuntes en PDF de Administración de Empresas solo en Docsity!

ANÁLISIS DE DATOS.

Moore, páginas 6-54.

Organizar los datos y análisis descriptivo. 1 Hoja de cálculo (individuos, variables). 2 Tipo de variables. (numérico o categórico)

  1. Análisis descriptivo de cada variable por separado. (herramientas gráficas y numéricas)

FASE 1 – estudio por separado de cada variable.

  1. tabla de frecuencias.
  2. Gráfico.
  3. Descripción numérica (solo para los numéricos).

Para cada tipo de variable existe un tipo de gráfico: F 8 F F variables cualitativas o categóricas:

  • Diagrama de barras
  • Diagrama de sectores.

F 8 F F Variables cuantitativas o numéricas:

  • Histogramas
  • Diagrama de “tallo y hojas”

Descripción verbal:

  1. Aspecto general:
  • Forma
  • Centro
  • Dispersión.
  1. Observaciones atípicas: son aquellas que se salen de lo normal.

Diagrama de tallos: Por ejemplo: 14,8 el 14 es el tallo y el 8 es la hoja. (1 dígito)

Fase 1 – determinar el tallo y la hoja, posteriormente hay que colocarlo. Ordenar de mallor a menor. En horizontal poniendo el tallo a la izquierda y la hoja a la derecha.

  • el redondeo nos permite reducir el número de clases.
  • Para aumentar el número de clases, se puede dividir cada talla en dos.

Descripción numérica de una variable cuantitativa.

1). – medidas de centro: media, Mediana, Moda. 2). – Medidas de posición no centrales: Máximo, Mínimo, cuartiles. 3). – Medidas de Dispersión: Recorrido, Desviación Típica, Varianza. 4). – Medidas de forma: Asimetría y Curtosis 5). – Resumen de las medidas de distribución: los 5 números resumen, Diagramas de caja. La media es igual al sumatorio de todos los datos partido por el numero de datos. La mediana es el valor de la variable que ocupa la posición central cuando los valores de esta variable están ordenados. Es más robusta que la media.

Para calcularla, ordenamos todos los valores e menor a mayor y los puntos que están en el medio en caso par se suman y se dividen, si fuera impar seria la observación central. La moda es la variable que tiene mayor frecuencia.

Valor máximo el más alto – Valor mínimo el más bajo Recorrido o rango de valores es la diferencia entre el valor más alto y el más bajo.

Los cuartiles nos separan los valores en 4 partes iguales, es como hacer medianas de cada lado de la mediana. El rango intercuartílico es la diferencia entre el primer cuartil y el tercero.

Los deciles nos dividen de 10 en 10 y los percentiles de 1 a 99

Mediana es igual al segundo cuartil igual al quinto decil igual al percentil cincuenta.

VARIANZA = (S)al cuadrado. es la media de la distancia al cuadrado de los valores de una variable con respecto a la media aritmética.

(X1 – media) elevado al cuadrado y sumando todo. Y luego dividido entre el numero de observaciones menos 1.

DESVIACIÓN TÍPICA = S

Si la S=0 todos los valores son iguales. Si la S>0, sí hay variación, existe desigualdad entre los valores.

Coeficiente de variación v=S/media

Asimetría de Pearson – Asimetria de Fisher. Media menos moda partido por desviación típica. – momento de la media en orden 3 partida por desviación típica al cubo.

Curtosis de Fisher.

Datos agrupados y transformaciones de datos. Podemos calcular resúmenes numéricos a partir de una tabla de frecuencias con datos agrupados en intervalos.

Salarios Frecuencias absolutas 500-1000 2 1000-1500 3