

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Anàlisi de Dades, Profesor: libertat gonzalez, Carrera: Administració i Direcció d'Empreses, Universidad: UPF
Tipo: Apuntes
1 / 3
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!


Moore, páginas 6-54.
Organizar los datos y análisis descriptivo. 1 Hoja de cálculo (individuos, variables). 2 Tipo de variables. (numérico o categórico)
FASE 1 – estudio por separado de cada variable.
Para cada tipo de variable existe un tipo de gráfico: F 8 F F variables cualitativas o categóricas:
F 8 F F Variables cuantitativas o numéricas:
Descripción verbal:
Diagrama de tallos: Por ejemplo: 14,8 el 14 es el tallo y el 8 es la hoja. (1 dígito)
Fase 1 – determinar el tallo y la hoja, posteriormente hay que colocarlo. Ordenar de mallor a menor. En horizontal poniendo el tallo a la izquierda y la hoja a la derecha.
Descripción numérica de una variable cuantitativa.
1). – medidas de centro: media, Mediana, Moda. 2). – Medidas de posición no centrales: Máximo, Mínimo, cuartiles. 3). – Medidas de Dispersión: Recorrido, Desviación Típica, Varianza. 4). – Medidas de forma: Asimetría y Curtosis 5). – Resumen de las medidas de distribución: los 5 números resumen, Diagramas de caja. La media es igual al sumatorio de todos los datos partido por el numero de datos. La mediana es el valor de la variable que ocupa la posición central cuando los valores de esta variable están ordenados. Es más robusta que la media.
Para calcularla, ordenamos todos los valores e menor a mayor y los puntos que están en el medio en caso par se suman y se dividen, si fuera impar seria la observación central. La moda es la variable que tiene mayor frecuencia.
Valor máximo el más alto – Valor mínimo el más bajo Recorrido o rango de valores es la diferencia entre el valor más alto y el más bajo.
Los cuartiles nos separan los valores en 4 partes iguales, es como hacer medianas de cada lado de la mediana. El rango intercuartílico es la diferencia entre el primer cuartil y el tercero.
Los deciles nos dividen de 10 en 10 y los percentiles de 1 a 99
Mediana es igual al segundo cuartil igual al quinto decil igual al percentil cincuenta.
VARIANZA = (S)al cuadrado. es la media de la distancia al cuadrado de los valores de una variable con respecto a la media aritmética.
(X1 – media) elevado al cuadrado y sumando todo. Y luego dividido entre el numero de observaciones menos 1.
Si la S=0 todos los valores son iguales. Si la S>0, sí hay variación, existe desigualdad entre los valores.
Coeficiente de variación v=S/media
Asimetría de Pearson – Asimetria de Fisher. Media menos moda partido por desviación típica. – momento de la media en orden 3 partida por desviación típica al cubo.
Curtosis de Fisher.
Datos agrupados y transformaciones de datos. Podemos calcular resúmenes numéricos a partir de una tabla de frecuencias con datos agrupados en intervalos.
Salarios Frecuencias absolutas 500-1000 2 1000-1500 3