inv.comercial, Apuntes de Industria y Comercio. Universidad Complutense de Madrid (UCM)
lauracrespobedoya
lauracrespobedoya

inv.comercial, Apuntes de Industria y Comercio. Universidad Complutense de Madrid (UCM)

37 páginas
1Número de descargas
12Número de visitas
Descripción
Asignatura: Investigación Comercial, Profesor: olga villuendas, Carrera: Comercio, Universidad: UCM
20 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 37
Esta solo es una vista previa
3 páginas mostradas de 37 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 37 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 37 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 37 páginas totales
Descarga el documento
TEMA I LA INVESTIGACIÓN DE MERCADO

CURSO 2017_2018

TEMA 10:

PROCESAMIENTO Y ANÁLISIS DE DATOS

CURSO 2017_2018

1. Etapas del procesamiento de datos y análisis de información

2. Clasificación de las técnicas de análisis

3. Análisis univariable descriptivo e inferencial

4. Análisis bivariable

4.1 Contrastes paramétricos: diferencia medias y proporciones, análisis de la varianza

4.2 Análisis de tablas de contingencia

5. Principales técnicas de análisis multivariable aplicables en marketing

CURSO 2017_2018

1. ETAPAS EN EL TRATAMIENTO ANÁLISIS DE LA INFORMACIÓN CUANTITATIVA

Revisión, depuración y supervisión de los cuestionarios y datos.

Codificación

Grabación/generación y verificación del fichero de datos

Tratamiento de la información

Tabulación

Análisis de cada pregunta

Estudio de relaciones por pares de preguntas

Análisis de preguntas por subgrupos

Estudio de relaciones entre todas las preguntas

Contrastes de Hipótesis

Interpretaciones, resultados y conclusiones

CURSO 2017_2018

PREPARACIÓN DE LOS CUESTIONARIOS. LA CODIFICACIÓN.

Revisión y depuración de datos o cuestionarios

Se efectúa para corregir errores provenientes de: ambigüedades, respuestas no legibles,

errores en las casillas, omisiones, incoherencias,

Codificación

Consiste en la asignación de números (códigos) a las respuestas. La codificación se

utiliza en distintos casos en los que se asignan números (códigos) a los ítems de

respuesta de cada una de las variables:

Respuestas cerradas; 1 = hombre, 2 = mujer

Si son categorías; 1 = renta alta, 2 = renta media, 3 = renta baja

Si la escala es métrica el código coincide con el valor. Si la edad es 38 años, el

código es 38. Se puede reconvertir en otra variable por intervalos de edad que no

sea métrica sino categórica.

Si una pregunta admite respuestas múltiples se puede convertir cada alternativa en

dicotómica y se codifican individualmente.

Si la pregunta es abierta, se listan las respuestas literales (un porcentaje del total de

cuestionarios). Se agrupan por categorías y se asigna un código a cada categoría. La

respuesta codificada se puede grabar en el fichero de datos y ser tratada cómo una

pregunta cerrada.

CURSO 2017_2018

Interesa codificar o recodificar

o Cuando hay preguntas con respuestas abiertas

o Cuando hay muchas categorías, para agruparlas y facilitar su tratamiento y

análisis.

o Cuando la información es continua y se quieren hacer intervalos.

o Cuando se desea combinar variables y/o crear nuevas recodificando otras

variables.

Cómo se hace la recodificación:

o Las categorías tienen que estar cerradas

o Las categorías tienen que ser excluyentes

o Las categorías tienen que ser significativas homogéneas en sí y distintas entre sí

o Su número debe ser razonable

En el ejemplo siguiente vemos las respuestas obtenidas a las variables 1 a 7 de un

cuestionario en una encuesta y algunos ejemplos de codificación.

CURSO 2017_2018

Ejemplos de recodificaciones en la tabla adjunta

VAR 1 VAR 2 VAR 3 VAR 4 VAR 5 Recodifica

VAR 5.1 VAR 6 VAR 7

Recodifica

VAR7

Cuestio. Ciudad

Nivel

renta Profesión Compra

TIPOCOMPRA

Sexo Edad

CODEDAD

42 5 1 9 Pizza 1 1 56 2

56 9 8 8 Chuletas 2 2 59 2

210 9 8 9 Sopa 1 2 81 3

217 4 9 8 Arroz 1 1 57 2

222 6 10 10 Vino 3 1 77 3

237 9 1 7 Trucha 2 2 22 1

258 7 1 8 Cerveza 3 1 58 2

260 1 8 10 Pan 1 1 22 1

327 8 10 10 Alubias 1 2 23 1

332 6 9 8 Coca-cola 3 4 21 1

CURSO 2017_2018

Codificación realizada:

 En la variable 6, sexo, al analizar el fichero de datos se observa un error (código 4)

cuando las opciones son, solamente 1=hombre o 2=mujer. Se recodifica

corrigiendo el error. Hay que recodificar –si es posible-, asignando código1 =

hombre, ó 2 = mujer; si no se puede se le asigna un No sabe/No contesta

NS/NC=9.

 La variable 7, edad, se ha preguntado como una variable cuantitativa o numérica. Se

decide crear una nueva llamada codedad, por recodificación en tramos de edad,

asignando a cada tramo un código. Construimos una nueva variable categórica

recodificando la numérica en intervalos. La nueva variable la llamamos “codedad”,

donde, código = 1 si es joven menor de 30 años; código = 2 si edad entre 30 y 64

años y código = 3 si la edad es 65 o más años.

 La variable 5 es una respuesta abierta y se procede a ver las respuestas recogidas y

agruparlas por categorías. Después se asigna un código a cada categoría de

respuesta. De ese modo se pueden codificar las respuestas en el fichero de datos

para que puedan ser tratados estad. Desde los resultados de la variable abierta

compra, creamos una nueva variable cerrada “tipocompra” con los códigos que

decidimos asignar: tipocompra=1 si se mencionan alimentos frescos, tipocompra

= 2 si en abierto se refieren a alimentación seca y tipocompra=3 si son bebidas.

De este modo el fichero queda revisado codificado y cerrado en las respuestas.

CURSO 2017_2018

LA GRABACIÓN DE DATOS. EL FICHERO DE DATOS

Si la información ha sido recogida en soporte papel, antes de iniciar el proceso de

análisis es necesario grabar los datos en un soporte informático, que permita su

posterior tratamiento estadístico.

Si las entrevistas se han realizado utilizando algún programa informático (CATI, CAPI,

CAWI, o similar), el programa de entrada de datos se ha diseñado previamente y el

fichero de datos se genera en tiempo real, al tiempo que se hace el trabajo de campo.

Una vez grabados los cuestionarios de papel se verifica la grabación,es decir, se graba

una segunda vez para detectar errores de grabación en el fichero.

Para grabar los datos se debe dar formato al fichero de entrada de datos, escribiendo

previamente su estructura en un programa informático (SPSS o similar): las variables, sus

ítems códigos de respuesta y sus características, para después introducir los datos (los

casos) de cada entrevista. También puede hacerse construyendo un formulario Google

Drive o similar.

El paso de la información a soportes informáticos. Ficheros de datos

Una vez que los datos recogidos en los cuestionarios han sido grabados ogenerados en

un soporte informático, lo que obtenemos es un fichero de datos similar a una matriz de

datos. Lo más frecuente es que las variables ocupen las columnas y los casos las filas. Se

puede emplear distintos programas de entrada de datos Excel, SPSS, etc. Una vez

finalizada la grabación o entrada de datos tenemos una matriz con el siguiente formato:

CURSO 2017_2018

Se trata de una matriz de

dimensión n x m, donde n

es el número de flas, es

decir el número de casos

(registros, o cuestionarios

cumplimentados, si se trata

de una encuesta) y m es el

número de columnas, lo que corresponde con el número de variables incluidas.

Una primera comprobación del fichero de

datos importante es chequear que hay el

número de casos de nuestra muestra (nº de

filas), que están todas las variables en las

columnas (no falta ni sobra ninguna) y en

cuanto a los casos grabados en las celdas

del fichero no hay casos desaparecidos o

erróneos.

Se debe guardar una copia original del

fichero antes de comenzar a tratarlo.

Fichero de datos

CURSO 2017_2018

Si se construye un fichero SPSS -sin

importar los datos que se hubieran

generado con otro programa-, primero se

construye la hoja de variables y luego se da

entrada a los datos. Un registro por cada

fila.

La construcción de variables debe hacerse

teniendo en cuenta el tipo de variable y la

escala de medida

Si se hubiera utilizando un programa de entrada de datos de cuestionarios, como por

ejemplo Google Form Drive, Excel, o cualquier otro, se puede importar directamente el

fichero a SPSS u otro programa similar. En este caso se debe comprobar que la

importación se ha realizado correctamente al nuevo fichero de SPSS.

CURSO 2017_2018

TIPOS DE VARIABLES y ESCALAS EN EL FICHERO DE DATOS

Una variable es cualquier característica, que toma valores diferentes, en un conjunto de

observaciones.

Hablamos de una variable cuantitativa o numérica cuando la característica que se mide

toma valores numéricos aritméticos. Muchas de las variables económicas son de este

tipo (como precios o gasto en unidades monetarias), pero también hay variables

económicas de tipo cualitativo.

Entendemos por variable cualitativa o categórica aquella que toma valores no

numéricos (los códigos no tienen valor numérico). La característica que se mide en este

en este caso sería, la posesión o no de una cualidad (un atributo).

Por ejemplo, la distinción de los consumidores por sexo, por tipo de familia (su

composición), el nivel de estudios o la categoría profesional son variables de tipo

cualitativo que forman parte de los análisis de los patrones de consumo.

Otro ejemplo puede ser la categorización de establecimientos comerciales (hiper, super,

tienda tradicional, etc.)

Las variables cualitativas pueden ser nominales y ordinales.

CURSO 2017_2018

En SPSS se distinguen:

Tipos de variable:

Escalas de la variable:

CURSO 2017_2018

Dependiendo del tipo de variable se pueden realizar distintos análisis estadísticos de los

datos. Por esta razón es importante planificar en el diseño del cuestionario con qué tipo

de variables y escalas se van a plantear las preguntas.

También es posible transformar las variables si el análisis lo requiere (recodificarlas,

normalizarlas, recodificarlas construyendo nuevas variables de tratamiento, etc.)

Es importante recordar que si la muestra no fue proporcionada y el análisis lo requiere

se debe de ponderar el fichero de datos. Los programas de análisis incluyen esta

opción. Para la ponderación se han de definir cuáles son los coeficientes de

ponderación.

Lo primero que se hace con el fichero es revisar variables y casos para ver la calidad del

fichero (errores en la muestra, casos perdidos, errores de grabación, etc.)

A partir de este primer análisis se puede plantear la construcción de nuevas variables a

partir de las recogidas en el fichero, como por ejemplo las recodificación de grupos de

edad, la construcción de indicadores de estatus, de perfil de consumidor etc.

CURSO 2017_2018

2. CLASIFICACIÓN DE LAS TÉCNICAS DE ANÁLISIS

Las técnicas de análisis de datos estadísticos se pueden clasificar en tres grupos

considerando el número de variables implicadas: técnicas univariables, bivariables y

multivariables.

En la clasificación de las técnicas de análisis de datos, además de la cantidad, hay que

considerar el tipo de relación que se establece entre las variables, y se consideran

técnicas de análisis de interdependencia y de dependencia. En el primer caso de

interdependencia, podemos decir que todas las variables se consideran como

independientes e interesa encontrar o constatar su patrón o estructura de relaciones

mutuas y simultáneas. En el segundo caso de dependencia, sí que se diferencia entre

variable(s) dependiente(s) e independiente(s), una(s) actúan de variables explicadas y

otra(s) de variables explicativas según un modelo de análisis explicativo que explicaría la

relación de dependencia.

En tercer lugar se pueden distinguir las técnicas de análisis de datos en función del nivel

de medición de las variables, su métrica. En función de si las variables son cuantitativas

(métricas, de tipo discreto o continuo) o cualitativas (no métricas, de tipo nominal u

ordinal).

En función de estas consideraciones, se utilizan distintas técnicas estadísticas más o

menos complejas.

CURSO 2017_2018

Los análisis de los datos pueden ser puramente descriptivos, si se trata de clasificar,

analizar representar los datos recogidos en un estudio, o bien un análisis estadístico

inferencial, si trata de inferir, -a partir de lo observado en una muestra (n)-, las

características generales de la población (N). Para ellos se realizan pruebas a la muestra.

Estos análisis se basan en los Contrastes de hipótesis.

CONTRASTE DE HIPÓTESIS

En investigación de mercados, para el análisis de los datos y la interpretación de los

resultados, se utilizan los contrastes de hipótesis. En inferencia estadística, un contraste

de hipótesis o prueba de significación es un procedimiento que sirve para corroborar si

una propiedad, -que se supone se da en una población N-, es compatible con lo

observado tomando una muestra n de esa población.

Mediante el contraste, a partir de los datos de la muestra se plantea el problema

estadístico considerando una hipótesis, es decir, una afirmación determinada H0 sobre el

comportamiento de una población, que la suponemos cierta, y una hipótesis alternativa

Ha, (la que sustituirá a H0 si la rechazamos). Con la prueba se trata de dirimir cuál de las

hipótesis es la verdadera, después de aplicar el procedimiento estadístico. Si se rechaza

H0, la probabilidad de que sea errónea es muy alta.

CURSO 2017_2018

En un contraste de hipótesis pueden darse las siguientes situaciones:

H0 VERDADERA H0 FALSA

ACEPTAR H0 NO ERROR ERROR TIPO II (β)

REHAZAR H0 ERROR TIPO I (α) NO ERROR

Error Tipo I o Nivel de significación, es la probabilidad de (rechazar H0/ siendo H0

verdadera) = (α)

Error de Tipo II es la probabilidad (aceptar H0/ siendo H0 falsa) = (β)

Potencia es probabilidad (rechazar H0 /siendo H0 falsa) = (1- β)

Para disminuir los errores Tipo I y II es necesario que aumente la muestra tomada para el

estudio, lo cual no es siempre posible por problemas presupuesto.

Lo que más me importa es no cometer error Tipo I y para eso se disminuye (α ) el nivel de significación. Lo más común es poner un (α ) 0.01 o 0.05 es decir un error de 1% y del 5%.

CURSO 2017_2018

PROCEDIMIENTO PARA UN CONTRASTE DE HIPÓTESIS

1. Identificar el parámetro que se quiere estudiar.

2. Formulación de una hipótesis nula H0 y de una hipótesis alternativa HA.

3. Fijar una valor para el nivel de significación de la prueba (α)

4. Elección de una distribución de muestreo. El estadístico.

5. Cálculo del estadístico de la prueba.

6. Aceptación o rechazo de la hipótesis nula.

7. Interpretar el resultado

ELECCIÓN DE LA PRUEBA ESTADÍSTICA ADECUADA PARA LOS ANÁLISIS

Para seleccionar la prueba estadística necesaria en el análisis de datos de un estudio, hay

que valorar antes los siguientes aspectos:

- El tipo de variable: si es cuantitativa o cualitativa

- Grado de dependencia de los datos a tratar: son dependientes (apareadas) o independientes.

- Si los datos cumplen con las necesidades que requiere la aplicación de cada prueba:

tamaño de la muestra, normalidad de la distribución, etc.

CURSO 2017_2018

3. ANÁLISIS UNIVARIABLE DESCRIPTIVO E INFERENCIAL

La matriz de datos nos permite “ver” cómo se distribuyen los datos según las distintas

variables. Un primer análisis de la matriz de datos se suele hacer por medio de un

recuento de frecuencias para las distintas variables. Con estos recuentos se puede

comprobar la calidad del trabajo de campo y grabación. También se obtienen datos para

poder construir nuevas variables recodificadas (como por ejemplo, obtener la variable

estatus recodificando conjuntamente otra/s variable/s (estudios y ocupación).

Análisis de cada variable del fichero:

Si la variable es nominal

. Frecuencias absolutas, relativas y porcentajes. Gráficos

Si la variable es métrica o continua

. Frecuencias absolutas, relativas y porcentajes

. Medidas de tendencia central: media, mediana, moda

. Medidas de posición no central: cuartiles, deciles, percentiles.

. Medidas de dispersión: La varianza y la desviación típica

. Medidas de deformación: asimetría y curtosis.

. Representaciones gráficas

. Representaciones gráficas

CURSO 2017_2018

Su presentación es bastante sencilla. Se presenta en columnas: En la primera indicamos

las respuestas obtenidas; en la segunda se cuenta el número de veces que se repite dicha

respuesta, esto es, la frecuenciaabsoluta de las respuestas.

Se suele añadir otra columna con

la frecuencia relativa y también se

puede añadir frecuencias

acumuladas.

La principal herramienta de

análisis de una variable de tipo

cualitativo es el simple recuento

del número de los casos dentro de

cada categoría. Ejemplo: los

grupos de edad de una muestra.

Tablas de frecuencias

Además de los recuentos, se pueden analizar otros estadísticos mencionados en función

del tipo de variable y los gráficos adecuados en cada caso.

CURSO 2017_2018

4. ANÁLISIS BIVARIABLE

4.0 LA TABULACION DE ENCUESTAS.

ELABORACIÓN DE TABLAS ESTADÍSTICAS.

Normalmente en un estudio se comienza la tabulación con el cruce de variables dos a

dos. El cruce de variables ofrece el recuento de los datos para los cruces de las

categorías de dos o más variables. Las tablas cruzadas pueden darse en recuentos

absolutos o en porcentajes verticales (sobre el valor total de cada columna), u

horizontales (calculados sobre el valor total de cada fila).

En la cabecera se suelen colocar variables y atributos sociodemográficos de la muestra.

En las filas las preguntas (variables) con sus respuestas.

CURSO 2017_2018

La composición más habitual es que en las columnas aparezcan los datos referidos al

total de la muestra, seguidos de la desagregación en columnas de las variables

socidemográficas (sexo edad, etc.) Los valores analizados en las preguntas en el

recuento de valores absolutos y los porcentajes verticales en la tabla de datos.

Análisis de las relaciones entre preguntas o variables

Con estas tablas se trata de analizar la relación entre las variables de nuestro estudio,

empezando con un cruce general (preguntas por variables sociodemográficas) y

después, viendo el posible interés de realizar otros cruces específicos entre distintas

preguntas del cuestionario.

TOTAL

CURSO 2017_2018

Aspectos a tener en cuenta en las tablas cruzadas

Analizan la información cruzada de dos variables. Para emplear las tabulaciones

cruzadas deben seguirse algunas reglas básicas:

a. Si los datos son nominales, ordinales, de intervalos los datos estarán en

categorías.

b. El número de categorías debe ser limitado.

c. Es conveniente que el número de categorías sea tal que el cruce tenga un número

suficiente de casos de la muestra.

d. Si en una tabla cruzamos una variable numérica:

- Si la queremos colocar en la cabecera (columnas) la debemos convertir en

categórica con un número bajo de categorías. Por ejemplo: a partir de la

variable numérica “edad” en años, crear una nueva variable categórica “grupos

de edad”. Esta nueva variable si podrá colocarse en la cabecera de la tabla.

- Si la variable numérica la queremos incluir en filas, lo habitual será que los

datos de cruce se hagan en un estadístico de síntesis: media, desviación, etc.

(ejemplo si es la “edad” el dato cruzado será media de edad)

En las tablas bivariadas se hace una primera lectura de los resultados del cruce de todas

las variables del estudio por las principales características sociodemográficas de la

muestra.

CURSO 2017_2018

Construcción de tablas cruzadas EN SPSS Menú: Analizar

TABULACIÓN

CONTRASTE DE CHI CUADRADO

CURSO 2017_2018

TABLAS DE PORCENTAJES VERTICALES Y HORIZONTALES. INTERPRETACIÓN DE

RESULTADOS. Fte: J.G. Madariaga Investigación de mercados.

Para el análisis de los resultados de una tabla se utilizan, los recuentos absolutos, pero

especialmente las tablas en porcentaje, vertical y horizontal, en función de cuál sea la

base de cálculo del porcentaje.

Ejemplo 1: En una encuesta se ha peguntado a la población de Madrid si conocía el

nuevo programa para actividades culturales del ayuntamiento para 2013. Se hizo una

encuesta y los resultados obtenidos en valores absolutos, distinguiendo los que sí lo

conocen y los que lo desconocen, fueron los de la tabla 1. Calcular la tabla de

porcentajes verticales y horizontales, e interpretar el resultado. TABLA 1

EDAD

CONOCIMIENTO MENOR DE 16 16 A 30 MAS DE 30

NO 45 34 55

SÍ 52 53 27

CURSO 2017_2018

Tabla porcentajes verticales

La mitad de los residentes conoce la

oferta cultural 2013. La notoriedad

más elevada se da entre los residentes

con edades comprendidas entre 13 y

30 años, entre los que tres de cada

cinco consultados conoce la oferta

(60,9%); en el polo contrario, los

consultados mayores de 30 años, entre

los que sólo uno de cada tres la

conoce.

CONOCIMIENTO POR GRUPO DE EDAD

No hay comentarios
Esta solo es una vista previa
3 páginas mostradas de 37 páginas totales
Descarga el documento