



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Una introducción a la importancia del proceso de datos y el análisis de datos en la investigación. El texto explica que el proceso de datos abarca desde el diseño de la investigación hasta la interpretación de resultados y plasmación en un informe. El análisis de datos es una fase importante de este proceso. Se destaca la importancia de la calidad de los datos y las decisiones tomadas antes del análisis estadístico para garantizar la transcendencia de la investigación. Se definen conceptos básicos como variables, escalas de medida, errores y incoherencias en los datos. Se menciona la necesidad de la estadística para desarrollar modelos estadísticos y hacer inferencias acerca de una población. Se distinguen las variables explicativas y extrañas, y se presentan los niveles de medición: nominal, ordinal, discreta y continua.
Tipo: Resúmenes
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




El Proceso de Datos podría definirse como un continuum que empieza en el diseño de la investigación y termina con la interpretación de resultados y su plasmación en un informe; es el conjunto de pasos por los que atraviesan los datos en una investigación. El análisis de datos sería una fase de este. La calidad de los datos, y por ende, de los resultados y la transcendencia de nuestra investigación, va a depender en buena medida de las decisiones y cuidados que se toman en momentos previos al análisis estadístico.
Un buen diseño de la investigación, una correcta operativización de las variables (haciendo uso de herramientas válidas y fiables), la utilización de una muestra de tamaño adecuado, así como el control de posibles sesgos o Variables Extrañas en la recogida de información, son aspectos fundamentales a los que a menudo se concede mucha menor importancia que el análisis estadístico de los datos. La labor del analista no termina cuando obtiene una salida de un determinado paquete estadístico, hay que interpretarla teniendo en cuenta para ello que debe conjugar la significación estadística con la relevancia conceptual o científica. Hay que interpretar los resultados y considerar las implicaciones tanto teóricas como prácticas de estos para finalmente plasmarlos de manera adecuada en un informe de investigación, incluyendo los valores estadísticos utilizados y sus niveles de significación. Sólo así el resto de la comunicación científica tendrá oportunidad de replicación.
Básicamente lo que hace el científico es formular y contrastar empíricamente sus hipótesis acerca de problemas concretos. Dichas hipótesis, se traducen, en ocasiones, en Modelos, generalmente expresados en forma matemática. Y precisamente la Estadística es la rama o vertiente de la matemática que estudia la manera de desarrollar modelos estadísticos, fundamentales para comprender y explicar datos empíricos.
Cabría situar la Estadística como la confluencia de dos disciplinas históricamente independientes: las estadísticas demográficas y el cálculo de probabilidades. Las primeras surgen de la necesidad de censar y tabular los datos de un estado para tratar de resumir su potencial humano y económico; por su parte, el cálculo de probabilidades surge del interés por la predicción de resultados en las situaciones en las que los sucesos aleatorios rigen la evolución de un fenómeno.
Amón (1985) define la Estadística como la ciencia que recoge, ordena y analiza los datos de una muestra, extraída de cierta población, y que, a partir de esa muestra, valiéndose del cálculo de probabilidades, se encarga de hacer inferencias acerca de la población. De manera general, se suele distinguir entre Estadística Descriptiva y Estadística Inferencial. La primera incluye una serie de procedimientos diseñados para organizar, sintetizar, aclarar y representar la información contenida en un conjunto de datos empíricos referidos a una muestra de individuos. La segunda engloba una serie de estrategias que permiten generalizar (inferir) las propiedades de los datos de la muestra al conjunto de la población. Para ello resulta fundamental el cálculo de probabilidades,
determinando así la relevancia estadística de los resultados muestrales.
La aplicación concreta del razonamiento inductivo al campo de la estadística se denomina "método estadístico". Es precisamente el uso de este método lo que asegura que el riesgo que corren los investigadores en sus conclusiones o generalizaciones sea mínimo, conociendo de antemano la incertidumbre que asumen en cada caso. Así pues, la Estadística, no es más que una herramienta, poderosa e imprescindible para practicar la investigación científica.
Es interesante establecer tres grandes niveles de análisis, por lo que a la utilización de la Estadística y el Análisis de Datos se refiere:
Una adecuada comprensión de los problemas de investigación implica el uso de las tres aproximaciones de manera complementaria.
El término "Variable" resulta excesivamente amplio para englobarlo sobre una misma definición, ya que comprende realidades muy particulares y distintas. Tal vez la definición más razonable es aquella bajo la cual una Variable sería toda característica o propiedad de los objetos o sujetos que puede adoptar valores diferentes. La diversidad de realidades que pueden englobarse bajo el término hace que se propongan diferentes criterios para su clasificación.
A la hora de clasificar las variables suelen establecerse dos grandes criterios: uno de tipo metodológico y otro de tipo estadístico. Bajo el primero de ellos nos fijaremos en el papel que cumple cada variable dentro de la investigación. Así podemos diferenciar Variables Explicativas y Variables Extrañas. Las primeras constituyen el objeto central del Diseño de una investigación, así como el núcleo de las relaciones que el investigador pretende estudiar. Dentro de éstas cabe diferenciar, a su vez, entre Variables Independientes y Variables Dependientes (denominadas así cuando la investigación es de tipo experimental), o bien, entre Variables Predictoras y Criterios (si la investigación no es experimental).
La Variable Independiente (VI) es aquella que el investigador manipula de forma deliberada con el fin de observar qué efectos tiene sobre otra variable denominada Variable Dependiente (VD). A las
Un último término es la Variable Categórica, son esas variables (tanto cualitativas como semicuantitativas) que comprenden un número de opciones limitado; por ejemplo, el nivel de consumo de una determinada sustancia: (1) Nulo, (2) Bajo, (3) Medio, (4) Alto. Estas a su vez pueden ser dicotómicas o politómicas.
Los niveles de medida nominal y ordinal son considerados niveles de medida débiles , mientras que los de intervalo y los de razón son considerados niveles de medida fuertes. En el primer caso hablamos de variables no métricas y en el segundo de variables métricas.
Antes de proceder con el análisis estadístico encaminado a la obtención de resultados de carácter descriptivo y/o inferencial que han de dar respuesta a los objetivos planteados, el investigador tiene que detenerse en la preparación y el examen de su archivo o base de datos. Este proceso de preparación y análisis preliminar comprende una serie de pasos.
Cada una de estas fases constituye una parte esencial en el Proceso de Datos. Los análisis estadísticos más avanzados, las pruebas más complejas o los modelos multivariantes más sofisticados carecen de validez alguna si el archivo de datos contiene errores o incoherencias, casos perdidos de manera no aleatoria o variables con características desconocidas o que no se adecúan a los supuestos de las técnicas empleadas. Sólo una vez realizada ésta es posible llevar a cabo los análisis posteriores con ciertas garantías.
Adicionalmente, el análisis estadístico suele implicar la creación de nuevas variables que no fueron recogidas directamente por el investigador, pero que resultan de interés, así como la división de la base de datos en diferentes segmentos o grupos para el análisis individualizado de cada uno de ellos. En estos casos, la transformación de las variables originales, la creación de nuevas variables o el filtrado de casos serán pasos que el investigador deberá llevar a cabo con detenimiento, preparando así los datos para su análisis posterior.
Una vez que el investigador dispone de los datos del estudio es preciso trasladar esa información a un programa informático que permita su análisis. Para ello, el primer paso es reproducir en una plantilla de datos las variables reales existentes, esto es, definir el archivo de datos. Habitualmente
cada una de las columnas de esta plantilla representará una variable y cada fila un caso o registro. De este modo, cada fila representa el comportamiento de un sujeto a lo largo de una lista de variables incluidas en el estudio. Una vez definidas las variables no hay más que introducir, fila a fila, los datos de cada registro. Aunque es posible introducir los datos antes de la definición de las variables, se recomienda realizar ésta en primer lugar. En el programa G-Stat 2.0, en el menú anterior se ofrece la posibilidad de codificar o recodificar las variables del archivo. Esta opción es útil para identificar los valores de las variables cualitativas o categóricas, donde cada uno de los códigos numéricos representa una categoría diferente.
En el proceso de introducción de datos, así como en el propio proceso de recogida de información es posible que se produzcan errores que pueden originar un grave sesgo en los análisis. Cabe destacar fundamentalmente dos tipos:
A. (^) Valores fuera de rango o no permitidos: Corresponden a aquellos datos que no entran dentro de los valores admitidos por una determinada variable. Aplicado a variables categóricas, un valor fuera de rango sería todo aquél que no esté definido como una de las posibilidades de la variable. También es posible encontrar valores fuera de rango en las variables cuantitativas de las que conocemos el mínimo y el máximo valor admisible. En aquellos casos en los que esos valores se desconoces, como podría suceder con la Estatura, deberemos guiarnos por el sentido común a la hora de considerar un dato como erróneo. En cualquier caso, la primera recomendación es crear una primera columna en el archivo de datos en la que se asigne un código a cada sujeto y conservar siempre los registros originales en papel. De ese modo podrá llevarse a cabo la comprobación puntual de aquellos valores que “supongamos” erróneos y subsanarlos. Una vez que se conoce qué variables poseen errores y cuáles son éstos, será preciso buscarlos en el archivo de datos y subsanarlos.
B. Depuración de incoherencias: Entendemos por incoherencia todo valor no admisible en una variable teniendo en cuenta el valor observado en alguna otra variable, partiendo de una relación de contingencia entre ambas. En otras palabras, las incoherencias tienen lugar cuando una variable constituye un filtro o condición para otra.
El análisis de las bases de respuesta pretende verificar que existen datos en todas las variables de interés para los n elementos de la muestra, consiguiendo de esta forma que no haya datos perdidos o missing , es decir, casillas en blanco que indiquen la ausencia de respuesta en una variable para un determinado sujeto. Las razones por las que es importante tener en cuenta las bases de respuesta a la hora de llevar a cabo el Análisis de Datos son fundamentalmente dos:
A. Una disminución del tamaño muestral para una determinada variable por la presencia excesiva de datos perdidos, implica el aumento de error típico asociado a los diferentes estadísticos y, por lo tanto, la ampliación de intervalos de confianza, lo que conlleva una menor precisión en las estimaciones y una menos potencia en los contrastes estadísticos.