









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica, Profesor: anonimo/a anonimo/a, Carrera: Ciencias Políticas y de la Administración, Universidad: USC
Tipo: Apuntes
1 / 17
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










¿Qué es y para qué sirve la Estadística? Según Agresti, la Estadística es el arte y ciencia de aprender a partir de los datos. Consiste en la recogida, sistematización, resumen, análisis y presentación de los datos con el fin de extraer conclusiones (descriptivas, explicativas, evaluativas, predictivas) y, en su caso, tomar decisiones sobre fenómenos objeto de interés. La Estadística es una poderosa herramienta para generar conocimiento (en particular, conocimiento científica).
FUNCIONES DE LA ESTADÍSTICA:
Estadística descriptiva: Es la rama de la Estadística que se ocupa de la descripción y la clasificación de datos. Se aplica para describir las propiedades de un conjunto dado de objetos, sin pretender sacar conclusiones sobre un conjunto mayor. Básicamente, permite resumir información. La estadística descriptiva es muy útil en aquellos casos en que el investigador necesita manejar relaciones mutuas entre más de dos variables.
Estadística inferencial: Es la rama de la Estadística que se ocupa de la generalización desde los datos sobre un conjunto de objetos a un conjunto más amplio; es decir, de la inferencia desde una muestra a una población. Sus tareas principales son la estimación, la decisión y la predicción. La inferencia no es del todo exacta y segura, sino que involucra incertidumbre y error (mensurables). La estadística inferencial se basa en la teoría de la probabilidad: La teoría de la probabilidad es la parte de las matemáticas que estudia los fenómenos aleatorios estocásticos. Estos deben contraponerse a los fenómenos determinísticos, los cuales son resultados únicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas.
Población y muestra:
Población: (N) es el conjunto de elementos u objetos a que está referido un estudio y sobre el cual queremos extraer conclusiones. (Universo: población objetivo).
Muestra: (n) es un subconjunto de elementos extraídos de una población. Lo más habitual es observar y analizar sólo ese subconjunto pero con el propósito de hacer afirmaciones sobre toda la población, dando por supuesto que la muestra es representativa (esto es, refleja las características de la población de manera bastante fidedigna, aunque imperfecta). Muestra aleatoria, muestra representativa, censo…
Unidades estadísticas: Se denomina unidad (o unidad estadística) a cada uno de los elementos u objetos que componen una población (o una muestra).
Variables y valores:
Parámetros y estadísticas:
Nivel de medición y tipos de variables: Las variables en estadística pueden ser fundamentalmente de dos tipos: cuantitativas o cualitativas.
En la práctica, las variables de intervalo y razón son tratadas indistintamente. En su análisis se aplican los mismos procedimientos. En rigor, a las variables de intervalo y razón se las considera cuantitativas; alas nominales y ordinales, cualitativas. Sin embargo, el nivel ordinal es tratado a veces como cuantitativo y otras como cualitativo, dependiendo de su naturaleza, su número de valores y de consideraciones puramente prácticas. Cuando las variables de nivel ordinal se utilizan como variables cuantitativas se está haciendo especial hincapié en el orden jerárquico de los valores.
Variables continuas y discretas: En función de los valores que pueden tomar, las variables pueden ser continuas o discretas:
Codificación y registro de los datos: El proceso de codificación consiste en asignar un símbolo a cada modalidad o valor de las variables y aplicar este sistema de códigos a todas y cada uno de las unidades o casos. A veces, las modalidades se agrupan en clases o intervalos o se combinan en un número menor de categorías, resumiendo información. Sin embargo, lo usual es hacerlo en “variables nuevas”, conservando toda la información en las variables originales, de modo que sea posible volver sobre ella si resulta conveniente. También es frecuente la construcción de variables derivadas a partir de las originales.
Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable.
Distribución de frecuencias. ¿Qué es y para qué sirve? La distribución de frecuencias es toda información que se ha recogido sobre la variable que se estudia. En ella se enumeran todos los valores y la frecuencia con que ha sido observado cada uno de ellos. Sirve para captar cómo se distribuyen los datos sin pérdida de información. Permite detectar de manera directa el patrón que siguen los datos.
¿Qué frecuencias? Valores que toma la variable X:
La suma de las frecuencias relativas de todos los valores x observados es igual a
Principios de la representación gráfica de datos (Tufte):
Construcción de una distribución de frecuencias agrupada en intervalos: Determinar el recorrido o rango de la distribución. Dividir el rango en un número adecuado de intervalos de clases. Calcular las frecuencias de clase. Reglas de inclusión. Intervalos reales/límites reales.
Medidas de tendencia central (o de centralización): Son las medidas estadísticas que reducen el conjunto de datos sobre una variable a un valor central considerado típico que se usa como representación y resumen de toda la distribución.
La moda: Es el valor con más alta frecuencia absoluta. Una distribución con una única moda se llama unimodal. Una con dos modas se llama bimodal. Una con varias modas se llama multimodal. Un sin moda se llama amodal. Es la medida apropiada para variable de nivel nominal. Con datos agrupados, la moda se encuentra en el intervalo modal, el que tiene mayor frecuencia absoluta.
Marca de clase (m): Mo Por definición la moda ofrece poca información, porque se basa en un único valor, el más frecuente. De ahí que su utilidad sea muy limitada, salvo cuando se utiliza como complemento de la información proporcionada por la media y/o la mediana.
La mediana: La mediana es el valor central o punto medio de la distribución cuando los datos están ordenador de forma ascendente. Es decir, es un valor que divide por la mitad la distribución ordenada de las observaciones. Es la medida más adecuada en variables de nivel ordinal. El 50% de os datos son menores o iguales a la mediana y el 50% restante mayores o iguales. La mediana depende del orden de los datos y del valor del que se encuentra en el centro, no del valor de todos y cada uno de ellos. Por tanto, prescinde de la información sobre las zonas de la distribución alejadas del centro.
La media (aritmética): Es la suma de los valores que toman todos y cada uno de los casos de la distribución dividida por su número total. Es la medida de tendencia central más utilizada. En rigor, sólo se puede calcular para variables cuantitativas, no con datos cualitativos. Sin embargo, a menudo se calcula para variables ordinales, que, en ese caso, son tratadas como si fuesen medidas a nivel de intervalo.
La media se basa en información sobre todos los valores de la distribución, tanto los próximos a su centro como los alejados de él.
Relaciones entre media, mediana y moda:
La media aritmética recortada: Sirve para eliminar la influencia de los valores atípicos y extremos, que es una media calculada prescindiendo de los valores situados en las colas de la distribución.
Otros tipos de media:
Medidas de posición. Los cuantiles: La noción de cuantil generaliza esta idea: los cuantiles son valores que dividen la distribución de una variable en un cierto número de partes iguales.
Los coeficientes de asimetría son medidas que permiten representar numéricamente el grado de simetría o asimetría que presenta una distribución sin necesidad de llevar a cabo su representación gráfica: Coeficientes de asimetría de Pearson: AP= (X-Mo) dividido entre S. Interpretación:
Medidas de forma: La curtosis y apuntamiento hacen referencia al grado de afilamiento o achatamiento de la distribución, tomando como referencia la distribución normal. Si la distribución se asemeja a la normal, es mesocúrtica. Si la distribución es más apuntada que la normal, es leptocúrtica. Si la distribución es más achatada que la normal, es platicúrtica.
Teoría de la probabilidad: La teoría de la probabilidad es la rama de las matemáticas que se ocupa del análisis y modelización de los fenómenos aleatorios. Proporciona la base de la estadística inferencial. La teoría de la probabilidad identifica y estudia distribuciones teóricas o modelos probabilísticos que se pueden tomar como referencia para el análisis de las distribuciones empíricas. En una aproximación intuitiva, se entiende por probabilidad el grado en que es posible o previsible que algo ocurra.
CONCEPTOS BÁSICOS: Experimento aleatorio: experimento que cumple tres condiciones:
Espacio muestral: El conjunto de todos los resultados posibles de un experimento aleatorio. Puede ser: a) Discreto, si es finito o infinito numerable. b) Continuo, si es infinito no numerable, esto es, está formado por intervalos continuos.
Suceso: subconjunto de un espacio muestral. Puede estar formado por un único elemento o resultado posible o por varios.
Una variable aleatoria es una función que hace corresponder un número real a cada resultado posible de un experimento aleatorio. Usamos el símbolo X para designar la variables y “x” para designar sus valores.
A partir de un mismo experimento se pueden definir distintas variables aleatorias, según cuál sea la regla o función elegida.
Tipos de variables aleatorias:
Distribución de probabilidad: Se llama distribución de probabilidad a la distribución formada por todos y cada unos de los valores de una variable aleatoria, acompañados de sus respectivas probabilidades de ocurrencia.
Función de probabilidad (variables discretas) La distribución de probabilidad de una variables aleatoria discreta X viene determinada por una regla matemática que especifica cuál es la probabilidad de ocurrencia de cada uno de los valores de la variable. A esa regla se le llama función de probabilidad, la función que hace corresponder a cada valor de la variable aleatoria su probabilidad: F(x)=p=P(X=x).
Función de densidad (variables continuas): En el caso de las variables continuas, no es posible definir una función de probabilidad. La probabilidad de ocurrencia de cada valor singular es nula. En este caso ,las probabilidades se refieren a intervalos de números reales. Es decir, se trata de determinar la probabilidad de que la variable aleatoria toma cualquier valor perteneciente a un cierto intervalo. Se llama función de densidad a la función f(x) tal que, para dos números cualesquiera a y b, tales que a<b, la probabilidad de que la variable aleatoria continua X toma un valor entre a y b es: _______________________________
Se puede entender la función de densidad como la función que define la curva límite que se obtiene si, en un histograma que representa frecuencias relativas, se aumenta indefinidamente el número de datos y se disminuye la amplitud de los intervalos.
En estos términos, las condiciones que satisface la función de densidad se pueden entender así:
Función de distribución: Se llama función de distribución a la función que determina la probabilidad de que una variable aleatoria X toma un valor igual o menor que un determinado valor x: F(x) = P(X < o = x).
Del mismo modo que se usan medidas numéricas para describir las características fundamentales de una distribución de frecuencias, se usan medidas análogas para dar cuenta de las características de la distribución de probabilidades de una variables aleatoria.
Distribución de Bernoulli: Se llama experimento de Bernoulli a un experimento que tiene dos resultados posibles cuya probabilidad es fija para todos los ensayos o repeticiones del experimento. Una variable aleatoria definida a partir de un experimento semejante tiene una distribución de Bernoulli, cuya función de probabilidad es _________________________
Distribución binominal: A partir de una serie de repeticiones de un experimento de Bernoulli se puede definir una variable aleatoria binomial, que consiste en el número de éxitos obtenidos en n realizaciones del experimento. Esta variable es equivalente a la suma de todas las variables de Bernoulli definidas sobre los n ensayos.
Otras distribuciones: Distribución de Poisson. Distribución geométrica. Distribución binomial negativa.
Distribución normal: La distribución normal es una de las distribuciones teóricas o modelos probabilísticos más importantes y desempeña un papel central en la estadística inferencial. Propiedades:
Población: Es el conjunto de elementos u objetos a que está referido un estudio y sobre el cual queremos extraer conclusiones.
Muestra: Es un subconjunto de elementos extraídos de una población. En sentido laxo, el muestreo es el procedimiento a través del cual se extrae una muestra a partir de una población.
Parámetros y estadísticos: Llamamos parámetros a números o medidas que dan cuenta de la distribución de determinadas variables en una población y permiten caracterizar ésta. En cambio, se denomina estadísticos a esos mismos números o medidas cuando se refieren a una muestra en lugar de a una población.
Párametros:__________________
Estadísticos:__________________
Lo que esperamos de una muestra es que sea representativa de la población. Es decir, que refleje adecuadamente, de manera fidedigna, las características de la población. Puede fallar el que haya un sesgo, debido a las características del procedimiento de extracción de la muestra o a desajustes entre el marcos muestral y la población objetivo o que haya error aleatorio que es la discrepancia entre muestra y población que se deriva del hecho de que se extrae al azar una entre las muchas muestras posibles de una misma población.
TIPOS DE MUESTREO:
La distribución muestral: Utilizamos los estadísticos calculados a partir de los datos de una muestr para estimar los parámetros poblacionales. A partir de una población se pueden extraer distintas muestras de un determinado tamaño. Si la población es grande, el número de muestras posibles de un mismo tamaño es muy elevado. En el caso de muestreo sin reemplazo: ____________________
a)____________________
b)____________________
Las características o propiedades de una distribución muestral pueden ser descritas exactamente igual que las de la distribución de cualquier variable.
El error típico: A la desviación típica de una distribución muestral se le llama error típico. Y este , mide la variabilidad en la distribución de una variable. La magnitud del error típico está relacionada positivamente con la magnitud de la varianza poblacional y negativamente con el tamaño de la muestra. Concretamente la fórmula del error típico es____________________________
Recordamos una vez más que un estimador es un procedimiento utilizado para estimar un parámetro poblacional, es decir, para estimar el valor o número que da cuenta de un determinado aspecto de la distribución de una variable en una población. Llamamos estimación a la operación de aplicar un estimador y también a su resultado, es decir, al valor obtenido al aplicar el estimador a una muestra determinada para obtener una aproximación al correspondiente parámetro de la población a partir d la cual ha sido extraída la muestra.
Tipos de estimación:
Propiedades deseables de un estimador: a) Eficiencia: Este criterio sólo es útil para comparar dos estimadores de un mismo parámetro cuando ambos son insesgados. b) Consistencia: un estimador es consistente si, a medida que el tamaño de la muestra es mayor, ofrece estimaciones más próximas al valor del parámetro poblacional. c) Suficiencia: Un estimador es suficiente si utiliza la máxima información relevante sobre el parámetro poblacional que está contenida en la muestra.