



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento introduce el tema de estadística descriptiva, enfatizando el análisis de variables cualitativas y cuantitativas, incluyendo tipos discretos y continuos. Se explican conceptos como frecuencias absolutas, relativas y porcentajes, así como el uso de tablas de frecuencias y gráficos de pastas y barras. Además, se abordan las características de la centralización y dispersión de variables numéricas, como la media, mediana y desviación típica.
Tipo: Apuntes
1 / 5
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




L’estadística és una ciència que tracta d’agafar totes les dades i fer-ne gràfics, taules... per entendre-la millor.
L’ objectiu de l’estadística és extreure coneixement a partir de informació (principalment) numèrica. Per extreure aquest coneixement s’identifiquen les principals característiques d’un conjunt de dades mitjançant un nombre reduït de taules, gràfics... Aquests conjunts de dades procedeixen de mesurar una o més variables en un conjunt d’individus. Per descriure un conjunt de dades es comença amb una anàlisi individual de cada variable i posteriorment s’estudien les relacions entre variables.
Tipus de variables:
Taules de freqüències per a variables qualitatives o discretes amb pocs valors
En aquesta taula de freqüències la variable de riu és qualitativa i la de nombre de peixos que surt com a freqüència és quantitativa discreta.
Les freqüències també s’anomenen freqüències absolutes.
En lloc de les freqüències absolutes es poden posar les freqüències relatives o els percentatges.
Freqüència absoluta : nº concret. Ex: peixos pescats a casa riu.
Freqüència relativa : És un tant per 1 freqüència absoluta/nombre total de dades. Sempre és un nombre entre 0 i
Percentatge : És un tant per 100 freqüència relativa x 100.
Gràfics per a variables qualitatives o discretes amb pocs valors
Gràfic de pastis : Cada sector és proporcional a la freqüència.
Gràfic de barres : Cada barra té una alçada igual a la freqüència absoluta o relativa.
Taules de freqüències per a variables contínues (o discretes amb molts valors diferents)
Si la variable X és numèrica continua, hi haurà moltes dades diferents, i llavors la taula de freqüències sortiria molt llarga i, a més, no serviria per a gaire bé res. Aleshores les dades s’agrupen per intervals o classes. Per exemple, per a la variable longitud, atès que la longitud més petita que hi ha és 25.20 cm, i la mes gran 65 cm, podem considerar els intervals [25; 30); [30; 35); : : : ; [55; 60); [60; 65];
Així, la taula de freqüències seria:
El punt mig d’un interval s’anomena la marca de la classe
Histograma
Gràfic que s’utilitza per variables contínues. A sobre cada interval hi dibuixem un rectangle d’àrea proporcional a les freqüències. L’aspecte de l’histograma depèn del nombre d’intervals.
Com seleccionem el nombre d’intervals? (és a dir, si s’agrupen les dades per fer l’histograma de 5 en 5, de 10 en 10...)
Utilitzem la següent formula en que n és la freqüència. Es pot utilitzar la formula per n≤
Característiques de la centralització de variables numèriques: mitjana i mediana
Mitjana : es sumen de totes les dades i es divideix el resultat entre el nombre total d’observacions.
Exemple de càlcul d’una mitjana:
En aquesta taula s’han resumit les dades d’una observació de nematodes, les dades s’han posat en una taula per tal de facilitar el càlcul de la mitjana.
2 plaques amb 7 nematodes cada un, en total 34
plaques
nematodes
però són parelles molt diferents. Per això necessitem alguna cosa que ens digui com de disperses estan les dades, i
per això s’utilitza el rang.
El rang es calcula restant la dada més gran menys la més petita.
Cas 1: 42-38=
Cas 2: 70-10=
2- Variància
Mesura de dispersió. No utilitza només la dada més gran i la més petita com fa el rang, sinó que fa càlculs més
complexos: es resten totes les dades que tenim menys la mitja i cada resultat s’eleva al quadrat, tot això es divideix
pel total de dades.
L’arrel de la variància és la desviació típica.
Exemple: calculem la variància i la desviació típica en el cas 1 anterior:
38 i 42 serien les 2 dades que tenim [es sumaran tants elements com dades tinguem, en aquest cas només en tenim 2. El 40 seria la mitjana de 38 i 42.
Variància modificada
Desviació típica modificada
Quan n és gran hi ha poca diferència entre la variància i la variància modificada.
La variància (i la var. modificada) està en les unitats de les dades al quadrat. En els exemples, en anys al quadrat. La
desviació típica està en les mateixes unitats, i això facilita la seva interpretació.
Una variància o una desviació típica petita vol dir que les dades estan molt concentrades al voltant de la seva
mitjana, i una variància gran (o desv. típ.) vol dir que les dades estan disperses. Però molt sovint aquests petit i gran
no tenen una interpretació absoluta, sinó que serveixen per a comparar dos conjunts de dades. Per exemple,
suposem que tenim dos grups d’estudiants, A i B, i que després d’un examen
vol dir que les notes del grup B eren totes properes a 7.2 (diem entre 6 i 8.5, més o menys), mentre que les del A
eren més disperses: hi havia suspesos i excel.lents.
Són dades molt diferents
variància Desviació típica
Desviació típica. Com més petita menys dispersió.
Els quartils
Divideixen les dades en quarts (la mediana ho feia en 2).
Q1 seria el primer quartil, que tindria el 25% de les dades a l’esquerra i el 75% a la dreta
Q2 seria el segon quartil que tindria la metitat de les dades a la dreta i l’altre meitat a l’esquerra. El segon quartil és
la mediana.
Q3 seria el tercer quartil que té el 75% de les dades a l’esquerra i el 25% de les dades a la dreta.
El rang interquartílic seria Q3-Q1.
Exemple:
Tenim 10 dades: 3; 7; 7; 3; 5; 4; 3; 9; 9; 2
Ordenem les dades: 2; 3; 3; 3; 4; 5; 7; 7; 9; 9
Fem la mediana: (4+5)/2=4,5 4,5 serà el 2n quartil
Gràcies al càlcul de la mediana ens queden 2 subgrups de dades:
fem la mediana del 1r subgrup = 3 1r quartil
fem la mediana del 2n subgrup = 7 3r quartil
Exemple2:
Nº d’observacions: 13 3; 3; 4; 5; 5; 5; 6; 7; 7; 8; 12; 15; 21
El 6 serà la mediana (per tant el 2n quartil) perquè el nº d’observacions és senar i 6 és el nombre del mig. En aquests
casos el 6 s’inclou en els 2 subgrups.