Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Descriptiva: Tipos de Variables, Frecuencias y Gráficos - Prof. Utzet, Apuntes de Veterinaria

Este documento introduce el tema de estadística descriptiva, enfatizando el análisis de variables cualitativas y cuantitativas, incluyendo tipos discretos y continuos. Se explican conceptos como frecuencias absolutas, relativas y porcentajes, así como el uso de tablas de frecuencias y gráficos de pastas y barras. Además, se abordan las características de la centralización y dispersión de variables numéricas, como la media, mediana y desviación típica.

Tipo: Apuntes

2012/2013

Subido el 21/09/2013

cmcam
cmcam 🇪🇸

3

(2)

1 documento

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA
TEMA 1. ESTADÍSTICA DESCRIPTIVA
L’estadística és una ciència que tracta d’agafar totes les dades i fer-ne gràfics, taules... per entendre-la millor.
-Inferència estadística: Inferir és passar de lo concret o petit a lo general i la inferència estadística és extrapolar la
informació de la mostra a tota la població, és a dir que d’una gran població s’agafa una part i se’n recull informació i
es considera que és representativa de tota la població. Aquesta part que s’analitza s’anomena mostra.
Lobjectiu de l’estadística és extreure coneixement a partir de informació (principalment) numèrica. Per extreure
aquest coneixement s’identifiquen les principals característiques d’un conjunt de dades mitjançant un nombre reduït
de taules, gràfics... Aquests conjunts de dades procedeixen de mesurar una o més variables en un conjunt
d’individus. Per descriure un conjunt de dades es comença amb una anàlisi individual de cada variable i
posteriorment s’estudien les relacions entre variables.
Tipus de variables:
- Variables qualitatives: expressen una qualitat (ex: color, sexe...). Aquestes variables també
s’anomenen atributs i els seus valors modalitats. Moltes vegades es representen amb nombres, però no
sentit calcular-ne la mitjana, ja que aquest nombre no té una interpretació numèrica.
- Variables quantitatives: expressen una quantitat (ex: pes, alçada), s’expressen en nombres aquests que
tenen interpretació numèrica.
o Variables discretes: Prenen un nombre finit (o numerable) de valors, normalment enters. Ex:de
fills
o Variables contínues: prenen un continu de valors, és a dir que prenen valors en un interval (són
nombres decimals). Ex: pes tu pots especificar en els decimals de forma infinita, si vas afinant la
mesura pots arribar a la precisió que vulguis.
Taules de freqüències per a variables qualitatives o discretes amb pocs valors
En aquesta taula de freqüències la variable de riu és qualitativa i la de nombre de peixos
que surt com a freqüència és quantitativa discreta.
Les freqüències també s’anomenen freqüències absolutes.
En lloc de les freqüències absolutes es poden posar les freqüències relatives o els
percentatges.
Freqüència absoluta: nº concret. Ex: peixos pescats a casa riu.
Freqüència relativa: És un tant per 1 freqüència absoluta/nombre total de dades. Sempre és un nombre entre 0 i
1.
Percentatge: És un tant per 100 freqüència relativa x 100.
Gràfics per a variables qualitatives o discretes amb pocs valors
Gràfic de pastis: Cada sector és proporcional a la freqüència.
Gràfic de barres: Cada barra té una alçada igual a la freqüència absoluta o relativa.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Estadística Descriptiva: Tipos de Variables, Frecuencias y Gráficos - Prof. Utzet y más Apuntes en PDF de Veterinaria solo en Docsity!

ESTADÍSTICA

TEMA 1. ESTADÍSTICA DESCRIPTIVA

L’estadística és una ciència que tracta d’agafar totes les dades i fer-ne gràfics, taules... per entendre-la millor.

  • Inferència estadística : Inferir és passar de lo concret o petit a lo general i la inferència estadística és extrapolar la informació de la mostra a tota la població, és a dir que d’una gran població s’agafa una part i se’n recull informació i es considera que és representativa de tota la població. Aquesta part que s’analitza s’anomena mostra.

L’ objectiu de l’estadística és extreure coneixement a partir de informació (principalment) numèrica. Per extreure aquest coneixement s’identifiquen les principals característiques d’un conjunt de dades mitjançant un nombre reduït de taules, gràfics... Aquests conjunts de dades procedeixen de mesurar una o més variables en un conjunt d’individus. Per descriure un conjunt de dades es comença amb una anàlisi individual de cada variable i posteriorment s’estudien les relacions entre variables.

Tipus de variables:

  • Variables qualitatives : expressen una qualitat (ex: color, sexe...). Aquestes variables també s’anomenen atributs i els seus valors modalitats. Moltes vegades es representen amb nombres, però no té sentit calcular-ne la mitjana, ja que aquest nombre no té una interpretació numèrica.
  • Variables quantitatives : expressen una quantitat (ex: pes, alçada), s’expressen en nombres aquests sí que tenen interpretació numèrica. o Variables discretes : Prenen un nombre finit (o numerable) de valors, normalment enters. Ex: nº de fills o Variables contínues : prenen un continu de valors, és a dir que prenen valors en un interval (són nombres decimals). Ex: pes  tu pots especificar en els decimals de forma infinita, si vas afinant la mesura pots arribar a la precisió que vulguis.

Taules de freqüències per a variables qualitatives o discretes amb pocs valors

En aquesta taula de freqüències la variable de riu és qualitativa i la de nombre de peixos que surt com a freqüència és quantitativa discreta.

Les freqüències també s’anomenen freqüències absolutes.

En lloc de les freqüències absolutes es poden posar les freqüències relatives o els percentatges.

Freqüència absoluta : nº concret. Ex: peixos pescats a casa riu.

Freqüència relativa : És un tant per 1  freqüència absoluta/nombre total de dades. Sempre és un nombre entre 0 i

Percentatge : És un tant per 100  freqüència relativa x 100.

Gràfics per a variables qualitatives o discretes amb pocs valors

Gràfic de pastis : Cada sector és proporcional a la freqüència.

Gràfic de barres : Cada barra té una alçada igual a la freqüència absoluta o relativa.

Taules de freqüències per a variables contínues (o discretes amb molts valors diferents)

Si la variable X és numèrica continua, hi haurà moltes dades diferents, i llavors la taula de freqüències sortiria molt llarga i, a més, no serviria per a gaire bé res. Aleshores les dades s’agrupen per intervals o classes. Per exemple, per a la variable longitud, atès que la longitud més petita que hi ha és 25.20 cm, i la mes gran 65 cm, podem considerar els intervals [25; 30); [30; 35); : : : ; [55; 60); [60; 65];

Així, la taula de freqüències seria:

El punt mig d’un interval s’anomena la marca de la classe

Histograma

Gràfic que s’utilitza per variables contínues. A sobre cada interval hi dibuixem un rectangle d’àrea proporcional a les freqüències. L’aspecte de l’histograma depèn del nombre d’intervals.

Com seleccionem el nombre d’intervals? (és a dir, si s’agrupen les dades per fer l’histograma de 5 en 5, de 10 en 10...)

Utilitzem la següent formula en que n és la freqüència. Es pot utilitzar la formula per n≤

Característiques de la centralització de variables numèriques: mitjana i mediana

Mitjana : es sumen de totes les dades i es divideix el resultat entre el nombre total d’observacions.

Exemple de càlcul d’una mitjana:

En aquesta taula s’han resumit les dades d’una observació de nematodes, les dades s’han posat en una taula per tal de facilitar el càlcul de la mitjana.

2 plaques amb 7 nematodes cada un, en total 34

plaques

nematodes

però són parelles molt diferents. Per això necessitem alguna cosa que ens digui com de disperses estan les dades, i

per això s’utilitza el rang.

El rang es calcula restant la dada més gran menys la més petita.

Cas 1: 42-38=

Cas 2: 70-10=

2- Variància

Mesura de dispersió. No utilitza només la dada més gran i la més petita com fa el rang, sinó que fa càlculs més

complexos: es resten totes les dades que tenim menys la mitja i cada resultat s’eleva al quadrat, tot això es divideix

pel total de dades.

L’arrel de la variància és la desviació típica.

Exemple: calculem la variància i la desviació típica en el cas 1 anterior:

38 i 42 serien les 2 dades que tenim [es sumaran tants elements com dades tinguem, en aquest cas només en tenim 2. El 40 seria la mitjana de 38 i 42.

Variància modificada

Desviació típica modificada

Quan n és gran hi ha poca diferència entre la variància i la variància modificada.

La variància (i la var. modificada) està en les unitats de les dades al quadrat. En els exemples, en anys al quadrat. La

desviació típica està en les mateixes unitats, i això facilita la seva interpretació.

Una variància o una desviació típica petita vol dir que les dades estan molt concentrades al voltant de la seva

mitjana, i una variància gran (o desv. típ.) vol dir que les dades estan disperses. Però molt sovint aquests petit i gran

no tenen una interpretació absoluta, sinó que serveixen per a comparar dos conjunts de dades. Per exemple,

suposem que tenim dos grups d’estudiants, A i B, i que després d’un examen

vol dir que les notes del grup B eren totes properes a 7.2 (diem entre 6 i 8.5, més o menys), mentre que les del A

eren més disperses: hi havia suspesos i excel.lents.

Són dades molt diferents

variància Desviació típica

Desviació típica. Com més petita menys dispersió.

Els quartils

Divideixen les dades en quarts (la mediana ho feia en 2).

Q1 seria el primer quartil, que tindria el 25% de les dades a l’esquerra i el 75% a la dreta

Q2 seria el segon quartil que tindria la metitat de les dades a la dreta i l’altre meitat a l’esquerra. El segon quartil és

la mediana.

Q3 seria el tercer quartil que té el 75% de les dades a l’esquerra i el 25% de les dades a la dreta.

El rang interquartílic seria Q3-Q1.

Exemple:

Tenim 10 dades: 3; 7; 7; 3; 5; 4; 3; 9; 9; 2

Ordenem les dades: 2; 3; 3; 3; 4; 5; 7; 7; 9; 9

Fem la mediana: (4+5)/2=4,5  4,5 serà el 2n quartil

Gràcies al càlcul de la mediana ens queden 2 subgrups de dades:

  • 1r subgrup: 2; 3; 3; 3; 4

fem la mediana del 1r subgrup = 3  1r quartil

  • 2n subgrup: 5; 7; 7; 9; 9.

fem la mediana del 2n subgrup = 7  3r quartil

Exemple2:

Nº d’observacions: 13  3; 3; 4; 5; 5; 5; 6; 7; 7; 8; 12; 15; 21

El 6 serà la mediana (per tant el 2n quartil) perquè el nº d’observacions és senar i 6 és el nombre del mig. En aquests

casos el 6 s’inclou en els 2 subgrups.

  • 1r subgrup: 3; 3; 4; 5; 5; 5; 6  5 és el 1r quartil
  • 2n subgrup: 6; 7; 7; 8; 12; 15; 21  8 és el 3r quartil