




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica, Profesor: Jordi Rosell, Carrera: Economia, Universidad: UAB
Tipo: Apuntes
1 / 117
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































2 Estadística I
4 Estadística I
De forma simplificada, es pot definir l’estadística de la següent manera
Definició 1.0.1 L’Estadística és un conjunt de tècniques l’objectiu de les quals és en- tendre i treure conclusions sobre un fenomen (o fenòmens) concret en un lloc i moment determinats a partir d’unes dades
Per exemple, podem estudiar l’atur a Catalunya al 2011 a partir de l’Enquesta de Població Activa, o la intenció de vot que és coneix abans de qualsevol convocatòria d’eleccions a partir de les enquestes publicades als mitjans de comunicació
Tècnicament, el “fenomen” a estudiar s’anomena variable, mentre que el “lloc i mo- ment determinats” són la població. De la mateixa manera, les “dades” també s’acos- tumen a anomenar observacions de la mostra. D’aquesta manera,
Definició 1.0.2 La Població és el conjunt d’elements que s’estudia i sobre el qual es vol treure una conclusió amb respecte d’alguna característica (o variable) seva
Definició 1.0.3 La mostra és un subconjunt de la població utilitzat per a recollir in- formació i treure conclusions sobre la mateixa
Definició 1.0.4 Reben el nom de Variables aquelles característiques o fenòmens que es volen estudiar de la població.
Definició 1.0.5 Reben el nom de Observacions els valors concrets de les variables considerades obtinguts a partir de la mostra
Per tant, en el primer dels exemples anteriors, la població és la població activa de Catalunya al 2011 i les observacions són les que s’obtenen a la mostra anomenada Enquesta de població activa (Veure figura 1.1). La variable a estudiar és, clarament, l’atur.
variables a la vegada, resulta més convenient utilitzar subíndexs, X 1 , X 2 ,... , Xn.
Les diferents observacions de cada variable que s’obtenen d’una mostra sovint es de- noten amb subíndexs de la variable corresponent i amb minúscules. Així, si tenim 3 observacions de la variable X 3 , les denotarem x 31 , x 32 , x 33 , i si la variable és X les denotarem simplement com x 1 , x 2 , x 3.
Segons la seva naturalesa, trobarem que hi ha variables de dos tipus diferent:
(a) Contínues Poden prendre qualsevol valor dins d’un interval de nombres reals. S’acostumen a obtenir de processos de mesurament. (b) Discretes Poden prendre qualsevol valor de una llista finita (o numerable) de valors^1. S’acostumen a obtenir de recomptes.
Exemple 1.1.1 Consideren la taula 1.1, què resumeix una enquesta realitzada a 10 famílies de Cerdanyola
Aquí tenim 5 variables
X 1 : Components de la família X 2 : Professió del cap de família X 3 : Ingressos mensuals X 4 : Despesa Telefònica mensual (sense quotes fixes) X 5 : ADSL (Si=1, No=0)
De cada una d’aquestes variables tenim 10 observacions
{x 11 , x 12 , x 13 , x 14 , x 15 , x 16 , x 17 , x 18 , x 19 , x 110 } = { 2 , 3 , 4 , 5 , 8 , 2 , 4 , 5 , 7 , 2 }
{x 21 , x 22 , x 23 , x 24 , x 25 , x 26 , x 27 , x 28 , x 29 , x 210 } = { 3 , 3 , 6 , 3 , 1 , 5 , 3 , 1 , 4 , 1 }
i així successivament amb totes les variables
Amb respecte del seu tipus tenim:
X 2 ∈ { 1 , 2 , 3 , 4 , 5 , 6 }, on (^1) En la pràctica, són com variables qualitatives
(^1)
(^2)
(^3)
(^4)
5
Família
No. de Components
Professió cap de família
Ingressos mensuals
Despesa telefònica
ADSL (Si/No)
Taula 1.1: Famílies de Cerdanyola
Podem, a partir d’aquí, construir una Distribució de Freqüències què consisteix en veure com la freqüència amb la que es repeteix cada valor es distribueix entre totes les observacions. Podem definir, doncs, els conceptes de Freqüència absoluta i de Freqüència relativa.
Definició 1.1.2 S’anomena Freqüència Absoluta (ni) de un determinat valor yi al número de vegades que aquest valor es repeteix entre les observacions
Definició 1.1.3 S’anomena Freqüència Relativa (fi) (o proporció) d’un determinat valor yi al percentatge de vegades (proporcions) que aquest valor apareix entre les observacions
Clarament, si n si és el total de observacions que tenim,
fi = ni n
Finalment, podem calcular^2 les Freqüències Acumulades (Absolutes (Ni) i Relatives (Fi)) simplement sumant, per a cada valor, totes les freqüències (absolutes (ni) i re- latives (fi)) de valor menor incloent el valor del qual estem calculant la freqüència acumulada. Així, aquestes freqüències acumulades s’interpreten de la següent manera:
Ni → número d’observacions de la variable que són ≤ yi
Fi → proporció d’observacions de la variable que són ≤ yi
La taula 1.2 recull totes les freqüències de la variable X 1. Observar, per exemple, les interpretacions següents:
n 3 = 2 → Hi ha 2 observacions de la variable que són = y 3 = 4
f 3 = 0. 2 → El 20% de les observacions de la variable són = y 3 = 4 N 3 = 6 → Hi ha 6 observacions de la variable que són ≤ y 3 = 4 F 3 = 0. 6 → El 60% de les observacions de la variable són ≤ y 3 = 4
Les diferents freqüències d’una variable sempre compleixen les següents propietats, on k representa el número de valors diferents que pren la variable^3
(i) 0 ≤ ni ≤ n; 0 ≤ Ni ≤ n
(ii) 0 ≤ fi ≤ 1; 0 ≤ Fi ≤ 1
(iii)
∑k i=1 ni^ =^ n
(iv)
∑k i=1 fi^ = 1
(v) n 1 = N 1 ≤ N 2 ≤ · · · ≤ Nk = n
(vi) f 1 = F 1 ≤ F 2 ≤ · · · ≤ Fk = 1
(^2) No té sentit fer-ho per a variables qualitatives ja que aquest càlcul implica que l’ordre dels valors Yi és un ordre natural i que té sentit (^3) En el exemple anterior, k = 6.
Valor de
Freqüència Absoluta
Freqüència Relativa
Freqüència Absoluta Acumulada
Freqüència Relativa Acumulada
1
(n
)i
(f
i^
n i) n^
)i
i^
N i) n^
Taula 1.2: Taula de Freqüències de la variable
1
Interval
Longitud
Marca de Classe
Freq. Absoluta
Freq. Relativa
Freq. Abs. Acumulada
Freq. Rel. Acumulada
li
ci
n i^
fi
i^
i
Taula 1.3: Taula de Freqüències de la variable
3
“representa” l’interval. Més endavant veurem com la marca de classe s’utilitza per a fer alguns càlculs sobre la variable en qüestió.
En aquesta mateixa taula 1.3 apareix el càlcul de les freqüències corresponents a aques- ta variable. La seva obtenció és similar a la realitzada en el cas de variables discretes, només que en aquest cas, per a calcular la freqüència absoluta de cada interval, cal comptar quantes observacions de la variable són a dins l’interval.
Val a dir que aquesta és un manera de construir els Intervals de classe. De vegades, depenent del cas a estudi, els intervals ens poden venir donats en funció de diferents criteris (que els extrems siguin valors enters, que corresponguin a increments d’una determinada mida, etc). Per exemple, les mateixes dades que tenim de la variables X 3 les podríem presentar també segons la taula 1.
1.2 Mesures de centralització, de dispersió i d’altres me-
sures característiques
Són mesures (estadístics) que tracten de resumir la informació que proporciona les ob- servacions de la (les) variables(s) amb uns valors descriptius. Les tres mesures centrals principals són: La mitjana, la mediana, i la moda. Les dues primeres tracten de trobar un “valor central” que representa els valors obtinguts de la variable i al voltant del qual oscil·len les observacions. La darrera, la moda, simplement identifica el valor que més cops apareix entre les observacions de les variables.
1.2.1.1 La mitjana aritmètica
Representa un valor central al voltant del qual oscil·len les observacions de les varia- bles, constituint el centre de gravetat de la distribució. El seu càlcul és senzill. Si tenim n observacions de la variable X, {x 1 , x 2 ,... , xn}, la mitjana aritmètica (denotada x¯) és:
¯x =
n
∑^ n
i=
xi
Si les dades sobre la variable X en qüestió venen recollides en una taula de freqüèn- cies (no tenim les observacions en “brut”), aleshores la mitjana s’obté a partir de les freqüències absolutes ni de la següent manera:
x ¯ =
n
∑^ k
i=
niyi
o també a partir de les freqüències relatives fi,
¯x =
∑^ k
i=
fiyi
on {y 1 , y 2 ,... , yk} són els k diferents valors que s’han observat de la variable.