Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica I, Apuntes de Economía

Asignatura: estadistica, Profesor: Jordi Rosell, Carrera: Economia, Universidad: UAB

Tipo: Apuntes

2013/2014

Subido el 19/03/2014

sheilapa89
sheilapa89 🇪🇸

4.1

(33)

5 documentos

1 / 117

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Notes sobre Estadística I
Xavier Vilà
Universitat Autònoma de Barcelona
Curs 2013-2014
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga estadistica I y más Apuntes en PDF de Economía solo en Docsity!

Notes sobre Estadística I

Xavier Vilà

Universitat Autònoma de Barcelona

Curs 2013-

2 Estadística I

4 Estadística I

Índex

  • 1 Estadística Descriptiva
    • 1.1 Taules de distribució de freqüències univariants
      • 1.1.1 Tipus de variables
      • 1.1.2 Distribucions de freqüències - o quantitatives discretes 1.1.2.1 Distribució de freqüències de variables qualitatives - contínues 1.1.2.2 Distribució de freqüències de variables quantitatives
    • 1.2 Mesures de centralització, de dispersió i d’altres mesures característiques
      • 1.2.1 Mesures de centralització
        • 1.2.1.1 La mitjana aritmètica
        • 1.2.1.2 La Mediana
        • 1.2.1.3 La Moda
      • 1.2.2 Mesures de dispersió
        • 1.2.2.1 L’Error Quadràtic Mig
        • 1.2.2.2 La Variància
        • 1.2.2.3 La Desviació Típica
        • 1.2.2.4 El Coeficient de Variació
        • 1.2.2.5 Quartils
        • 1.2.2.6 Percentils
        • 1.2.2.7 Rang interquatíl·lic
    • 1.3 Histogrames i d’altres representacions gràfiques
      • 1.3.1 Representacions gràfiques de variables qualitatives
        • 1.3.1.1 Diagrames de barres
        • 1.3.1.2 Diagrames de sectors
      • 1.3.2 Representacions gràfiques de variables quantitatives
        • 1.3.2.1 Histogrames 6 ÍNDEX
        • 1.3.2.2 Diagrames de caixa
      • dicionades 1.4 Distribucions de freqüències multivariants, freqüències marginals i con-
      • 1.4.1 Distribució bivariant de freqüències
      • 1.4.2 Distribucions de freqüències marginals
      • 1.4.3 Distribucions de freqüències condicionades
    • 1.5 Covariància i coeficient de correlació.
    • 1.6 Mitjana i variància de combinacions lineals de variables
    • 1.7 Vectors de mitjanes i matriu de covariàncies
  • 2 Teoria de la Probabilitat.
    • 2.1 Esdeveniments aleatoris i espais mostrals.
      • 2.1.1 Esdeveniments.
      • 2.1.2 σ-Àlgebra d’esdeveniments (A).
      • 2.1.3 Tipus d’esdeveniments.
      • 2.1.4 Operacions amb esdeveniments
      • 2.1.5 Diagrames de Venn
      • 2.1.6 Propietats dels esdeveniments.
    • 2.2 Probabilitat: definició axiomàtica i interpretacions
      • 2.2.1 Definició axiomàtica de probabilitat.
      • 2.2.2 Interpretacions de la probabilitat
    • 2.3 Combinatòria
      • 2.3.1 Permutacions
      • 2.3.2 Combinacions
    • 2.4 Càlcul de probabilitats i les seves propietats
    • 2.5 Probabilitat condicionada i independència Estocàstica.
      • 2.5.1 Probabilitat Condicionada.
      • 2.5.2 Independència estocàstica
    • 2.6 Teoremes de la probabilitat total i de Bayes
      • 2.6.1 Teorema de la probabilitat total
      • 2.6.2 Teorema de Bayes
  • ÍNDEX
  • 3 Variables aleatòries discretes
    • 3.1 Definició de variable aleatòria
    • 3.2 La funció de probabilitat i la funció de distribució
      • 3.2.1 Funció de probabilitat
      • 3.2.2 La funció de distribució
    • 3.3 Característiques numèriques: Esperança i Variància
      • 3.3.1 Esperança
      • 3.3.2 Variància.
    • 3.4 Variables aleatòries discretes multidimensionals
    • 3.5 Funcions de probabilitat conjuntes i marginals
      • 3.5.1 Funció de probabilitat conjunta
      • 3.5.2 Funcions de probabilitat marginals
      • pendència estocàstica 3.6 Funció de probabilitat i esperança condicionades. Concepte de inde-
      • 3.6.1 Les funcions de probabilitat condicionades
      • 3.6.2 Esperança condicionada
      • 3.6.3 Independència estocàstica
    • 3.7 Covariància i coeficient de correlació. Matriu de covariàncies
      • 3.7.1 Matriu de variàncies i covariàncies
    • 3.8 Distribucions discretes clàssiques
      • 3.8.1 Distribució de Bernoulli.
      • 3.8.2 Distribució Binomial
      • 3.8.3 Distribució Geomètrica.
      • 3.8.4 Distribució de Poisson.
  • 4 Variables aleatòries contínues
    • 4.1 La funció de densitat de probabilitat i la funció de distribució
      • 4.1.1 La funció de densitat
      • 4.1.2 La funció de distribució.
    • 4.2 Característiques numèriques: Esperança i variància
      • 4.2.1 Esperança.
      • 4.2.2 Variància.
    • 4.3 Funcions de densitat conjunta i marginals
      • 4.3.1 Funció de densitat conjunta
      • 4.3.2 Funcions de densitat marginals.
    • 4.4 Funcions de densitat i esperança condicionades. 8 ÍNDEX
    • 4.5 Principals distribucions contínues.
      • 4.5.1 Distribució uniforme.
      • 4.5.2 Distribució exponencial.
      • 4.5.3 Distribució Normal.
        • 4.5.3.1 Distribució Normal Estàndard (o tipificada).
    • 4.6 Aproximació de la distribució Binomial per la Normal
  • I Appendix
  • A Taules Estadístiques
    • A.1 Distribució Normal Estàndard
    • A.2 Distribució t − student
    • A.3 Distribució χ
    • A.4 Distribució F de Snedecor

10 ÍNDEX

Capítol 1

Estadística Descriptiva

L’Estadística: Població i Mostra, Variables i Observaci-

ons

De forma simplificada, es pot definir l’estadística de la següent manera

Definició 1.0.1 L’Estadística és un conjunt de tècniques l’objectiu de les quals és en- tendre i treure conclusions sobre un fenomen (o fenòmens) concret en un lloc i moment determinats a partir d’unes dades

Per exemple, podem estudiar l’atur a Catalunya al 2011 a partir de l’Enquesta de Població Activa, o la intenció de vot que és coneix abans de qualsevol convocatòria d’eleccions a partir de les enquestes publicades als mitjans de comunicació

Tècnicament, el “fenomen” a estudiar s’anomena variable, mentre que el “lloc i mo- ment determinats” són la població. De la mateixa manera, les “dades” també s’acos- tumen a anomenar observacions de la mostra. D’aquesta manera,

Definició 1.0.2 La Població és el conjunt d’elements que s’estudia i sobre el qual es vol treure una conclusió amb respecte d’alguna característica (o variable) seva

Definició 1.0.3 La mostra és un subconjunt de la població utilitzat per a recollir in- formació i treure conclusions sobre la mateixa

Definició 1.0.4 Reben el nom de Variables aquelles característiques o fenòmens que es volen estudiar de la població.

Definició 1.0.5 Reben el nom de Observacions els valors concrets de les variables considerades obtinguts a partir de la mostra

Per tant, en el primer dels exemples anteriors, la població és la població activa de Catalunya al 2011 i les observacions són les que s’obtenen a la mostra anomenada Enquesta de població activa (Veure figura 1.1). La variable a estudiar és, clarament, l’atur.

1.1. TAULES DE DISTRIBUCIÓ DE FREQÜÈNCIES UNIVARIANTS 13

variables a la vegada, resulta més convenient utilitzar subíndexs, X 1 , X 2 ,... , Xn.

Les diferents observacions de cada variable que s’obtenen d’una mostra sovint es de- noten amb subíndexs de la variable corresponent i amb minúscules. Així, si tenim 3 observacions de la variable X 3 , les denotarem x 31 , x 32 , x 33 , i si la variable és X les denotarem simplement com x 1 , x 2 , x 3.

Segons la seva naturalesa, trobarem que hi ha variables de dos tipus diferent:

  1. Variables qualitatives (o categòriques) Són variables que no és poden mesurar numèricament. Cada observació s’associa a un número (o lletra)
  2. Variables quantitatives (o mesurables) Són variables que es poden mesurar nu- mèricament. Poden ser de dos tipus

(a) Contínues Poden prendre qualsevol valor dins d’un interval de nombres reals. S’acostumen a obtenir de processos de mesurament. (b) Discretes Poden prendre qualsevol valor de una llista finita (o numerable) de valors^1. S’acostumen a obtenir de recomptes.

Exemple 1.1.1 Consideren la taula 1.1, què resumeix una enquesta realitzada a 10 famílies de Cerdanyola

Aquí tenim 5 variables

X 1 : Components de la família X 2 : Professió del cap de família X 3 : Ingressos mensuals X 4 : Despesa Telefònica mensual (sense quotes fixes) X 5 : ADSL (Si=1, No=0)

De cada una d’aquestes variables tenim 10 observacions

{x 11 , x 12 , x 13 , x 14 , x 15 , x 16 , x 17 , x 18 , x 19 , x 110 } = { 2 , 3 , 4 , 5 , 8 , 2 , 4 , 5 , 7 , 2 }

{x 21 , x 22 , x 23 , x 24 , x 25 , x 26 , x 27 , x 28 , x 29 , x 210 } = { 3 , 3 , 6 , 3 , 1 , 5 , 3 , 1 , 4 , 1 }

i així successivament amb totes les variables

Amb respecte del seu tipus tenim:

  • X 1 → Quantitativa discreta

X 1 ∈ { 1 , 2 , 3 , 4 , 5 , 6 ,.. .}

  • X 2 → Qualitativa

X 2 ∈ { 1 , 2 , 3 , 4 , 5 , 6 }, on (^1) En la pràctica, són com variables qualitatives

14 CAPÍTOL 1. ESTADÍSTICA DESCRIPTIVA

X

(^1)

X

(^2)

X

(^3)

X

(^4)

X

5

Família

No. de Components

Professió cap de família

Ingressos mensuals

Despesa telefònica

ADSL (Si/No)

Taula 1.1: Famílies de Cerdanyola

16 CAPÍTOL 1. ESTADÍSTICA DESCRIPTIVA

Podem, a partir d’aquí, construir una Distribució de Freqüències què consisteix en veure com la freqüència amb la que es repeteix cada valor es distribueix entre totes les observacions. Podem definir, doncs, els conceptes de Freqüència absoluta i de Freqüència relativa.

Definició 1.1.2 S’anomena Freqüència Absoluta (ni) de un determinat valor yi al número de vegades que aquest valor es repeteix entre les observacions

Definició 1.1.3 S’anomena Freqüència Relativa (fi) (o proporció) d’un determinat valor yi al percentatge de vegades (proporcions) que aquest valor apareix entre les observacions

Clarament, si n si és el total de observacions que tenim,

fi = ni n

Finalment, podem calcular^2 les Freqüències Acumulades (Absolutes (Ni) i Relatives (Fi)) simplement sumant, per a cada valor, totes les freqüències (absolutes (ni) i re- latives (fi)) de valor menor incloent el valor del qual estem calculant la freqüència acumulada. Així, aquestes freqüències acumulades s’interpreten de la següent manera:

Ni → número d’observacions de la variable que són ≤ yi

Fi → proporció d’observacions de la variable que són ≤ yi

La taula 1.2 recull totes les freqüències de la variable X 1. Observar, per exemple, les interpretacions següents:

n 3 = 2 → Hi ha 2 observacions de la variable que són = y 3 = 4

f 3 = 0. 2 → El 20% de les observacions de la variable són = y 3 = 4 N 3 = 6 → Hi ha 6 observacions de la variable que són ≤ y 3 = 4 F 3 = 0. 6 → El 60% de les observacions de la variable són ≤ y 3 = 4

Les diferents freqüències d’una variable sempre compleixen les següents propietats, on k representa el número de valors diferents que pren la variable^3

(i) 0 ≤ ni ≤ n; 0 ≤ Ni ≤ n

(ii) 0 ≤ fi ≤ 1; 0 ≤ Fi ≤ 1

(iii)

∑k i=1 ni^ =^ n

(iv)

∑k i=1 fi^ = 1

(v) n 1 = N 1 ≤ N 2 ≤ · · · ≤ Nk = n

(vi) f 1 = F 1 ≤ F 2 ≤ · · · ≤ Fk = 1

(^2) No té sentit fer-ho per a variables qualitatives ja que aquest càlcul implica que l’ordre dels valors Yi és un ordre natural i que té sentit (^3) En el exemple anterior, k = 6.

1.1. TAULES DE DISTRIBUCIÓ DE FREQÜÈNCIES UNIVARIANTS 17

Valor de

Freqüència Absoluta

Freqüència Relativa

Freqüència Absoluta Acumulada

Freqüència Relativa Acumulada

X

1

(n

)i

(f

i^

n i) n^

(N

)i

(F

i^

N i) n^

Taula 1.2: Taula de Freqüències de la variable

X

1

1.1. TAULES DE DISTRIBUCIÓ DE FREQÜÈNCIES UNIVARIANTS 19

Interval

Longitud

Marca de Classe

Freq. Absoluta

Freq. Relativa

Freq. Abs. Acumulada

Freq. Rel. Acumulada

li

ci

n i^

fi

N

i^

F

i

[527.18,844.93)

[844.93,1162.69)

[1162.69,1480.44)

[1480.44,1798.19)

[1798.19,2115.94)

[2115.94,2433.7)

[2433.7,2751.45)

[2751.45,3069.2]

Taula 1.3: Taula de Freqüències de la variable

X

3

20 CAPÍTOL 1. ESTADÍSTICA DESCRIPTIVA

“representa” l’interval. Més endavant veurem com la marca de classe s’utilitza per a fer alguns càlculs sobre la variable en qüestió.

En aquesta mateixa taula 1.3 apareix el càlcul de les freqüències corresponents a aques- ta variable. La seva obtenció és similar a la realitzada en el cas de variables discretes, només que en aquest cas, per a calcular la freqüència absoluta de cada interval, cal comptar quantes observacions de la variable són a dins l’interval.

Val a dir que aquesta és un manera de construir els Intervals de classe. De vegades, depenent del cas a estudi, els intervals ens poden venir donats en funció de diferents criteris (que els extrems siguin valors enters, que corresponguin a increments d’una determinada mida, etc). Per exemple, les mateixes dades que tenim de la variables X 3 les podríem presentar també segons la taula 1.

1.2 Mesures de centralització, de dispersió i d’altres me-

sures característiques

1.2.1 Mesures de centralització

Són mesures (estadístics) que tracten de resumir la informació que proporciona les ob- servacions de la (les) variables(s) amb uns valors descriptius. Les tres mesures centrals principals són: La mitjana, la mediana, i la moda. Les dues primeres tracten de trobar un “valor central” que representa els valors obtinguts de la variable i al voltant del qual oscil·len les observacions. La darrera, la moda, simplement identifica el valor que més cops apareix entre les observacions de les variables.

1.2.1.1 La mitjana aritmètica

Representa un valor central al voltant del qual oscil·len les observacions de les varia- bles, constituint el centre de gravetat de la distribució. El seu càlcul és senzill. Si tenim n observacions de la variable X, {x 1 , x 2 ,... , xn}, la mitjana aritmètica (denotada x¯) és:

¯x =

n

∑^ n

i=

xi

Si les dades sobre la variable X en qüestió venen recollides en una taula de freqüèn- cies (no tenim les observacions en “brut”), aleshores la mitjana s’obté a partir de les freqüències absolutes ni de la següent manera:

x ¯ =

n

∑^ k

i=

niyi

o també a partir de les freqüències relatives fi,

¯x =

∑^ k

i=

fiyi

on {y 1 , y 2 ,... , yk} són els k diferents valors que s’han observat de la variable.