Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


tema 3 descriptiva bivariant, Apuntes de Matemáticas

apuntes de la universidad de girona UdG 1º de DT biologia y ciencias ambientales estadistica aplicada - matematicas

Tipo: Apuntes

2024/2025

A la venta desde 23/01/2025

docsirene
docsirene 🇪🇸

5

(1)

677 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 3
Anàlisi descriptiva
bivariant
1
Bibliografia recomanada
Pagano, Marcello (cop. 2001). Fundamentos de
bioestadística . México: International Thomson.
Miller, J.N & Miller, J.C. (cop. 2002). Estadística
y Quimiometría para Química Analítica (4ª ed)
Madrid: Prentice-Hall International.
Sokal, R. R. & F. J. Rohlf. 1995. Biometry : the principles
and practice of statistics in biological research. Freeman,
New York.
2
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga tema 3 descriptiva bivariant y más Apuntes en PDF de Matemáticas solo en Docsity!

TEMA 3

Anàlisi descriptiva

bivariant

1

Bibliografia recomanada

Pagano, Marcello (cop. 2001). Fundamentos de bioestadística. México: International Thomson.

Miller, J.N & Miller, J.C. (cop. 2002). Estadística y Quimiometría para Química Analítica (4ª ed) Madrid: Prentice-Hall International.

Sokal, R. R. & F. J. Rohlf. 1995. Biometry : the principles and practice of statistics in biological research. Freeman, New York.

Relacions bivariants

Descripcions de dades bivariants: busquem relacions entre

dues variables

Sobre cada unitat d’una població es mesuren alhora dues variables

X i Y.

Interessa estudiar el comportament conjunt de les dues variables en els

següents casos:

 X i Y variables categòriques

 X i Y variables numèriques

 Una variable categòrica i una variable numèrica

3

 taules de contingència

 diagrames de dispersió i

coeficient de correlació

 diagrames de caixa múltiple

 diagrames de barres

 descriptiva numèrica per grups

SEXE: El sexe d’una persona es basa en un seguit de característiques com els cromosomes, hormones i òrgans reproductius. El sexe es tipifica al néixer a partir d’aquestes característiques però pot canviar al llarg de la vida.

Variables qualitatives de gènere

associades a les persones

GÈNERE: El gènere és un concepte social i cultural. Es tracta de diferències socials i culturals en la identitat, expressió i experiència com a home, dona o persona no binària. No binari és un terme general que descriu identitats de gènere que no són exclusivament masculines o femenines. El gènere d'una persona pot diferir del seu sexe i també pot diferir del que s'indica als seus documents. El gènere d'una persona pot mantenir‐se igual o pot canviar al llarg de la seva vida

Altres variables relatives al gènere

Orientació sexual: que té a veure amb les persones cap a les quals s’orienta el desig (afectiu–sexual)

Identitat sexual (o de gènere) : és el sentiment íntim de ser home, dona, les dues coses o cap d'elles.

Taula de contingència

7

Descripció bivariant de dues

variables qualitatives

Quin tant per cent dels alumnes són de sexe masculí i de gènere Dona?

Dona Home No binari

Femení

Masculí

Sexe no binari

X=Sexe

Taula de Y=Gènere

freqüències

relatives

Representació gràfica

Descripció bivariant de dues

variables qualitatives

1168 47.5%

37 1.5%

42 1.7% 23 0.9%

1123

33 1.3% 18 0.7%

16 0.6%

4 0.2% 1168

36 42

23

1123

33

(^17 )

0 4

200

400

600

800

1000

1200

1400

Dona Home No binari Femení Masculí Sexe no binari

0

200

400

600

800

1000

1200

1400

Femení Masculí Sexe no binari Dona Home No binari

0

200

400

600

800

1000

1200

1400

Dona Home No binari Femení Masculí Sexe no binari

Femení

Masculí

Sexe no binari

0

200

400

600

800

1000

1200

Dona Home No binari Femení Masculí Sexe no binari

Y=Gènere

Distribucions marginals

9

Descripció bivariant de dues

variables qualitatives

Les distribucions de freqüències marginals d’una distribució bivariant de dues variables categòriques són les distribucions univariants de cadascuna de les dues variables sense tenir en compte el valor de l'altra.

Quants alumnes són de Sexe no binari? Quin tant per cent representen? Quants alumnes són de Gènere Home? Quin tant per cent representen?

Dona Home No binari TOTAL

Femení

Masculí

Sexe no binari

TOTAL

X=Sexe

X=Sexe

Perfils filera

Descripció bivariant de dues

variables qualitatives

Els perfils filera són les freqüències relatives de cada casella respecte de la seva marginal filera.

Dona Home No binari (^) Marginal filera

Femení 1168 93.7%

Masculí 23 2.0%

Sexe no binari 17 48.6%

TOTAL

Quin tant per cent dels alumnes que són de sexe masculí, són gènere no binari?

Y=Gènere

Gràfics de perfils

13

Mosaic plots

Els mosaic plots són gràfics de perfil on cada barra té la freqüència relativa de la seva marginal.

Gènere

Sexe

D H NB

F

M SNB

Independència

Descripció bivariant de dues

variables qualitatives

Podem afirmar que aquestes dues variables són

independents?

Si el sexe i el gènere són independents , la proporció de

sexe femení, masculí i no binari hauria de ser la mateixa

tant homes, dones i no binaris.

És a dir, les proporcions de la marginal han de ser les

mateixes a cada categoria i, per tant, tots els perfils han

de ser iguals.

Y=Gènere

X=Sexe

Independència

15

Descripció bivariant de dues

variables qualitatives

Veurem criteris estadístics per decidir si les

dues variables són independents o no

Dona Home No binari Marginal filera

Femení 1168 93.7%

Masculí 23 2.0%

Sexe no binari 17 48.6%

TOTAL

POBLACIÓ: consumidors de cereals en l’esmorzar diari

VARIABLE X : percentatge de sucre

VARIABLE Y : edat categoritzada Nen Adult

16

Descripció conjunta d’una variable

qualitativa i una variable numèrica

% sucre en les marques de cereals preferides pels nens:

% sucre en les marques de cereals preferides pels adults

Dades

Volem comparar la distribució de la quantitat de sucre que contenen els

cereals preferits pels nens amb la corresponent als cereals preferits pels

adults

Anàlisi gràfica

19

Descripció conjunta d’una variable

qualitativa i una variable numèrica

Plot of Means

Y

mean of X

10

20

30

40

50

Adult Nen

Gràfic de mitjanes i desviacions

Les barres d’error són ±1 desviació estàndard

Anàlisi gràfica

Descripció conjunta d’una variable

qualitativa i una variable numèrica

Gràfics de violí o Violin plots

Els gràfics de violí són gràfics de densitat kernel (nucli) simetritzats

Adult Nen

0

10

20

30

40

50

X

62

12

3

45

34

0

20

40

A N dades

dades

21

Descripció bivariant de dues

variables numèriques

Esteu fent un estudi d’etologia i us pregunteu si a l’hora

d'aparellar‐se els pingüins trien parelles amb pes similars a ells

mateixos o no.

De cada parella pesem el mascle i la femella

parella Mascle (g) femella (g) 1 4200 3902 2 4119 3854 3 3978 4002 4 3965 3934

Quina és la unitat mostral?

Quantes, de quin tipus i quines són les variables

d’aquest estudi?

Quin és el nombre de casos de l’estudi?

Com podem representar aquests resultats?

Descripció bivariant de dues

variables numèriques

Objectiu de l’estudi:

Analitzar si realment existeix una relació entre els

pesos de mascles i femelles?

2 variables numèriques i

contínues que es mesuren de

cada unitat mostral

25

Descripció bivariant de dues

variables numèriques

Covariància

1

 

N

x x y y

s

N

i

i i xy

50 60 70 80 90 100

90

100

110

120

130

140

150

160

pr_diast

pr_sist

Pressió sanguínia de 40 pacients

Per a N observacions bivariants (x 1 ,y 1 ), ..., (x (^) N,y (^) N) es defineix

la covariància entre ambdues variables X i Y com

𝑥̅ és la mitjana d’ x 1 ,...,xN i 𝑦ത la mitjana d’ y 1 ,...,yN.

Propietats de la covariànciasxy

El signe de sxy depén de la disposició dels punts al voltant del centre

de gravetat del núvol de punts (𝑥̅, 𝑦ത)

s xy té unitats [unitats X  unitats Y ]. Varia si hi ha canvis d’escala

ሺ𝒙𝒊 െ 𝒙ഥሻሺ𝒚 (^) 𝒊 െ 𝒚ഥሻ ൐ 𝟎

ሺ𝒙𝒊 െ 𝒙ഥሻሺ𝒚 (^) 𝒊 െ 𝒚ഥሻ ൐ 𝟎 (^) 𝒙𝒊 െ 𝒙ഥ 𝒚 (^) 𝒊 െ 𝒚ഥ ൏ 𝟎

𝒙𝒊 െ 𝒙ഥ 𝒚 (^) 𝒊 െ 𝒚ഥ ൏ 𝟎

27

Descripció bivariant de dues

variables numèriques

Coeficient de correlació lineal

x y

xy

s s

s r

Per a N observacions bivariants (x 1 ,y 1 ), ..., (x (^) N,y (^) N) es defineix

el coeficient de correlació lineal de Pearson entre

ambdues variables X i Y com

s x és la desviació d’ x 1 ,...,xN

s y és la desviació d’ y 1 ,...,yN

s (^) xy és la covariància entre X i Y

Propietats del coeficient de correlaciórxy

r xy no té unitats. No varia si hi ha canvis d’escala

-1  r  1

Si r >> 0 , quan X augmenta, la Y tendeix també a augmentar

Si r << 0 , quan X augmenta, la Y tendeix a disminuir

Si entre X i Y hi ha una bona relació lineal, llavors r 1

Si r  0, aleshores entre X i Y no hi ha una relació lineal.

28

3 4 5 6 7 8

2,52, 1,51, 0,50, -0,5-1, -1,5-2, -2, 5 10 15 20

(^130120) 110 (^10090) (^8070) (^6050) (^4030)

5 10 15 20

(^110100) 90 80 70 60 50 40 30 20

150 200 250

6

5

4 100 200 300

50

0

5 10 15 20

90 80 70 60 r =1 r =- relació lineal positiva perfecta relació lineal negativa perfecta

r =-0.079 r =0. no hi ha una relació lineal no hi ha una relació lineal

r =0.972 r =-0. relació lineal positiva relació lineal negativa

Interpretació coeficient de correlació lineal

31

Número mostra

Distància (m)

Concentració Hg ngg -* 1 0.5 2. 2 1.4 2. 3 2.8 1. 4 3.8 1. 5 4.4 0. 6 5.6 1.

Exemple coeficient de correlació lineal

En un laboratori proveït d’un equipament polarogràfic es pregunten si la contaminació per mercuri i la distància al polarògraf tenen relació lineal i en quin sentit.

Es prenen 6 mostres de pols a diferents distàncies i s’obtenen els resultats:

sሺxሻൌ1.

sሺyሻൌ0.

xൌdistància yൌconcentració

Gràfiques

multivariants

POBLACIÓ: Tres tipus de flors d’iris: 50 Iris setosa, 50 Iris virginica i 50 Iris versicolor

VARIABLES: múltiples mesures taxonòmiques: longituds i amplades pètals i sèpals (cm) Multivariants homogènies juxtaposició de variables del mateix tipus.

Descripció gràfica de

diverses variables numèriques

Longitud sèpal Amplada sèpal Longitud pètal Amplada pètal Espècie 5.1 3.5 1.4 0.2 I. setosa 4.9 3.0 1.4 0.2 I. setosa 4.7 3.2 1.3 0.2 I. setosa 6.2 3.4 5.4 2.3 I. virginica 5.6 2.9 3.6 1.3 I. versicolor 5.9 3.0 5.1 1.8 I. virginica ... ... ... ... ...

33

Sobre cada unitat d’una població es mesuren alhora múltiples

(quatre) variables X amb el mateix tipus de mesura.

Interessa visualitzar comportaments conjunts de les múltiples variables

i patrons multivariants o per grups.

 gràfica de coordenades paral∙leles

 gràfiques de teranyina o estrella

POBLACIÓ: Tres tipus de flors d’iris: 50 Iris setosa, 50 Iris virginica i 50 Iris versicolor

VARIABLES: múltiples mesures taxonòmiques: longituds i amplades pètals i sèpals (cm) Multivariants homogènies juxtaposició de variables del mateix tipus.

Descripció gràfica de

diverses variables numèriques

Gràfiques

multivariants

Gràfica de coordenades

paral∙leles

Sobre un eix horitzontal situem cadascuna de les variables. En

l’eix vertical tenim els valors numèrics. Per a cada individu

representem els seus valors numèrics en la posició de la seva

variable i unim els valors de cada individu per a les diferents

variables amb una línia poligonal.

Sepal L.Sepal L. Sepal W.Sepal W. Petal L.Petal L. Petal W.Petal W.

I. setosa

I. versicolor I. virginica

Descripció gràfica de

diverses variables numèriques

Petal.Length Petal.Width Sepal.Length Sepal.Width