Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apunts analisis de dades, Apuntes de Psicología

Asignatura: analisis de dades, Profesor: Jaume Vives, Carrera: Psicologia, Universidad: UAB

Tipo: Apuntes

2014/2015

Subido el 06/06/2015

aaronmen
aaronmen 🇪🇸

3.4

(28)

22 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ANÀLISI DE DADES
DESCRIPCIÓ DE DADES QUANTITATIVES
Població i mostres
L’estadística treballa amb mostres i a partir d’aquestes es calcula o s’arriba a les poblacions
(Lletres gregues per poblacions i lletres llatines per mostres.).
En estadística els elements que integren la població (o la mostra) s’anomenen subjectes o
individus. Tot i que freqüentment els individus són persones, també poden ser animals,
procediments, objectes diversos o altres elements reals o abstractes.
Conceptes essencials:
Matriu de dades: És una estructura en forma de taula que conté els valors de cada subjecte
en les diferents variables. Les files d’aquesta taula representen els individus i les columnes
representen les diferents variables (atribut susceptible de prendre diferents valors). Ens
permet establir una classificació de les variables en dos grans tipus segons l’escala de
mesura: variables no mètriques (dades categòriques (es distingeixen segons si accepten
ordre o no)) i variables mètriques (dades quantitatives(es distingeixen la distreta i la
continua)). En quant a les mètriques, totes les variables són contínues excepte les discretes.
Els temps transcorreguts (diferència entre dues dates): Es mesuren en temps complerts,
fonamentalment l’edat. Una persona amb 50,7 anys, té 50 anys. Les variables amb petit
recorregut equivocar-se és molt greu. És una variable continua
Histograma: És una representació clàssica de la distribució d’una variable continua. Agrupar
els subjectes en intervals (per exemple de 10 en 10). Per dibuixar-lo es parteix d’una
distribució de freqüències amb les dades agrupades en intervals de classe d’igual o diferent
amplitud. (Amplitud d’un interval: Diferència entre els llindars verdaders). Per dibuixar-lo
es col·loquen els llindars verdaders de cada classe sobre l’eix d’abscisses, i en l’eix de les
ordenades el quocient entre la freqüència i l’amplitud del corresponent interval
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Apunts analisis de dades y más Apuntes en PDF de Psicología solo en Docsity!

ANÀLISI DE DADES

DESCRIPCIÓ DE DADES QUANTITATIVES

Població i mostres

L’estadística treballa amb mostres i a partir d’aquestes es calcula o s’arriba a les poblacions (Lletres gregues per poblacions i lletres llatines per mostres.).

En estadística els elements que integren la població (o la mostra) s’anomenen subjectes o individus. Tot i que freqüentment els individus són persones, també poden ser animals, procediments, objectes diversos o altres elements reals o abstractes.

Conceptes essencials:

  • Matriu de dades: És una estructura en forma de taula que conté els valors de cada subjecte en les diferents variables. Les files d’aquesta taula representen els individus i les columnes representen les diferents variables (atribut susceptible de prendre diferents valors). Ens permet establir una classificació de les variables en dos grans tipus segons l’escala de mesura: variables no mètriques (dades categòriques (es distingeixen segons si accepten ordre o no)) i variables mètriques (dades quantitatives(es distingeixen la distreta i la continua)). En quant a les mètriques, totes les variables són contínues excepte les discretes.
  • (^) Els temps transcorreguts (diferència entre dues dates): Es mesuren en temps complerts, fonamentalment l’edat. Una persona amb 50,7 anys, té 50 anys. Les variables amb petit recorregut equivocar-se és molt greu. És una variable continua
  • Histograma: És una representació clàssica de la distribució d’una variable continua. Agrupar els subjectes en intervals (per exemple de 10 en 10). Per dibuixar-lo es parteix d’una distribució de freqüències amb les dades agrupades en intervals de classe d’igual o diferent amplitud. ( Amplitud d’un interval : Diferència entre els llindars verdaders). Per dibuixar-lo es col·loquen els llindars verdaders de cada classe sobre l’eix d’abscisses, i en l’eix de les ordenades el quocient entre la freqüència i l’amplitud del corresponent interval

FORMULES:

  • De la mitjana (centre de masses): Sumant tots els valors i dividint. Graus de llibertat: Números independents que te.
  • Asimetria negativa
  • Asimetria positiva
  • Desviació estàndard : És l’arrel quadrada positiva de la variància, per tant si obtenim, fent una operació la variància, llavors nomes farà falta que fem l’arrel quadrada d’aquesta per obtenir la desviació estàndard.
  • Sumatòria dels moments d’ordres: Sumes de cubs (s3)

EXERCICIS 1.

  1. Calcula la mitjana, la variància i la desviació estàndard de la distribució de talles (en cm) registrada en la següent mostra de 6 noies: 154, 158, 158, 162 i 168
  • Calcular la mitjana (suma de tots els valors/ 5 subjectes) Dona 160 cm
  • Variància: 154 – 160 = -6 ; 158 – 160= -2 ; 158-160 -2 ; 162- 160= 2; 168- 160=8. El resultat és les operacions aquestes (-6+(-2)+(-2)+2+ 8 = 0). Quatre elements independents i l’últim és el resultat que dona df = n-

S^2 /n-1 = (-6) 2 + (-2)^2 + (-2)^2 + 2 2 + 8 2 /4= 28 cm^2

-Desviació estàndard: arrel quadrada de 28 = 5.292 cm


Diagrama de tija i fulla (Híbrid entre una gràfica i una taula)

És un diagrama proposat per Tukey. Es caracteritza per proporcionar una ordenació de totes les dades quantitatives en intervals sense perdre els valors originals que ofereix una representació visual de la forma de la distribució. Els seus gràfics procuren no perdre els valors individuals, i els índexs descriptius que proposa són mes intuïtius i fàcils d’interpretar. Per dibuixar aquest diagrama cada valor se separa en dues parts:

  • El primer dígit, rep el nom de tija
  • L’últim dígit, rep el nom de fulla

Exemple el nombre “28”, es pot separar en desenes (2) i unitats “8”. Quan les dades han estat mesurades de forma molt precisa, tendim ha arrodonir les xifres. Per tant, per exemple, la xifra “3880” la arrodonirem a “3.9” i per tant ara ja podem separar-ho en desenes “3” i en unitats “9”.

Càlcul dels quantils

  • A partir de l’exercici de la pàgina 40:

La mediana: Coincideix amb el percentil 50 i correspon al valor central del conjunt d’observacions ordenades. El valor de la mediana és el valor de la variable que divideix la distribució en dues parts iguals. La formula per calcular la mediana és a següent:

  • Ordenar valors o puntuacions en aquest cas.
  • Posar numero de ordres (posició) dels subjectes
  • Per saber la mediana, com hem dit anteriorment, la formula es: n+1/2 ; 11+1/2=6 (6 per tant és la meitat i és on es trobarà la mediana). A continuació, mirem la posició 6 i veiem que puntuació correspon a aquesta, que en aquest cas és 23 (la mediana és 23) Càlcul de la mediana amb nombre senar de subjectes
  • Per saber la mediana, però en aquest cas dels “n” parell, llavors fem el següent: 10 +1/2 = 5.5 (5.5 per tant és la meitat i és on es trobarà la mediana). Mirem la posició 5.5 que cau al mig entre 5 i 6, i per tant la mediana es fa fent el promig dels dos números. 21+23/2= 22. Veiem doncs que la mediana en aquest cas és 22 Càlcul de la mediana amb nombre parell de subjectes

Els quarts o quartils: Els quarts H1 i H3 corresponen als valors que divideixen cadascuna de les meitats definides per la mediana en dues parts iguals. El seu càlcul es redueix a trobar la mediana de cada meitat de la distribució.

  • En quant al càlcul dels quarts amb nombre senar de subjectes, la mediana anteriorment obtinguda, ha sigut de “23”, la qual correspon a la posició “6”. Per tant apliquem la formula, n+1/2, i obtenim 6+1/2= 3,5 (meitat). Així doncs un cop tenim la posició , que s troba entre 3 i 4, veiem que aquesta correspon amb la puntuació 19.5 (per calcular-ho

1+n/

veiem que el 3.5, com he dit anteriorment es troba entre 3 i 4, els quals corresponen les puntuacions de 19 i 20 i per tant, hem de fer un promig, 19+20/2=19.5). Per tant hi= 19.5.

  • En quant al càlcul de quarts amb nombre parell de subjectes, la mediana anteriorment obtinguda, ha sigut de “22”, la qual correspon amb la posició “5.5”,però com que no es pot parlar d’un subjecte de 5.5, llavors agafem 5. Si apliquem la formula, n+1/2, obtenim 5+1/2=3 (meitat), per tant si veiem quina puntuació correspon a la posició “3” veiem que es “19”. Per tant h1=

Per calcular els h o (q) tercers, fem al mateix però amb les dades de la dreta, ja no de l’esquerra que són les que hem utilitzat per calcular els h o (q) primers.

  • Anys o mesos complits no es suma 0,
  • Anys complerts s’ha de sumar 0,5 ja que per exemple si una persona ens diu que ha començat a fumar als 14 anys, aquesta dada no es dona exactitud, i per tant abarquem tot l’interval de 14 a 15, i per això per tenir mes exactitud sumem 0,5 aquesta xifra donada (14,5)
  • A partir de l’exercici de la pàgina 41 (exercici 1.6)
  • Calculem n+1/2= 66+1/2 =33.5 (subjectes)
  • (^) Ara un cop sabem on es troba la meitat en el diagrama tija-fulla comptem. La mediana és 40 (edat). En l’enunciat ens diu que aquests valors s’han de corregir i per tant obtindrem 40,5 de mediana.
  • Un cop tenim la mediana calculada, ens disposem a calcular els quarts. Com hem dit anteriorment no podem parlar de 33.5 subjectes, per tant, considerem 33. Fem ara l’operació següent: 33+1/2= 17.La meitat és 17. Ara comptem com ho hem fet anteriorment. Hem de buscar l’edat que correspon al numero de orde 17. És 28. Per tant h1= 28 (primer quart) Correcció= 28.
  • Pel tercer quart es comença al reves per sota. Per tant h3= 53 (tercer quart) Correcció=

Diagrama de caixa

S’estudia els subjectes marginals que en el histograma no s’estudiaven mitjançant la caixa marca: els temps de remissió. Permet visualitzar les seves principals característiques: tendència central, dispersió, asimetria i valors allunyats.

  • 3 quartil
  • (^) La mediana: Al estar mes abaix , mostra asimetria positiva
  • 1 quartil

Els dos punts que apareixen eres els subjectes diferents