Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Practiques tci 1, Ejercicios de Biotecnología

Asignatura: TCI - 1, Profesor: Varios Varios, Carrera: Biotecnologia, Universidad: UdG

Tipo: Ejercicios

2013/2014

Subido el 06/02/2014

caarolsanchezpascua
caarolsanchezpascua 🇪🇸

4.5

(2)

2 documentos

1 / 46

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TCI 1 – Anàlisi Exploratòria de Dades
PRÀCTIQUES
Carles Barceló i Vidal
Francisco Martín Verdejo
Santi Thió Fdez. De Henestrosa
Àrea d’Estadística i Investigació Operativa
Departament d’Informàtica i Matemàtica Aplicada
Universitat de Girona
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e

Vista previa parcial del texto

¡Descarga Practiques tci 1 y más Ejercicios en PDF de Biotecnología solo en Docsity!

TCI 1 – Anàlisi Exploratòria de Dades

PRÀCTIQUES

Carles Barceló i Vidal

Francisco Martín Verdejo

Santi Thió Fdez. De Henestrosa

Àrea d’Estadística i Investigació Operativa Departament d’Informàtica i Matemàtica Aplicada Universitat de Girona

PRÀCTICA 1

1. Introducció

L'objectiu d'aquesta pràctica és realitzar amb l'ajuda d’Excel les primeres anàlisis estadístiques descriptives d'una variable (categòrica o numèrica), i interpretar els resultats gràfics i numèrics.

En primer lloc ens assegurarem que a la fitxa de Datos hi ha el grup Análisis i que aquest conté Análisis de datos. Si no hi és li posarem: Archivo -> Opciones -> Complementos ... i seleccionar Herramientas para Análisis.

1.1 L’arxiu óssos

En un estudi sobre la morfologia dels óssos salvatges, 143 d'aquests animals varen ser anestesiats per tal de prendre les mides de determinades parts del seu cos i per pesar-los.

Més concretament, les variables que es varen controlar són les següents:

Ident : número d'identificació de l'ós. Edat : edat de l'animal (en mesos). Mes : mes de l'any en que es realitza la mesura (1=gener, ..., 12=desembre). Sexe: sexe (1=mascle; 2=femella). Cap_lon : longitud del cap (en cm). Cap_ampl : amplada del cap (en cm). Coll_cir : longitud de la circumferència del coll (en cm). Cos_lon : longitud del cos (en cm). Pit_circ : longitud de la circumferència del pit (en cm). Pes : pes (en kg).

L'estudi pretenia com objectiu final veure fins a quin punt era possible predir el pes d'un ós salvatge a partir del coneixement de les seves mesures morfològiques (longitud i amplada del cap, longitud de la circumferència del coll i del pit, etc.). Això ho veurem a la pràctica 2. De moment, nosaltres no pretenem tant i ens limitarem a treballar algunes d'aquestes dades des d'un punt de vista de l'estadística descriptiva.

On ja hi ha seleccionat el rang de caselles. A continuació marcarem que volem posar

la taula a la Hoja de càlculo existente tot punxant a la icona que hi ha al final de la casella Ubicación. En aquests moments ens apareixerà el següent quadre:

i li indiquem la cel·la superior esquerra a on volem posar la taula (per exemple la cel·la L1). Quan premem Aceptar ens apareix el següent i ja podem començar a dissenyar la taula.

En primer lloc arrosseguem amb el ratolí la variable sexe a la zona de les Etiquetas de fila. Ara la capçalera de la taula queda així:

A continuació arrosseguem amb el ratolí la variable sexe a la zona Valores i tornem a arrossegar la variable sexe a Valores un altre cop, ja que a la nostra taula hi voldrem posar les freqüències absolutes i les freqüències relatives:

I la taula es transforma segons la figura anterior.

Per tal de configurar la primera filera de la taula cliquem sobre Suma de sexe , i en el desplegable que apareix seleccionem Configuración de campo de valor...

En aquest quadre omplim el camp Nombre personalizado : (Freqüència absoluta) i seleccionem Cuenta dins la part Resumir campo de valor por , i a continuació obrim la pestanya Mostrar valores como que ens obre un nou quadre d’on seleccionem la opció Sin cálculo (opció que surt per defecte) del desplegable Mostrar valores como:

Si volem fer un diagrama de barres directament de la taula Excel ens dibuixarà, amb la mateixa escala, les dues freqüències alhora i si intentem eliminar una de les freqüències de la gràfica també les eliminarà de la taula. Per aquest motiu copiarem les dades que hi ha a les caselles L2 i L3 (etiquetes) i a M2 i M3 (freqüències absolutes) a les caselles L6, L7 i M6, M7. A continuació seleccionem aquestes cel·les i insertem una gràfica del tipus Columnas. Un cop editat el gràfic queda:

A partir d'aquestes gràfiques, descriviu els trets més importants de la variable sexe :




2.2. Variable mes

Ens interessem per saber el nombre d'óssos que s'han controlat en cadascun dels 12 mesos de l'any. Com que la variable és categòrica ordinal l'estudiarem de la mateixa forma que la variable sexe.

Construïu una taula de freqüències de la variable mes a la posició P1. Recordeu que ho fem mitjançant taules dinàmiques. Les podem construir amb el botó Tabla dinámica que es troba a la pestanya insertar.

Mascle 69%

Femella 31%

Sexe

La taula que us ha de sortir, un cop canviades les etiquetes, és:

S'ha realitzat controls dels óssos en tots els 12 mesos de l'any? __________. Perquè? _____________________________________________________________________.

En quins mesos sembla més fàcil realitzar els controls d'aquests animals? _____________________________________________________________________.

Feu els diagrames de barres i de sectors per a la variable mes i descriviu els trets més importants.

Recordeu que abans heu de copiar les freqüències absolutes a fora de la taula (les podeu posar a la columna Q, files 12 a 19) i per podeu posar les etiquetes dels mesos (columna P, files 12 a 19). Un cop editats els gràfics us ha de sortir unes gràfiques similars a:

_____________________________________________________________________

_____________________________________________________________________

____________________________________________________________________.

13 9 7 16

(^34 ) (^19 )

Mes

En primer lloc arrossegarem quatre cops el botó sexe al mig de la taula. A la zona de

disseny  Valores i haurà aparegut Suma de sexe , 2 , 3 i 4 (en funció de les taules que

haguem fet abans pot aparèixer un botó similar com ara Cuenta de Sexe ). A

continuació, a la part  Valores , clicarem amb un sol clic sobre Suma de sexe i se’ns

obrirà un nou menú d’on escollim la darrera opció Configuración de campo de valor. En aquest quadre omplim el camp Nombre: (Freqüència absoluta) i seleccionem Cuenta dins el desplegable Resumir campo de valor por , i a continuació premem el botó Mostrar valores como que ens obre un nou quadre d’on seleccionem la opció Sin cálculo (opció que surt per defecte) del desplegable Mostrar valores como:

Per a les freqüències marginals respecte a la filera cal escollir la opció Cuenta dins el desplegable Resumir campo de valor por , i seleccionar la opció % del total de filas del desplegable Mostrar valores como que haurem activat amb la pestanya Mostrar valores como.

Per a les freqüències marginals respecte a la columna haurem de fer el mateix però seleccionar la opció % del total de columnas. I per a la freqüència relativa % del total general.

En aquests moments la taula posa els 4 valors anteriors per a cada categoria de les columnes i, per tant, és massa llarga. Per posar el 4 valors a les files hem de traslladar

el camp  Valores que està a Etiquetas de columna cap a Etiquetas de fila.

Quan acabem aquesta operació la taula tindrà aquest aspecte:

Tot observant la taula, responeu les següents preguntes:

Quants óssos femella hi ha en total? _______. Quin percentatge representen respecte del total? ________.

D'entre el total d'óssos femella, quants es varen controlar el mes d'agost? _______. Quin tant per cent representen? _______.

Quants óssos es varen controlar el mes d'agost? _______. Quin percentatge representen respecte del total? _______.

D'entre els óssos que es varen controlar el mes d'agost, quants eren femelles? _____. Quin tant per cent representen? ______.

La sortida d’aquesta funció, amb els paràmetres especificats, és:

A la vista de la informació que apareix a la finestra de resultats, contesteu les següents preguntes:

Nombre de dades ( Cuenta ): ________. Valor mínim ( Mínimo ): ________. Valor màxim ( Màximo ): ________. Mitjana ( Media ): ________. Mediana: ________. Desviació estàndard: ________. Variància: ________. El fet que la mitjana sigui bastant més gran que la mediana, cap a on indica que deu estar probablement situat el biaix d'aquesta distribució? ___________________.

Com haureu observat a la finestra del resum numèric no es calculen ni els quartils ni els percentils. Anem a calcular els percentils mostrals 1, 10, 30, 70 i 95, els quartils primer i tercer (que són els percentils 25 i 75 respectivament) i el rang interquartílic.

En primer lloc posarem etiquetes:

  1. Posarem a la cel·la L47 “Percentil 1”
  2. Posarem a la cel·la L48 “Percentil 10”
  3. Posarem a la cel·la L49 “Primer quartil”
  4. Posarem a la cel·la L50 “Percentil 30”
  5. Posarem a la cel·la L51 “Percentil 70”
  6. Posarem a la cel·la L52 “Tercer quartil”
  7. Posarem a la cel·la L53 “Percentil 95”
  8. Posarem a la cel·la L54 “Rang interquartílic”

Per calcular els percentils ho farem amb la fórmula =PERCENTIL.INC(Dades;k) on Dades és el rang de valors i k el percentil en una escala de 0 a 1. La fórmula dels quartils és =CUARTIL.INC(Dades;k) on Dades és el rang de valors i k pot valdre de 0, 1, 2, 3 o 4, en funció del quartil que vulguem calcular. El rang interquartílic el calcularem com a diferència dels quartils tercer i primer. Així doncs:

  1. Posarem a la cel·la M47 “=PERCENTIL.INC(J2:J144;0,01)”
  2. Posarem a la cel·la M48 “=PERCENTIL.INC(J2:J144;0,1)”
  3. Posarem a la cel·la M49 “=CUARTIL.INC(J2:J144;1)”
  4. Posarem a la cel·la M50 “=PERCENTIL.INC(J2:J144;0,3)”
  5. Posarem a la cel·la M51 “=PERCENTIL.INC(J2:J144;0,7)”
  6. Posarem a la cel·la M52 “=CUARTIL.INC(J2:J144;3)”
  7. Posarem a la cel·la M53 “=PERCENTIL.INC(J2:J144;0,95)”
  8. Posarem a la cel·la M53 “=M52-M49”

El resultat de totes aquestes operacions és:

Un cop oberta la funció cal que omplim els camps necessaris seguint els exemples que apareixen al costat del camp o llegint l’explicació del paràmetre que apareix. Fixeu-vos també que a la part de baix ja ens posa el resultat.

Al prémer Aceptar deixarà el resultat a la cel·la on li havíem indicat.

3.2. Anàlisi descriptiva gràfica. Histograma

Farem ara un histograma de la variable pes. Per defecte Excel calcula automàticament el nombre d'intervals de classe segons el criteri 1 explicat a les classes de teoria, és a dir, per defecte el nombre de classes és igual a l’arrel quadrada del nombre de dades.

En el cas que vulguem definir nosaltres el nombre d’intervals caldrà que definim nosaltres mateixos els intervals posant en cel·les d’Excel els valors L 1 , L 2 , ..., Lk, de tal manera que els intervals queden definits per (-,L 1 ], (L (^) 1, L 2 ], ..., (Lk-1 ,L (^) k], (L (^) k,+ ).

Per dibuixar l’histograma farem servir la funció Histograma que hi ha dins Análisis de datos (A la fitxa Datos i el grup Análisis ).

El quadre que ens apareix ens demana on són les dades ( Rango de entrada ) i on volem posar el resultat ( Rango de salida ). També hem de deixar marcat Crear gráfico i, si deixem el Rango de classes buit ens posarà el nombre de classes per defecte.

Un cop premem aceptar ens apareix la taula de freqüències i un gràfic:

Aquest gràfic encara no es pot considerar estrictament un histograma ja que els polígons de freqüència no són adjacents. Per a solucionar-ho fem doble click sobre una barra de l’histograma qualsevol i ens aparerixerà el quadre Formato de punto de datos. D’aquest quadre posem a zero el camp Ancho del intervalo a zero.

4. Anàlisi conjunta d'una variable numèrica i una categòrica

Ara valorarem numèricament les diferències entre el pes dels óssos mascles i femelles, calculant per a cada grup els estadístics habituals (mitjana, desviació estàndard, ...) de la variable pes i, també per a cada grup, dibuixant gràfiques.

4.1. Anàlisi descriptiva numèrica.

Per a calcular els estadístics utilitzarem la tabla dinámica que es troba a la pestanya insertar. En primer lloc marquem el rang de dades que va del sexe al pes (Columnes D a J, files 1 a 144) ja que per aquesta funció Excel exigeix que les dades estiguin contigües i indiquem que volem els resultats a la cel·la AB1 (cantonada superior esquerra de la taula).

A continuació personalitzarem la taula. Primer arrossegarem el botó sexe a la zona

Etiquetas de fila. A la zona  Valores hi arrossegarem cinc cops el botó pes.

A continuació, a la part  Valores , clicarem sobre Suma de pes i se’ns obrirà un nou

menú d’on escollim la darrera opció Configuración de campo de valor. En aquest quadre omplim el camp Nombre: (Freqüència absoluta) i seleccionem Cuenta dins el desplegable Resumir campo de valor por. Per a la resta de Valores haurem d’escollir

Min , Max , Promedio , Desvest i posar el nom adequat. Per acabar arrossegarem 

Valores que hi ha Etiquetas de columna fins a dins d’ Etiquetas de fila , a sota de sexe. Un cop editades les etiquetes dins la taula, aquesta és la següent:

Ompliu la taula següent (fixeu-vos que les files i les columnes estan intercanviades) i comenteu les diferències més destacades entre els estadístics del pes dels óssos mascles i femelles:

Estadístics Nombre Mínim Màxim Mitjana Desviació Tipus Mascles Femelles Total




_____________________________________________________________________.

4.2. Anàlisi descriptiva gràfica.

A continuació compararem gràficament les mitjanes i desviacions tipus. Per fer-ho utilitzarem el gràfic de columnes que hi ha per defecte (pestanya insertar -> gráficos -> Columna, sense haver seleccionat cap dada abans. Al fer això ens apareixerà una gràfica en blanc. A continuació cliquem sobre la icona seleccionar datos : i agreguem una sèrie tot indicant a valores la mitjana del pes per als macles (columna AC6) i a Nombre Macles.