Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística R comandar, Monografías, Ensayos de Estadística

Apunts sessions estadística dijous

Tipo: Monografías, Ensayos

2018/2019

Subido el 12/04/2019

martorressa
martorressa 🇪🇸

4.6

(5)

6 documentos

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
VARIABLES
-Numèriques:
DISCRETES: Nombre de… P ex: Nombre de vegades que llancem una pilota.
CONTÍNUES: Amb decimals. P ex: Distància.
MIXTES: És contínua excepte en un conjunt petit de punts on és discreta. P ex:
Quantitat de pluja recollida en un observatori per dia…
-Categòriques o qualitatives:
ORDINALS: Classificació. P ex: Classificació lliga futbol.
BINÀRIES. P ex: Aprovat o suspès.
NOMINAL. P ex: Color dels ulls.
Poden ser:
Nominals: categories entre les que no es poden establir relacions d’ordre.
Ordinals: categories que poden ser ordenades segons la seva magnitud.
DESCRIPTIVA UNIVARIANTS
TABULACIÓ QUALITATIVES
1. Diagrama de sectors
2. Diagrama de barres
TABULACIÓ NUMÈRIQUES
Moltes vegades no sentit fer una taula valor per valor. Cal agrupar les dades en
intervals de classe. Amplitud dels intervals:
Histograma:
Simètric
Esbiaixat a la dreta
Esbiaixat a l’esquerra
Bimodal
Acumulat
ESTADÍSTICS DE DADES NUMÈRIQUES
La descripció quantitativa d’un conjunt de dades numèriques es realitza mitjançant els
estadístics.
Estadístics de dispersió: mitjana, mediana, moda, percentils, quartils...
Estadístics de posició: amplitud, amplitud interquartílica, variància,
desviació, coeficient de variació...
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga Estadística R comandar y más Monografías, Ensayos en PDF de Estadística solo en Docsity!

VARIABLES

-Numèriques:

  • DISCRETES: Nombre de… P ex: Nombre de vegades que llancem una pilota.
  • CONTÍNUES: Amb decimals. P ex: Distància.
  • MIXTES: És contínua excepte en un conjunt petit de punts on és discreta. P ex: Quantitat de pluja recollida en un observatori per dia… -Categòriques o qualitatives:
  • ORDINALS: Classificació. P ex: Classificació lliga futbol.
  • BINÀRIES. P ex: Aprovat o suspès.
  • NOMINAL. P ex: Color dels ulls. Poden ser:
  • Nominals: categories entre les que no es poden establir relacions d’ordre.
  • Ordinals: categories que poden ser ordenades segons la seva magnitud.

DESCRIPTIVA UNIVARIANTS

TABULACIÓ QUALITATIVES

  1. Diagrama de sectors
  2. (^) Diagrama de barres TABULACIÓ NUMÈRIQUES Moltes vegades no té sentit fer una taula valor per valor. Cal agrupar les dades en intervals de classe. Amplitud dels intervals:
  • Histograma:
  • Simètric
  • Esbiaixat a la dreta
  • Esbiaixat a l’esquerra
  • Bimodal
  • Acumulat ESTADÍSTICS DE DADES NUMÈRIQUES La descripció quantitativa d’un conjunt de dades numèriques es realitza mitjançant els estadístics.
  • Estadístics de dispersió: mitjana, mediana, moda, percentils, quartils...
  • Estadístics de posició: amplitud, amplitud interquartílica, variància, desviació, coeficient de variació...

DESCRIPTIVA BIVARIANTS

■ 2 variables categòriques:

  • Taules de contingència de freqüències absolutes/relatives
  • Diagrama de barres
  • Mosaic plot
  • Gràfic de perfils ■ 2 variables numèriques:
  • Diagrama de dispersió
  • Coeficient de correlació ■ Una categòrica i una numèrica:
  • Diagrama de caixa múltiple
  • Gràfic de mitjanes i desviacions
  • (^) Gràfics de violí
  • Descriptiva numèrica per grups

DESCRIPTIVA MULTIVARIANTS Poden ser:

  • Homogènies – són la juxtaposició de variables del mateix tipus. P ex: Nivells de contaminació per diferents substàncies químiques.
  • Heterogènies – són la juxtaposició de variables de diferents tipus. P ex: Caracterització d’un estany (pH, conductivitat, presència d’una determinada espècie, nivell de contaminació...).
  • Composicionals – són variables multivariants les components dels quals es caracteritzen per tenir suma constant, donat que recullen la participació relativa que cada component té dins el total. P ex: Composició d’un contaminant, composició d’un sòl o de pòl·lens d’un territori, composició dels tipus de residus...

Representació gràfica:

  • Gràfica de coordenades paral·leles
  • Gràfica de teranyina o estrella
  • Ajuda: ajuda sobre R-commander i petit manual d’iniciació en R-commander.

Procediments

  • Importació de dades: Dades Importar dades Des d’una taula de dades d’Excel, Acces o dBase...
  • Podem visualitzar les dades mitjançant el botó Visualitza la taula de dades.
  • Per obtenir una nova variable a partir d’altres:
  • Per crear una nova variable factor (tipus d’aigua) on s’agrupin els casos en funció de la seva conductivitat: aigües dolces (fins a 5, incloent el 5); aigües salobroses (de 5 a 20, incloent el 20) i aigües salades (més de 20): Dades Recodifica variables
  • Importar dades a través de portapapers : Seleccioneu-ho i copieu-ho al portapapers (CTLR+C): Dades Importar dades des d’un fitxer de text, portapapers o URL. Marcar: Portapapers, Tabuladors, Punt.
  • Per obtenir la mitjana de precipitació escrivint a la finestra d’instruccions la comanda mean sobre la taula de dades contaminació i, en concret, la variable precp: mean(contaminacio$precp) i premem executar.
  • Si volem guardar els gràfics que hàgim fet, cal fer-ho prèviament un a un o copiar-los i enganxar-los en un document tipus word o odt.

Descriptiva univariant

  • Per fer una tabulació de dades farem una taula de freqüències : Estadístics-> Resums-> Distribucions de freqüències-> Triar variable (p.ex: tipus d’aigua).

Per fer una representació gràfica : executar windows() a la consola i després marcar Gràfics-> Gràfic de barres-> Triem variable-> Opcions-> Podem canviar el nom als eixos X i Y.

  • Per a visualitzar un diagrama de barres més elaborat. Ho farem accedint a les opcions d’Ajuda del menú per tal de conèixer i modificar les opcions per defecte. A la finestra d’ajuda que ens obre R hi trobem les opcions del gràfic de barres: (us poden sortir diferents ajudes segons la versió)
  • Per analitzar una variable numèrica : Estadístics Resums Resums numèrics...
  • En histogrames per triar intervals de classe: podem modificar la comanda que acabem d’executar per a fer un histograma a la finestra d’instruccions, on el text breaks="Sturges" el reemplaçaríem, per exemple, per breaks=seq (0,36,length=7), on, amb aquesta comanda, marquem 7 punts a l’interval (0, 36), inclosos el punt inicial i el final, quedant-nos 6 intervals: de 0 a 6, de 6 a 12, de 12 a 18... Per tal de comparar els dos histogrames executarem windows() a la consola i, a continuació, executarem la comada que ens dibuixa l’histograma canviat.
  • Vegem un altre gràfic complementari, i habitualment més informatiu: Gràfics Caixa de dispersió... Podem activar l’opció d’identificar els valors atípics.

Vegem un altre gràfic que es pot usar quan tenim poques dades. Gràfics Gràfic de tiges i fulles... A la finestra de Resultats surt un gràfic de caràcters, on ens representa les dades. A l’inici ens diu que separa les dades en desenes (tiges) i unitats (fulles). Així 1| 2 representa 12. A més com que tenim 36 dades, ens separa les desenes en dues parts, els valors baixos de la desena (marcant el valor de la desena amb ) i els valors alts de la desena (marcant el valor de la desena amb .). Així la primera línia (0) ens dóna els valors del 0 al 4, la segona (0.) del 5 al 9... Els valors de l’inici de cada filera ens diu quina freqüència porta acumulada des de cada extrem del diagrama. La filera que té el valor entre parèntesi ens indica que en aquella filera es troba la mediana.

  • Gràfics->Diagrama de dispersió-> Opcions-> Deixem desactivades les opcions caixa de dispersió, línia de mínims quadrats i línia suavitzada.
  • Podem fer tots els gràfics de dispersió dos a dos en un sol gràfic a través del menú: Gràfics Matriu de diagrames de dispersió... on escollirem les variables que ens interessin amb ajuda de la tecla Ctrl o Majúsc. Ens donaria tots els gràfics dos a dos.
    • Per tal de millorar la correlació entre dues variables, és necessari aplicar alguna transformació , per definir una nova variable. Dades-> Modifica variables-> Calcula una nova variable …

El model Binomial (v.a. discreta)

  • Per a obtenir les probabilitats : Distribucions-> Distr. Discretes-> Distr. Binomial-> Traça una distribució binomial... Suposem que tenim un problema de model Binomial on se’ns informa que els paràmetres són n=10 (nombre d’assaigs binomials) i F 07 0 =0.7 (probabilitat d’èxit). NOTA : Cada vegada que vulguem el gràfic en una finestra nova haureu d’anar a la finestra d’instruccions escriure windows() i executar-ho. Si no, el gràfic nou es sobre-escriurà en la finestra gràfica activa.
  • Si volem veure les probabilitats P(X=k) deixem activada l’opció Gràfic de la funció de probabilitat.
  • Si volem veure les probabilitats acumulades P(X≤k): activem l’opció Gràfic de la funció de distribució.
  • Si ens demanen el càlcul de probabilitats acumulades: Distribucions Distr. discretes Distr. Binomial Probabilitats binomials acumulades.
  • Si ens demanen que calculem la probabilitat de tenir més de 8 èxits, ens estan demanant la probabilitat de P(X>8)-> canviar l’opció a Cua a la dreta.
  • Finalment hem de respondre a la qüestió relativa a quin nombre d’èxits tindré acumulada el 80% de la probabilitat, és a l’inrevés del que hem fet fins ara-> (X valor )=0.80. Ens donen una probabilitat acumulada i ens demanen a quin valor obtenim aquesta probabilitat acumulada. Un valor que hi tinc acumulat un

p% de probabilitat-> quartil o percentil p. Distribucions-> Distr. Discretes-> Distr. Binomial-> Quantils binomials (acumulem per l’esquerra-> Cua a l’esquerra: fins a un 80% de la probabilitat ). NOTA : Amb R-Commander podem fer tots aquests càlculs amb la majoria de models de probabilitat. Ara bé, quan el model és de variable aleatòria contínua , com els models normal o exponencial, no hi ha el menú que calcula una probabilitat puntual ja que P(X=k)=0. La resta de menús (quantils, probabilitats acumulades, traça i mostra) es mantenen.