Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Tipi di dati e strutture in R: vettori, matrici, array, data frame, liste - Prof. Durio, Appunti di Elementi di Informatica

Una panoramica sui vari tipi di dati e strutture utilizzate in r, tra cui vettori, matrici, array, data frame e liste. Viene inoltre illustrata la sintassi per creare, estrarre e manipolare queste strutture. Per ogni tipo di dato si spiega il suo significato, come si rappresentano gli elementi e quali comandi utilizzare per interagire con essi.

Tipologia: Appunti

2019/2020

Caricato il 30/01/2020

GretaTorricelli
GretaTorricelli 🇮🇹

4.7

(13)

17 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Per sapere che tipo di dato è si usa la funzione typeof(..) oppure is.double(..).
Double
Sono tutti i numeri reali anche decimali (il separatore decimale è il punto).
Character
Uno o più caratteri tra virgolette, come ad esempio una lettera. Anche un numero, se messo tra virgolette ("1") è un
character. Ovunque ci sono delle virgolette, l'oggetto è di tipo character.
Logical
Assume sempre due valori (TRUE, FALSE) e sono il risultato di operazioni logiche come ad esempio i simboli > >=
< <= oppure == (ossia uguale) e != (ossia non uguale). Se x è falso allora !=x (non uguale a x, non falso) è TRUE.
Altri simboli particolari sono & che è TRUE se entrambi gli oggetti sono TRUE, ma anche | che è TRUE quando
almeno uno dei due è TRUE.
Integer
Si usa per i numeri naturali, ossia i numeri interi e positivi. Operazioni tra integer e double restituiscono sempre
oggetti di tipo double.
Factor
Sono delle variabili che assumono valori diversi e appartengono a una categoria. Ciascun valore di un factor è
chiamato livello. Ad esempio la variabile sesso può assumere due soli valori M e F che sono anche i livelli del factor
stesso.
Per trasformare un oggetto (double o integer) in factor si usa as.factor.
Dati mancanti e infinito
NA può comparire tra gli elementi di un oggetto e per vedere se ci sono NA si usa la funzione is.na(...). Dove c'è
TRUE è presente un NA.
Infinito si indica con Inf oppure -Inf e si trova con la funzione is.infinite (...).
Tra le strutture di dati abbiamo i vettori, le matrici, gli array, i data frame e le liste.
Vettori
È un insieme di oggetti tutti dello stesso tipo definito mediante il comando c(..). Dentro c(...) i valori devono essere
tutti dello stesso tipo (es. tutti integer).
Per sapere quanti elementi ci sono si usa lenght(...)
Per estrarre elementi si usano sempre le parentesi quadre [ ] e si possono estrarre:
• un elemento preciso
• più elementi es. [1:3]
• più elementi precisi [c(1,3,6)]
• l'ultimo elemento [lenght(x)]
• elementi con condizioni es. x>50
• tutti gli elementi tranne... : si usa il meno -
Altri comandi per generare un vettore sono il simbolo :, il comando seq(from=.., to=..., by=...) e il comando
rep(... : ..., ...) che replica per un tot di volte.
Il prodotto vettoriale tra vettori si definisce con %*%.
Matrici
Sono vettori a due dimensioni e con un indice per la riga e uno per la colonna. Tutti gli elementi devono essere dello
stesso tipo e si usano diversi comandi:
pf2

Anteprima parziale del testo

Scarica Tipi di dati e strutture in R: vettori, matrici, array, data frame, liste - Prof. Durio e più Appunti in PDF di Elementi di Informatica solo su Docsity!

Per sapere che tipo di dato è si usa la funzione typeof(..) oppure is.double(..).

Double

Sono tutti i numeri reali anche decimali (il separatore decimale è il punto). Character Uno o più caratteri tra virgolette, come ad esempio una lettera. Anche un numero, se messo tra virgolette ("1") è un character. Ovunque ci sono delle virgolette, l'oggetto è di tipo character. Logical Assume sempre due valori (TRUE, FALSE) e sono il risultato di operazioni logiche come ad esempio i simboli > >= < <= oppure == (ossia uguale) e != (ossia non uguale). Se x è falso allora !=x (non uguale a x, non falso) è TRUE. Altri simboli particolari sono & che è TRUE se entrambi gli oggetti sono TRUE, ma anche | che è TRUE quando almeno uno dei due è TRUE. Integer Si usa per i numeri naturali, ossia i numeri interi e positivi. Operazioni tra integer e double restituiscono sempre oggetti di tipo double. Factor Sono delle variabili che assumono valori diversi e appartengono a una categoria. Ciascun valore di un factor è chiamato livello. Ad esempio la variabile sesso può assumere due soli valori M e F che sono anche i livelli del factor stesso. Per trasformare un oggetto (double o integer) in factor si usa as.factor. Dati mancanti e infinito NA può comparire tra gli elementi di un oggetto e per vedere se ci sono NA si usa la funzione is.na(...). Dove c'è TRUE è presente un NA. Infinito si indica con Inf oppure -Inf e si trova con la funzione is.infinite (...). Tra le strutture di dati abbiamo i vettori, le matrici, gli array, i data frame e le liste. Vettori È un insieme di oggetti tutti dello stesso tipo definito mediante il comando c(..). Dentro c(...) i valori devono essere tutti dello stesso tipo (es. tutti integer). Per sapere quanti elementi ci sono si usa lenght(...) Per estrarre elementi si usano sempre le parentesi quadre [ ] e si possono estrarre:

  • un elemento preciso
  • più elementi es. [1:3]
  • più elementi precisi [c(1,3,6)]
  • l'ultimo elemento [lenght(x)]
  • elementi con condizioni es. x>
  • tutti gli elementi tranne... : si usa il meno - Altri comandi per generare un vettore sono il simbolo :, il comando seq(from=.., to=..., by=...) e il comando rep(... : ..., ...) che replica per un tot di volte. Il prodotto vettoriale tra vettori si definisce con %*%. Matrici Sono vettori a due dimensioni e con un indice per la riga e uno per la colonna. Tutti gli elementi devono essere dello stesso tipo e si usano diversi comandi:
  • matrix (elementi, nrow, ncol, byrow=T/F)
  • cbind () o rbind () ordinando per colonna o per riga due o più vettori/matrici -dim() applicato a un vettore (es. vettore di lettere) Gli elementi si estraggono mediante parentesi quadre [], con dim che restituisce numero di righe e colonne e con nrow() e ncol() che danno numero di righe e numero di colonne. La matrice va messa prima delle parentesi Le matrici si possono moltiplicare anche per un vettore. La funzione diag (...) restituisce il vettore diagonale della matrice mentre t(...) inverte righe e colonne Array Sono le matrici a più dimensioni. Un esempio è: >array(0, dim=c(2,4,3)) in cui gli elementi sono pari a 0, le righe sono 2, le colonne sono 4 e la dimensione è 3. Data Frame A differenza delle matrici, i dati possono essere di differenti tipi (es. una colonna di integer, una colonna di double ecc.). I nomi delle colonne si ottengono con names() e si possono rinominare sempre con names() usando un vettore. Es. names(miodf2)<- c("Trasporti", "Persone"). Per estrarre elementi da un data frame si usa $, le parentesi quadre [] indicando per esempio tutte le righe (spazio vuoto) e la prima colonna ( [,1] ) oppure con il comando attach () e detach () successivamente. Liste A differenza dei vettori, gli oggetti della lista possono essere di tipo e struttura diversi. Prima si definiscono gli oggetti e poi si inseriscono nella lista con il loro relativo nome. Es. mialista<-list(Numeri=x1, Dispari=x2). Con names() otteniamo i nomi degli oggetti (numeri e dispari). Gli elementi si estraggono con $, con le parentesi quadre [ ] (ottenendo una lista) e con le doppie parentesi quadre [[ ]] ottenendo un vettore.