




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Un'introduzione alla programmazione in r, coprendo concetti fondamentali come le operazioni aritmetiche di base, la definizione e l'utilizzo di variabili, e l'applicazione di funzioni predefinite. Esempi pratici per comprendere come eseguire calcoli, manipolare dati e utilizzare funzioni per automatizzare compiti ripetitivi.
Tipologia: Dispense
1 / 233
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































Indice
Introduzione i
Perché R iii Perché r...................................... iv R vs excel.................................. iv Vantaggi di R................................ iv Gli script in R............................... iv Riproducibilità............................... v R vs Python................................ v Approccio pragmatico........................... v
1 Primi passi con R 3 Primi passi con R................................. 4 Scaricare R................................. 4 Usare R come una calcolatrice...................... 4 Assegnazione di variabili......................... 5 Guide di stile................................ 7 Help.................................... 8 Risorse................................... 8 Lo spazio di lavoro............................. 8
2 Le strutture di dati 9 Le strutture di dati................................ 10 Vettori................................... 10 La funzione c().............................. 10 Coercizione implicita............................ 11 NA - valori mancanti........................... 13 Matrici................................... 13 Fattori................................... 15 Le liste................................... 16 Data frame................................. 16 Riferimenti................................. 17
3 Filtri/subsetting 19 Filtri ed estrazione................................ 20
- Estrazione - Usare la sintassi sql - Which - Riferimentiii INTRODUZIONE
Perché R
iii
PERCHÉ R v
È molto più facile riprodurre analisi anche complesse. Questo ha almeno due vantaggi:
Riferimenti
Se excel non è la soluzione migliore per fare analisi dei dati, R non è l’unico ambiente disponibile. Fra le alternative, una delle più accreditate è il linguaggio di programma- zione python, integrato con alcuni pacchetti quali pandas e numpy.
Il dibattito Python vs R è molto acceso, in quanto entrambi i linguaggi costituiscono un’ottima scelta.
L’opinione più condivisa è che nella statistica inferenziale, R batte Python. Nella ma- nipolazione dei dati i due ambienti se la cavano altrettanto bene. Python ha il van- taggio di essere un linguaggio di programmazione all purpose, mentre R è molto più specializzato all’analisi dei dati.
Generalmente, l’approccio più utile è quello di conoscere diversi strumenti, ed utiliz- zarli per fare cose diverse.
vi PERCHÉ R
Excel, libreoffice o i fogli google per le operazioni più semplici, soprattutto se si deve collaborare con persone che non usano R.
Gli editor di testo possono essere molto utili per pulire file in formato tsv o csv.
Soprattutto in ambiente linux, vi sono programmi a linea di comando che permettono di fare semplici manipolazioni di dati.
Per le analisi più complesse, e per le presentazioni professionali, usare R o python.
Capitolo 1
Primi passi con R
# divisione intera 23 %/% 3
# modulo (il resto della divisione) 23 %% 3
# elevazione a potenza 2^
3^2 + (7-2)*
La creazione di una variabile avviene attraverso la sintassi <-. In R non è neces- sario definire il tipo di variabile. Attraverso l’assegnazione, sarà R a creare un tipo opportuno di variabile (o di oggetto).
numero1 <- 5 etichetta1 <- ”Antonio” # le parentesi servono a stampare il risultato a video (numero2 <- 5.12)
numero3 <- 10/ # invocando la variabile ne stampo il valore numero
_# se alla stessa variabile assegno un nuovo valore
numero3 <- 10* numero
# operazioni usando le variabili numero1 * numero
# assign (variabile, valore) equivale a variabile <- valore assign (”numero4”, 7) numero
<- è l’operatore di assegnamento, ed equivale alla funzione assign. Pertanto nu- mero <- 5 è una scorciatoia della funzione assign(”numero”, 5).
La funzione ls() mi permette di elencare tutte le variabili (oggetti) attualmente attivi nel framework.
ls ()
La funzione rm() rimuove un oggetto. Ad esempio, con il comando rm(variabile1) l’oggetto variabile1 sarà cancellato, e non più disponibile.
Operazioni booleane
Le operazioni booleane sono finalizzate a confrontare due elementi. L’output di queste operazioni è di tipo booleano.
Attenzione: per valutare l’uguaglianza fra due elementi si usa ==
quattro <- 4 cinque <- 5 # la variabile quattro è uguale a 4? quattro == 4
cinque == 4
# quattro è minore di cinque? quattro < cinque
# quattro è minore o uguale a 4? quattro <= 4
quattro < 4
# quattro è diverso da cinque? quattro != cinque
giusto = TRUE sbagliato = FALSE # TRUE or FALSE = TRUE giusto | sbagliato