LEZIONI RSTUDIO DATA MINING | Appunti di Analisi Dei Dati

LEZIONI R

Bisogna considerare SOLO R studio. Il software statistico è R. R studio è una comoda interfaccia perché, al

contrario di R, è strutturato in 4 parti. In R, l’unica visualizzazione che abbiamo è la console e cioè il posto

dove scrivo i comandi, che in R studio abbiamo in basso a sinistra. La parte in alto a sinistra è il file di

sintassi. Questo nel progetto sarà l’elemento cruciale e cioè ciò che mentre facciamo le analisi dobbiamo

curare con molta attenzione.

Il file di sintassi è un file che raccoglie tutte le istruzioni che do a R e che vanno a buon fine e cioè che non

producono un errore e che mi servono per fare il lavoro che voglio fare. Questo mi aiuta a conservare le

istruzioni che ho dato a R che non producono un errore e che mi servono per il mio lavoro.

Una buona abitudine è quella di commentare quello che scrivo come riga di comando. Il commento non è

una istruzione.

Per introdurre un commento devo iniziare con un # che sarà di colore verde. A questo punto si può scrivere

il commento. Scrivendo senza # per R non ha nessun senso e mi porterebbe ad un errore.

Il simbolo del Floppy disk è sinonimo di salva.

Nella finestra in alto a destra NON usare import dataset! Bisogna farlo da riga di comando. Anche in questa

parte a destra abbiamo il floppy disk e una cartella con una freccia che esce fuori verde. Questo è apri un

environment.

In basso a destra ci sono 5 sottocartelle. Questa finestra serve per installare i pacchetti, per aggiornarli e

per spuntarli. Appena si spunta un pacchetto compare nel quadrante in basso a sinistra. Ogni volta che

devo utilizzare un pacchetto devo spuntarlo all’inizio di ogni sessione. Faccio così:

1. lo spunto in basso a destra;

2. lo trovo scritto in automatico in basso a sinistra;

3. lo copio e lo incollo in alto a sinistra.

Nella sotto casella Help si hanno i linguaggi di R studio.

Nella sotto casella Plots ci saranno i grafici.

Nella sotto casella Files

La working directory è una directory nella quale dico a R di salvare tutto il lavoro fatto e se devo importare

una base dati deve trovarsi nella cartella. Bisogna dire quale è la cartella di riferimento e si fa così:

Riquadro in basso a destra, attiva sottofinestra Files. Clicca sui 3 puntini a destra e si apre la finestra con la

quale identificare la directory di lavoro. Vai su desktop, cerca la cartella creata Data Mining e fai Open. Per

dire di fare sempre riferimento a questa cartella bisogna andare sulla “ruotina” More e premere Set As

Working Directory. A questo punto comprare una riga di comando con il percorso fatto. Questo va copiato

e incollato nel file di comando. Appena si inizia un lavoro con R bisogna settare la working directory e cioè

ogni volta che si riapre il programma.

Ogni volta che uno passa il file bisogna cambiare la riga di comando.

LEZIONI RSTUDIO DATA MINING, Appunti di Analisi Dei Dati