




Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Le caratteristiche del linguaggio di programmazione Python, tra cui la semplicità nella manipolazione dei dati e l'utilità per il machine learning. Vengono descritte le istruzioni di selezione, i cicli iterativi, le stringhe e le liste, con vantaggi e svantaggi. Viene inoltre presentata la libreria Matplotlib per la creazione di grafici e la libreria Pandas per il trattamento dei dati in formato tabulare. Il documento può essere utile come appunti per un corso di programmazione.
Tipologia: Appunti
1 / 8
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





Python (gruppo comico inglese) è un linguaggio di scripting interpretato , quindi come su java è necessario l'interprete ovvero la virtual machine. Può essere procedurale o a oggetti. Il suo vantaggio sta nell'essere un linguaggio semplice soprattutto per la manipolazione dei dati, tramite alcune sue utility, fondamentale per il machine learning. Alcune caratteristiche: ● Case sensitive: maiuscola o minuscola cambia ● Debolmente tipizzato (come PHP) ● L'indentazione definisce i blocchi di codice perché non si usano le parentesi graffe ● Non serve il ; '''…''' commenta un blocco di codice #commenta una riga di codice
Output: print("") gli argomenti vengono separati dalla virgola Per non andare a capo bisogna scrivere end="" Input:
if
While
La stringa viene trattata come se fosse un vettore. E’ quindi un oggetto iterabile e alla quale si possono applicare una serie di funzione tra cui lo slicing. Le stringhe però non sono modificabili. Per iterare all'interno di una stringa possiamo fare in due modi: o con un cilo for normnale con un contatore oppure nel seguente modo: For
Le liste sono delle collection modificabili di dati diversi For i in lista: Print (i) Te la naviga cella per cella come se fosse un vettore. If item in lista: se lo trova vero se non lo trova falso Vantaggi e svantaggi: Maggiore agevolezza di manipolazioni di dati (come tabella in un database) però con i big data questo approccio risulta particolarmente lento perché l'allocazione di memoria interna è molto complessa (legata all'aritmetica dei puntatori), e i dati vanno maneggiati con attenzione controllando i tipi. La concatenazione delle liste avviene con l'operatore += Possiamo intervenire all'interno della lista per modificarne dei pezzi Esempio: Lista[2:4]=[
La varianza [media degli scarti quadratici(valore-media)^2] e la deviazione standard [radice della varianza] sono due concetti matematici-statistici che servono a misurare gli spostamenti e le differenze tra dei valori e un valore medio. Dato un insieme di dati, che chiameremo dataset, possiamo facilmente calcolare la media, un indicatore importante ma non è sufficiente. La varianza ci dice quanto i valori di questo dataset si discostano da questo valore, ovvero andiamo a vedere la distribuzione dei valori. Tramite l’analisi della distribuzione possiamo comprendere il rendimento. esempio: dataset1: 6,6, dataset2: 2,7, nonostante questi due dataset abbiano una media uguale, il loro rendimento e quindi la varianza e deviazione standard è diversa. Tramite questa libreria possiamo avere la creazione di matrici e vettori a n dimensioni. esempio: v2= np.array([[1,2,3,0], [4,5,6,0], [7,8,9,0]]) ogni vettore n dimensionale possiede delle caratteristiche: ● dimension : quindi quante dimensioni (esempio: la matrice ha due dimensioni) ● shape : come sono disposte le celle, ovvero il numero di elementi per ogni dimensione (esempio: matrice 3x4 ovvero 3 righe e 4 colonne) ● axis : ovvero gli assi (axis= 0: accede riga per riga, axis= 1 accede colonna per colonna) accedendo quindi riga per riga vuol dire che naviga il primo elemento di ogni riga, poi il secondo elemento di ogni riga e così via. Come risultato avremo di fatto una colonna. ○ matrice => sum(axis=0), somma per colonna, sum (axis=1) somma per riga ○ 3 dimensioni => sum(axis=0), somma per profondità, sum (axis=1) somma per colonna, sum (axis=2) somma per riga Il metodo arange ci permette invece di creare automaticamente degli array con numeri in un determinato intervallo: esempio v=np.arange(start, stop, step) come se fosse un for Possiamo poi cambiare dinamicamente il formato del nostro vettore con il metodo reshape, dandogli come parametro la nuova struttura. La dimensione rimane uguale, ma la shape cambia. Se il numero di elementi non corrisponde con la nuova shape ci dà errore: esempio m=np.reshape(m, (r,c))
Un altro metodo importante è concatenate, che permette di concatenare insieme più vettori in base all’asse che gli diamo come parametro: esempio: v= np.concatenate((v1,v2)) viene fuori un vettore più lungo con la somma dei due vettori m= np.concatenate((m1,m2), axis=0) aggiunge la matrice sotto m= np.concatenate((m1,m2), axis=1) aggiunge la matrice accanto Anche con i vettori è possibile fare lo slicing, in particolare possiamo fare un doppio slicing: v[sulle righe, sulle colonne] Un ultimo metodo importante è lo split, ovvero un metodo che ci permette di dividere in due vettori o matrici uguali il nostro vettore iniziale, come parametro ha il vettore iniziale e il numero di vettori che ne devono uscire fuori. esempio: v2=np.array_split((v1,2)) splitta il v1 in 2 parti uguali (primo array v2[0], secondo array v2[1])
libreria per python che ci permette di fare i grafici di vari tipi: matplotlib import matplotlib.pyplot as plt creare una linea tra i due punti, con il metodo show ci viene mostrato il grafico plt.plot([2,3],[8,9]) a destra le x ed a sinistra le y plt.show() con .xlim() e .ylim() ci fa vedere una scala in base ai valori che mettiamo per marcare i punti si mette un terzo parametro con il carattere che dobbiamo mettere come punto plt.plot(x,y, '')* , oppure marker=’’ per gli altri parametri particolari: linestyle=”dashed” color=”r” rosso spessore: linewidth=”10” invece di scrivere tutte queste cose si può compattare con la soluzione fmt marker|line|color => ‘o:dotted:r’
Sono presenti alcune proprietà per navigare il dataframe, e alcuni metodi utili tra cui: ● .describe() : ci dà tutte la caratteristiche del dataframe a livello numerico e statistico ● .info() : ci dà informazioni generali ● .head(
grupby([(‘colonna’)])robe da fare