Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Linguistica Computazionale, Appunti di Linguistica

appunti lezioni anno 2024-2025

Tipologia: Appunti

2023/2024

Caricato il 25/04/2025

sofia-sozzi-3
sofia-sozzi-3 🇮🇹

2 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LINGUISTICA COMPUTAZIONALE
Prof. Francesco Mambrini
Lezione 1 - 27/02/ 2024
Appelli
-Giovedì, 30 Maggio 2024
-Mercoledì, 26 Giugno 2024
-Mercoledì, 10 Luglio 2024
-Giovedì, 05 Settembre 2023
-Giovedì, 19 Settembre 2023
Inizia alle e 30 (martedì)
Registra
Lezione 20/03 è sospesa —> recupero è il 26/03
Prime 2 settimane facciamo introduzione teorica sulla linguistica computazionale, poi capire cos’è un testo per un
computer e che strumenti dà il pc per capire l’informazione testuale, come analizzare il testo, introduzione NLP =
natural language processing (ultima parte del corso)
Libri:
Linguistica computazionale, Elisabetta Jezek: libro obbligatorio (capo 1, 6, 7 + 4, 8 sono facoltativi)
La linguistica computazionale, Malvina Nissim, facoltativo
Testo e Computer, facoltativo
4
Cos’è la linguistica computazionale? Cosa ci viene in mente?
-Informatica
-App Chat GPT (g p transformer= tipo di modello)
oAI
oConcetto di modello linguistico
oNLP
Lezione 2 – 28/02
Chat GPT
“Addestrato”: cos’è un modello addestrato, trained?
“Scopo concreto”: ci aiuta ad ottenere informazioni, è addestrato a rispondere alle domande su una vasta gamma di
argomenti
Vantaggi e benefici: ha generato enorme interesse nel pubblico! Perché? Che aspetti positivi ha una tecnologia del
genere?
oPuò analizzare grandi quantità di dati
oText summarization: sa fare riassunti molto bene e archiviare informazioni
Controversie: ci sono anche polemiche e interrogativi
Modello linguistico: il suo lavoro è mettere frasi una dietro l’altra, imitare uomini che parlano, e lo fa anche bene, è
un modello linguistico in grado di creare il linguaggio, la differenza con il linguaggio umano non si nota! + è in
continuo aggiornamento, se gli fai diverse volte la stessa domanda, lui cambierà risposta
Prodotto da linguistica computazionale che produce linguaggio con pochissime differenze rispetto a quello umano,
è quasi indistinguibile (ex. Film The Imitation Game: esperimento mentale in cui si mettono uomini in una stanza
che devono comunicare attraverso una macchina con persone che si trovano in un’altra stanza)
Scuola: come valutare compiti, tesi etc. se il testo lo può scrivere un pc?
Usi pericolosi: ad esempio bombardare i social con messaggi contro un gruppo politico o sociale, orientati a
inquinare il dibattito pubblico
pf3

Anteprima parziale del testo

Scarica Linguistica Computazionale e più Appunti in PDF di Linguistica solo su Docsity!

LINGUISTICA COMPUTAZIONALE

Prof. Francesco Mambrini

Lezione 1 - 27/02/ 2024 Appelli

- Giovedì, 30 Maggio 2024

- Mercoledì, 26 Giugno 2024

- Mercoledì, 10 Luglio 2024

- Giovedì, 05 Settembre 2023

- Giovedì, 19 Settembre 2023

Inizia alle e 30 (martedì) Registra ❤ Lezione 20/03 è sospesa —> recupero è il 26/ Prime 2 settimane facciamo introduzione teorica sulla linguistica computazionale, poi capire cos’è un testo per un computer e che strumenti dà il pc per capire l’informazione testuale, come analizzare il testo, introduzione NLP = natural language processing (ultima parte del corso) Libri: Linguistica computazionale , Elisabetta Jezek: libro obbligatorio (capo 1, 6, 7 + 4, 8 sono facoltativi) La linguistica computazionale, Malvina Nissim, facoltativo Testo e Computer , facoltativo 4 Cos’è la linguistica computazionale? Cosa ci viene in mente?

- Informatica

- App Chat GPT (g p transformer= tipo di modello)

o AI o Concetto di modello linguistico o NLP Lezione 2 – 28/ Chat GPT  “Addestrato”: cos’è un modello addestrato, trained?  “Scopo concreto”: ci aiuta ad ottenere informazioni, è addestrato a rispondere alle domande su una vasta gamma di argomenti  Vantaggi e benefici: ha generato enorme interesse nel pubblico! Perché? Che aspetti positivi ha una tecnologia del genere? o Può analizzare grandi quantità di dati o Text summarization: sa fare riassunti molto bene e archiviare informazioni  Controversie: ci sono anche polemiche e interrogativi  Modello linguistico: il suo lavoro è mettere frasi una dietro l’altra, imitare uomini che parlano, e lo fa anche bene, è un modello linguistico in grado di creare il linguaggio, la differenza con il linguaggio umano non si nota! + è in continuo aggiornamento, se gli fai diverse volte la stessa domanda, lui cambierà risposta  Prodotto da linguistica computazionale che produce linguaggio con pochissime differenze rispetto a quello umano, è quasi indistinguibile (ex. Film The Imitation Game: esperimento mentale in cui si mettono uomini in una stanza che devono comunicare attraverso una macchina con persone che si trovano in un’altra stanza)  Scuola: come valutare compiti, tesi etc. se il testo lo può scrivere un pc?  Usi pericolosi: ad esempio bombardare i social con messaggi contro un gruppo politico o sociale, orientati a inquinare il dibattito pubblico

 Errori  Pregiudizi: ripulente quello che ha appreso, quindi se la maggioranza dei testi su cui si è addestrato riflettono preconcetti o pregiudizi, chat GPT li ripeterà PARTE 1: Cos’è la linguistica computazionale? Jezek & Sprugnoli: “Computazionale è un termine che evoca i computer. Computare = calcolare, computazionale è il termine usato i per le discipline che usano la capacità di calcolo dei computer e gli strumenti e le metodologie provenienti dall’informatica per svolgere ricerche, eseguire compiti ed effettuare previsioni”  Calcolare: filosofo Laibriz (?). “Quando sorge una controversia non ci sarà necessità di discutere tra due filosofi di quella che c’è tra due calcolatori. Sarà sufficiente prendere una penna, sedersi al tavolo e dirsi l’un l’altro: calcoliamo (calcolemus)” —> un calcolatore fa questo in maniera universale, prende una serie di operazioni, dove il risultato sarà sempre lo stesso, risolve problemi che hanno a che fare con i dati linguistici Nel linguaggio scientifico, un modello è una rappresentazione concettuale astratta e semplificata di un fenomeno. I modelli sono usati per 1) spiegare 2) fare previsioni. Per poter essere utilizzabile un modello deve saper generalizzare, ovvero estrarre tendenze dai casi particolari a partire dai quali è stato costruito che possano spiegare o predire i casi ancora ignoti. Ogni modello comporta una riduzione e, di conseguenza, una semplificazione del fenomeno che vuole rappresentare.

- Circolazione atmosferica dell’aria è un modello astratto, che astrae determinate caratteristiche per spiegare

come mai le nuvole si comportano in un certo modo Modelli sono

  1. Formali

- Espressi in linguaggio formale (numero finito di simboli e di regole di combinazione) ex matematica

- Interpretabili indipendentemente dal contesto

- Possono essere usati dalle macchine

  1. Informali

- Espressi in linguaggio naturale o attraverso segni interpretabili (Ex modello di Jacobson)

Esempi di modelli  Cartina geografica  Modello epidemiologico (formale): calcola evoluzione probabile di una malattia. Formalizzazione matematica di fronte ai processi dell’epidemia  La grammatica è un modello, è una semplificazione della lingua. È sia informale (libro di grammatica) che formali RECAP  Esiste una regolarità nella lingua, non parliamo “a caso”. Non diciamo Il bello libro che ho comprato, ma Il bel libro che ho comprato  Per spiegare questa complessità usiamo modelli (linguistica)  Possiamo creare modelli formali computabili del linguaggio rasi che possano essere usati per computare?  Un modello computazionale può anche fare previsioni e può essere usato per generare nuovi dati ben formati  Il modello linguistico computazionale (formale) è capace di rappresentare la conoscenza linguistica e il funzionamento del linguaggio + può schematizzare e replicare le interazioni basate sul linguaggio naturale umano. Può essere utilizzabile dal computer, integrato in un programma eseguibile, che rende il Po capace di interagire con e attraverso il linguaggio  L’obiettivo della linguistica computazionale è quello di sviluppare modelli computazionali della lingua, cioè modelli del funzionamento del linguaggio naturale che possano essere tradotti in programmi eseguibili dal calcolatore e che gli consentano di acquisire le competenze necessarie per comunicare direttamente nella nostra lingua Il problema è scomponibile in livelli (ex question answering vocale)  Da voce a testo: (ex usare assistente vocale come Siri o Google. Pc decodifica onde sonore in un messaggio che poi andrà ad analizzare) —> riconoscimento e analisi dell’imput vocale, trasformazione in testo e trascrizione  Significato: estrazione dei significati, rappresentazione schematica del contenuto di un enuhnciato  Reperimento informazi one: computer identifica la risposta  Risposta: deve rispedire la risposta, deve formulare una frase e tradurla in impulsi vocali. Il dato viene integrato in una risposta ben formulata nella lingua della comunicazione