LA LINGUISTICA COMPUTAZIONALE

● è una branca della linguistica

QUINDI l’idea è che esiste una regolarità nella lingua QUINDI non parliamo a caso

○ lavora con la lingua utilizzando le capacità computazionali di un computer

○ progetta un’interazione tra macchine - computer - linguaggio umano

○ obiettivo: sviluppare modelli computazionali della lingua

■ capire i significati

■ creare linguaggio naturale (Siri)

■ tradurre automaticamente

■ analizzare / generare testi

● “computare” = calcolare

→ secondo Leibniz durante una controversia non si deve discutere MA sedersi e dirsi "calculemus"

QUINDI ottenere una sola risposta attraverso una serie di passaggi

QUINDI possiamo creare modelli formali computabili del linguaggio

● “computazionale” richiama le discipline che usano

○ la capacità di calcolo dei computer

○ gli strumenti e metodologie dell’informatica

● Chat GPT: esempio di applicazione della linguistica computazionale

○ grande modello linguistico sviluppato da Open AI

○ è un chatbot che permette di conversare con un programma

QUINDI è addestrata con uno scopo preciso

○ migliore in inglese MA ANCHE altre lingue

○ dibattito etico

■ innumerevoli vantaggi (es. text summarization)

■ svantaggi (usi sbagliati nelle scuole / pericolosi / errori possibili / pregiudizi)

Il modello linguistico computazionale

● modello di AI capace di rappresentare la conoscenza il funzionamento del linguaggio

○ schematizza e replica le interazioni* basate sul linguaggio naturale umano

○ si basa su regole linguistiche / statistiche / machine learning

○ è una lista di istruzioni per il computer

PER renderlo capace di interagire con / attraverso il linguaggio naturale

● “modello” = rappresentazione concettuale astratta e semplificata di un fenomeno PER

○ spiegare un fenomeno

○ fare previsioni su un fenomeno

○ generare nuovi dati “ben formati”

MA per essere utilizzabile deve saper generalizzare

QUINDI a partire da casi particolari deve saper estrarre tendenze

→ ogni modello comporta una riduzione dell’informazione

● 2 tipi di modelli

FORMALI (es. modello matematico

epidemiologico)

INFORMALI (es. modello di Jakobson)

= insieme finito di simboli e regole di combinazione

che definiscono la sintassi del modello stesso

● interpretabili indipendentemente dal

contesto

● utilizzabili dalle macchine

● sono descrizioni rigorose / matematiche /

precise di un fenomeno

● utilizza calcoli, logica, algebra, statistica

● espressi in linguaggio naturale / attraverso

segni interpretabili

● dipendono dal contesto per essere

interpretati da un lettore umano

● lavorano in modo più qualitativo / descrittivo

/ teorico

N.B. anche la grammatica può essere pensata come modello

○ = insieme di regole che semplificano il dato linguistico

○ può essere un modello

■ informale (es. un libro di grammatica)

■ formale = che descrive la sintassi di una lingua con regole precise

● * diversi livelli di interazione tra uomo e macchina

Linguistica Computazionale, Appunti di Linguistica

Documenti correlati

Anteprima parziale del testo

Scarica Linguistica Computazionale e più Appunti in PDF di Linguistica solo su Docsity!

LA LINGUISTICA COMPUTAZIONALE

Il modello linguistico computazionale

NLP (Natural Language Processing)

L’intelligenza artificiale (AI)

COS’È UN CORPUS E COME SI CLASSIFICA

TESTO E COMPUTER

Quali sono gli standard?

Per cosa si usano le regex?

ESPLORARE I CORPORA

LA LEGGE DI ZIPF

log f (z) = log C - a log z

3. identificazione automatica della terminologia tecnica

ANNOTAZIONE LINGUISTICA

*L’annotazione morfosintattica

Universal dependencies

Feature engineering

Training del modello

○ F1:

Il POS tagging (task dell’NLP)

IDENTIFICAZIONE DELLE ENTITÀ NOMINATE - Named Entity Recognition (NER)

● Named Entity Linking (disambiguation)