Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


linguistica computazionale, Slide di Linguistica

linguistica computazionale e senso parole

Tipologia: Slide

2025/2026

Caricato il 24/05/2026

rey-63
rey-63 🇮🇹

5 documenti

1 / 37

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Comprendere il
senso delle parole
Linguistica Computazionale
Francesco Mambrini
2024/2025
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25

Anteprima parziale del testo

Scarica linguistica computazionale e più Slide in PDF di Linguistica solo su Docsity!

Comprendere il

senso delle parole

Linguistica Computazionale

Francesco Mambrini

pirottino

Che cos’è?

Pirottino s. m. [der., propr. dim., della voce milan. pirotta «mortaio di legno a foggia di scodella», connessa con il lat. pila «mortaio»]. – Involucro di carta oleata, a forma di scodellina con bordi per lo più pieghettati, di diametro variabile da 20 a 115 mm, che serve per contenere pasticcini, cioccolatini, paste e sim. Treccani

semantica

«La parte della linguistica che si occupa del piano del

significato […]. Il primo problema con cui si scontra la

semantica è la definizione stessa di che cosa sia il

significato. Il significato non è ‘visibile’, ed è il punto di

sutura fra la lingua, la mente e il mondo esterno. Lo

studio del significato si situa all'incrocio di linguistica,

filosofia, psicologia e scienze cognitive» (Berruto e Cerruti,

p. 191)

Dizionari digitali 0 1 Codificare il significato in risorse lessicali

Due parole che possono essere usate in modo intercambiabile in una frase, senza che cambino le Sinonimi WordNet Database lessicale dell’Inglese fondato negli anni ‘80. Princeton WN WordNet definisce il senso delle parole raggruppandole in gruppi di sinonimi, chiamati «synset» Synset https://en-word.net/ili/i

11% 19% 33% 20% 18% Bestiale Indignato Preoccupato Triste Divertito Soddisfatto

Depeche Mood++

Il significato annotato può riguardare

anche la connotazione di una parola, il

significato secondario o emotivo di una

parola. Alcuni lessici registrano tale

valore emotivo.

Ad es. Depeche Mood++ assegna ad

ogni entrata lessicale un punteggio che

quantifica la distribuzione di 5 emozioni

di base: indignazione,

preoccupazione, tristezza,

divertimento, soddisfazione. (totale

Qui vedete la distribuzione delle

emozioni attribuite all’aggettivo

« bestiale ».

https://github.com/marcoguerini/DepecheMood

Sentix https://valeriobasile.github.io/twita/sentix.html Altro Lessico che registra la polarità emotiva. Sentix attribuisce una serie di punteggi e un grado di intensità ai sensi delle parole. I sensi sono raggruppati usando i synset di WordNet. Ad es. per «naturale», Sentix distingue 9 sensi, fra cui quello identificato dal synset 00074346 (it. «genuino», «naturale», «non artificioso», «spontaneo»),

L. Wittgenstein (1889-1951) “la parola «significato» si può definire così: Il significato di una parola è il suo uso nel linguaggio.”

Ricerche filosofiche (§43).

«Secondo» Wittgenstein: teoria dei giochi linguistici.

J.R. Firth (1890-1960) Il significato di una parola può essere conosciuto a partire dai contesti in cui è usata, ovvero dalle altre parole con cui si accompagna (“You shall know a word by the company it keeps”,

Firth 1957).

Quanto sono simili due parole? Quanto sono vicine o distanti in questo spazio? Distanze Uno spazio semantico Immaginiamo le parole come punti su una mappa dei significati Punti nello spazio Le parole sono definite da coordinate che esprimono la loro collocazione Coordinate

Parole nello «spazio» dei testi battle is "the kind of word that occurs in Julius Caesar and Henry V" fool is "the kind of word that occurs in comedies, especially Twelfth Night" Slide from Jurafsky and Martin, companion slides to the 6th^ chapter of Speech and Language Processing (3rd ed. draft)

Le coordinate sono le co-occorrenze delle parole in una finestra di contesto! Slide from Jurafsky and Martin, companion slides to the 6th^ chapter of Speech and Language Processing (3rd ed. draft) Sfruttiamo l’ipotesi distribuzionale

Spazi e distanze