Da Harris ai Large Language Models | Sintesi del corso di Linguistica

LIBRO

CAPITOLO 2 = HARRIS E CHOMSKY

Alla fine degli anni Cinquanta, Noam Chomsky pubblicò un libro destinato a cambiare per sempre la

linguistica: Syntactic Structures (1957). Egli propose una nuova teoria detta Grammatica generativo-

trasformazionale (GGT) ed ebbe il merito di rendere la linguistica una disciplina scientifica vera e propria.

Il successo della GGT oscurò rapidamente le teorie precedenti, in particolare quelle degli strutturalisti e dei

comportamentisti, che vennero etichettati da Chomsky come semplici catalogatori meccanici (taxonomic

linguists). Questi approcci si concentravano sulla classificazione sistematica dei dati linguistici, ma

ignoravano i processi mentali sottostanti. Al contrario, Chomsky proponeva un modello che cercava di

spiegare come la mente umana genera e comprende il linguaggio.

Uno dei principali critici di Chomsky fu Maurice Gross, il quale studiò a fondo il lessico del francese e si

rese conto che il modello generativista, pur ambizioso, non riusciva a descrivere la lingua reale: analizzando

migliaia di verbi francesi, notò che le irregolarità superavano di gran lunga le regolarità, e che il

comportamento sintattico di un verbo dipendeva in modo cruciale dalle sue proprietà lessicali.

Questa osservazione portò Gross a riavvicinarsi alle teorie di Zellig Harris, che fu uno dei maestri di Chomsky

e la sua influenza sulla nascita della GGT è ben documentata. Chomsky stesso ha ammesso di aver preso da

Harris i concetti di trasformazione e frase kernel.

In sostanza, le differenze tra Harris e Chomsky sono legate soprattutto agli scopi delle loro teorie: descrittivi

per Harris, che voleva descrivere il linguaggio, cioè analizzare le strutture linguistiche così come appaiono,

ed esplicativi (e innatisti) per Chomsky, che, invece, voleva spiegare come il linguaggio è appreso e prodotto

dalla mente. Tuttavia, entrambi riconoscono l’importanza di partire da frasi semplici per generare strutture più

complesse.

A differenza dei generativisti, sia Harris che Gross si mostrarono fin dagli anni Cinquanta interessati all’uso

dei computer per l’analisi linguistica. Gross, seguendo le idee di Harris, sviluppò la metodologia lessico-

grammaticale, che consiste nello studio sistematico delle proprietà sintattiche e semantiche dei verbi. Il suo

lavoro fu fondamentale per i primi sviluppi della linguistica computazionale, perché cercò di formalizzare una

grande quantità di dati linguistici in modo trattabile dai calcolatori.

CAPITOLO 3 = ANALISI DISTRIBUZIONALE E ANALISI TRASFORMAZIONALE

3.1. ANALISI DISTRIBUZIONALE

Nel 1954 Harris formulò un’ipotesi molto importante, chiamata Ipotesi distribuzionale: se due parole si

trovano in contesti molto simili, probabilmente hanno significati simili. Se invece compaiono in contesti

diversi, avranno anche significati diversi. Per esempio, Harris paragona i termini oculist e eye-doctor

(entrambi indicano lo stesso tipo di medico): poiché possono apparire negli stessi tipi di frasi, possono essere

considerati sinonimi. Al contrario, oculist e lawyer appaiono in contesti molto diversi, quindi hanno significati

diversi.

Ma Harris non si limitò a proporre questa ipotesi: descrisse anche un vero e proprio metodo per identificarne

le basi, che prende il nome di analisi distribuzionale e ha l’obiettivo di raggruppare le parole in classi di

sostituzione (o classi di equivalenza), cioè gruppi di parole che possono essere scambiate tra loro in contesti

simili.

Questa analisi si basa su cinque concetti chiave:

• Elementi: il linguaggio può essere scomposto in elementi più piccoli (parole, morfemi, ecc.). Questa

divisione rende possibile trovare regolarità nel modo in cui questi elementi si combinano.

Da Harris ai Large Language Models, Sintesi del corso di Linguistica

Documenti correlati

Anteprima parziale del testo

Scarica Da Harris ai Large Language Models e più Sintesi del corso in PDF di Linguistica solo su Docsity!

LIBRO

CAPITOLO 2 = HARRIS E CHOMSKY

5.1. I MODELLI PREDITTIVI E QUELLI CONTESTUALIZZATI

Statistiche vs Regole

Logica e Ontologie

Question Answering: Il progetto BIG.4.M.A.S.S.

LETTURE

To Build Truly Intelligent Machines, Teach Them Cause and

Effect

WordNet