Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


LINGUISTICA COMPUTAZIONALE (Mambrini), Appunti di Linguistica

appunti di linguistica computazionale presi a lezione, potrebbero tornavi utili

Tipologia: Appunti

2023/2024

Caricato il 24/09/2024

andrea-di-bella-1
andrea-di-bella-1 🇮🇹

17 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Quale settore della vita pubblica e sociale ha dato sviluppo all’interazione con documenti scritti in
linguaggio naturale? È stato l’ambito della difesa militare. Turing si occupa di decifrazione
dell’esercito tedesco. La necessità di trattare per l’Intelligence, il linguaggio non molto semplice ha
permesso lo sviluppo dell’intelligenza artificiale. Busa si è trovato ad affrontare problemi che diamo
per scontati ad esempio cosa voglia dire interagire con un computer nell’ispezione di dati. Lui
studiava Tommaso D’Acquino. Se voglio digitalizzare un testo e ci viene trasmesso, ci aspettiamo
che sia identico a quello del trasmittente. Noi scarichiamo un documento e tecnicamente vedremo
quello che vede pure il destinatario.
Top down
Bottom up
Addestrarsi significa anche imparare le probabilità
Certi tipi di regole possono servire a contribuire a lavorare sul cuore della macchina, anche se c’è
bisogno dell’apprendimento automatico.
I CORPORA
Sia che si parta da un approccio sia se si parte dall’altro, cosa serve a un linguista computazionale?
Lenci, Montemagni e Pirrelli affermano che servono:
1) la capacità di selezionare e raccogliere i dati linguistici più appropriati
2) la conoscenza di metodi formali (logico-algebrici, statistici, matematici e computazionali) per
l’analisi di questi dati
3) la padronanza di tecniche informatiche con cui condurre automaticamente le proprie analisi
Il suo scopo era quello di creare un ambiente che servisse una volta e per tutte era il punto 1, per
chiunque volesse studiare D’Acquino.
In linguistica se abbiamo cattivi dati, allora questo porta a cattiva scienza. Nello studio della lingua
per chi studia gli aspetti psico-linguistici, vengono fatti esperimenti di laboratorio. In linguistica
computazionale intendiamo ogni scrittura in formato digitale, può essere rappresentato come testo
scritto.
Nella storia della nostra disciplina ???
Il Brown Corpus raccoglieva un milione di parole. Gli autori, tra cui Kucera e Francis, hanno deciso
di raccogliere solo testi scritti. Questo è il titolo del libro scritti dagli autori soprastanti: La
descrizione dell’American English negli anni ’60.
Un corpus è una raccolta, una collezione di testi il testo viene inteso nel senso di manifestazione
linguistica trascritta in un formato leggibile. I testi in un corpus vengono selezionati per fini di
ricerca teorica o applicata sulla lingua. I corpora che sono stati creati si possono distinguere in
corpora generali, corpora specialistici ecc. Un corpus si può distinguere anche in base alla modalità:
scritta, parlata e misti. I corpus possono essere suddivisi anche in sincronici e diacronici. Un
esempio di corpus diacronico è The Helsinki Corpus. Anche la quantità di lingue può essere inteso
come corpus. L’istituzione parlamentare di paesi come la Svizzera che è un paese multiculturale è
un corpus di tipo allineato.
pf2

Anteprima parziale del testo

Scarica LINGUISTICA COMPUTAZIONALE (Mambrini) e più Appunti in PDF di Linguistica solo su Docsity!

Quale settore della vita pubblica e sociale ha dato sviluppo all’interazione con documenti scritti in linguaggio naturale? È stato l’ambito della difesa militare. Turing si occupa di decifrazione dell’esercito tedesco. La necessità di trattare per l’Intelligence, il linguaggio non molto semplice ha permesso lo sviluppo dell’intelligenza artificiale. Busa si è trovato ad affrontare problemi che diamo per scontati ad esempio cosa voglia dire interagire con un computer nell’ispezione di dati. Lui studiava Tommaso D’Acquino. Se voglio digitalizzare un testo e ci viene trasmesso, ci aspettiamo che sia identico a quello del trasmittente. Noi scarichiamo un documento e tecnicamente vedremo quello che vede pure il destinatario. Top down Bottom up Addestrarsi significa anche imparare le probabilità Certi tipi di regole possono servire a contribuire a lavorare sul cuore della macchina, anche se c’è bisogno dell’apprendimento automatico. I CORPORA Sia che si parta da un approccio sia se si parte dall’altro, cosa serve a un linguista computazionale? Lenci, Montemagni e Pirrelli affermano che servono:

  1. la capacità di selezionare e raccogliere i dati linguistici più appropriati
  2. la conoscenza di metodi formali (logico-algebrici, statistici, matematici e computazionali) per l’analisi di questi dati
  3. la padronanza di tecniche informatiche con cui condurre automaticamente le proprie analisi Il suo scopo era quello di creare un ambiente che servisse una volta e per tutte era il punto 1, per chiunque volesse studiare D’Acquino. In linguistica se abbiamo cattivi dati, allora questo porta a cattiva scienza. Nello studio della lingua per chi studia gli aspetti psico-linguistici, vengono fatti esperimenti di laboratorio. In linguistica computazionale intendiamo ogni scrittura in formato digitale, può essere rappresentato come testo scritto. Nella storia della nostra disciplina ??? Il Brown Corpus raccoglieva un milione di parole. Gli autori, tra cui Kucera e Francis, hanno deciso di raccogliere solo testi scritti. Questo è il titolo del libro scritti dagli autori soprastanti: La descrizione dell’American English negli anni ’60. Un corpus è una raccolta, una collezione di testi il testo viene inteso nel senso di manifestazione linguistica trascritta in un formato leggibile. I testi in un corpus vengono selezionati per fini di ricerca teorica o applicata sulla lingua. I corpora che sono stati creati si possono distinguere in corpora generali, corpora specialistici ecc. Un corpus si può distinguere anche in base alla modalità: scritta, parlata e misti. I corpus possono essere suddivisi anche in sincronici e diacronici. Un esempio di corpus diacronico è The Helsinki Corpus. Anche la quantità di lingue può essere inteso come corpus. L’istituzione parlamentare di paesi come la Svizzera che è un paese multiculturale è un corpus di tipo allineato.

Corpus diacronico: Crea diverse categorie analogiche, può parlare di anni, decenni, millenni, epoche… Le risorse linguistiche sono collezioni di dati. I corpora sono dei tipi di risorse linguistiche. VLO= virtual language observatory