Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Linguistica Applicata e Corpus Linguistics: Procedures e Discipline, Appunti di Linguistica

Una panoramica delle applicazioni della linguistica a discipline diverse e tecnologie, con un focus sui sistemi necessari per il trattamento dei dati linguistici. Viene discusso il concetto di corpus linguistics e la distinzione tra linguistica teorica e applicata. Le sottobranche della linguistica applicata vengono presentate, insieme alle loro applicazioni in settori come medicina, giuridico, forense e tecnologico.

Tipologia: Appunti

2019/2020

Caricato il 02/12/2020

giulia_dino
giulia_dino 🇮🇹

4.7

(34)

46 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LINGUISTICA APPLICATA E CORPUS LINGUISTICS
Le applicazioni della linguistica ad altre discipline alle applicazioni
tecnologiche (x es traduzioni automatiche) prevede una serie di procedure
(algoritmi software e processi di trattamento automatico o automatizzato di
dati linguistici ) il trattamento dei dati richiede lo sviluppo di sistemi che li
trattino, ovvero: il ricercare una parola all’interno di un testo prevede che
quel programma faccia una scansione del testo e vada a cercare una stringa di
caratteri, dietro questa operazione c’è un software che tratta i dati. Questi
software necessitano di una serie di comandi, ovvero una modellizzazione di
ricerca di dati linguistici.
LINGUISTICA TEORICA: Fonetica, fonologia, morfologia, sintassi, semantica,
pragmatica. Di queste sotto branche della linguistica la fonetica e la
pragmatica sono considerate spesso come ancillari per confluire nella
linguistica applicata.
LINGUISTICA APPLICATA: ha due diramazioni; una riguarda discipline affini alla
linguistica (sociolinguistica, psicolinguistica, etnolinguistica, antropologia,
neurolinguistica), l’altra diramazione sono le applicazioni ad ambiti altri
(ambito medico clinico, ambito giuridico, forense, ambito tecnologico).
SCALISE (definizione)
Linguistica applicata è un fatto metodologico più che di definizione
Corpus linguistics: corpus è una raccolta strutturata e organizzata di dati
linguistici secondo certi criteri ed etichettature che ci consentono di
interrogare il corpus. Sono dati veri ma non autentici (dati costruiti a posta
per dimostrare una tesi, dati che esistono al di fuori della conoscenza). Il
formato digitale non è un elemento sostanziale dei corpora. la corpus
linguistics è la disciplina che analizza, teorizza, i dati di un corpus e modellizza
(creare modelli a partire dai dati) i dati linguistici (analizzare=procedimento
che può portare a una descrizione o a una modellizzazione). Dicotomia
all’interno della linguistica Esiste una linguistica che opera sui giudizi del
parlante e le conoscenze che abbiamo della lingua, ed esiste una linguistica
che si comporta come una scienza, che descrive modellizza i dati e sulla base
di questo fa delle teorie.
pf3

Anteprima parziale del testo

Scarica Linguistica Applicata e Corpus Linguistics: Procedures e Discipline e più Appunti in PDF di Linguistica solo su Docsity!

LINGUISTICA APPLICATA E CORPUS LINGUISTICS

Le applicazioni della linguistica ad altre discipline alle applicazioni tecnologiche (x es traduzioni automatiche) prevede una serie di procedure (algoritmi software e processi di trattamento automatico o automatizzato di dati linguistici ) il trattamento dei dati richiede lo sviluppo di sistemi che li trattino, ovvero: il ricercare una parola all’interno di un testo prevede che quel programma faccia una scansione del testo e vada a cercare una stringa di caratteri, dietro questa operazione c’è un software che tratta i dati. Questi software necessitano di una serie di comandi, ovvero una modellizzazione di ricerca di dati linguistici. LINGUISTICA TEORICA: Fonetica, fonologia, morfologia, sintassi, semantica, pragmatica. Di queste sotto branche della linguistica la fonetica e la pragmatica sono considerate spesso come ancillari per confluire nella linguistica applicata. LINGUISTICA APPLICATA: ha due diramazioni; una riguarda discipline affini alla linguistica (sociolinguistica, psicolinguistica, etnolinguistica, antropologia, neurolinguistica), l’altra diramazione sono le applicazioni ad ambiti altri (ambito medico clinico, ambito giuridico, forense, ambito tecnologico). SCALISE (definizione) Linguistica applicata è un fatto metodologico più che di definizione Corpus linguistics : corpus è una raccolta strutturata e organizzata di dati linguistici secondo certi criteri ed etichettature che ci consentono di interrogare il corpus. Sono dati veri ma non autentici (dati costruiti a posta per dimostrare una tesi, dati che esistono al di fuori della conoscenza). Il formato digitale non è un elemento sostanziale dei corpora. la corpus linguistics è la disciplina che analizza, teorizza, i dati di un corpus e modellizza (creare modelli a partire dai dati) i dati linguistici (analizzare=procedimento che può portare a una descrizione o a una modellizzazione). Dicotomia all’interno della linguistica Esiste una linguistica che opera sui giudizi del parlante e le conoscenze che abbiamo della lingua, ed esiste una linguistica che si comporta come una scienza, che descrive modellizza i dati e sulla base di questo fa delle teorie.

CORPUS LINGUISTICS: ha una adiacenza con una serie di discipline limitrofe: linguistica computazionale, statistica linguistica, informatica linguistica/ linguistica informatica, T.A.L. (trattamento automatico del linguaggio) N.L.I. (natural language processing o ELN elaborazione del linguaggio naturale) le ultime tre rientrano nella macrocategoria dell’intelligenza artificiale. (ricreare una intelligenza robotica ricalcando i processi cognitivi umani) La linguistica computazionale è una linguistica che fa dei calcoli (manuale i Chiari ) si basa su una serie di elaborazioni su dati linguistici (x es quanti nomi ci sono in un testo) modellizza partendo da calcoli i dati linguitici, elabora modelli linguistici algoritmizzati basandosi su conteggi su dati linguistici a che servono questi processi? formalizza in una forma algoritmica delle generalizzazioni linguistiche (x es sulla base di dati trovo che in una lingua x nel 90% dei casi la relativa è introdotta da un pronome che ha un antecedente principale ) ovvero formalizza una regola. Formalizzarla serve a renderla trattabile computazionalmente. L’informatica linguistica tratta questi modelli, ovvero traduce i modelli algoritmici in procedure automatiche, ovvero eseguibili dalle macchine (crea i software) Cos’è la statistica linguistica? Inizio del 900. elaborazione di una serie di regole di conteggio di occorrenze di percentuali e correlazioni statistiche (in un testo la lunghezza della parole è inversamente proporzionale alla sua frequenza di occorrenza, ovvero sono più frequenti le parole corte che quelle lunghe. ) Trattamento automatico del linguaggio usa gli strumenti informatici per analizzare i testi (dati) NLP sottobranca dell’informatica che elabora sistematizza dati per produrre sistemi automatici o robotici che sfruttano i dati linguistici. Dietro la creazione di un robot c’è un processo di elaborazione del linguaggio naturale che attraverso il trattamento dei dati linguistici modellizza quel risultato per simulare i processi cognitivi linguistici umani. Queste discipline si differenziano tra loro per gli obiettivi che vogliono raggiungere. Cos’hanno in comune queste discipline? I dati e il metodo quantitativo, ovvero il fatto di lavorare su basi di dati e quantità di dati con un metodo quantitativo (una legge è vera se è basata su una quantità di dati che vengono dal corpus). Quindi la corpus linguistics ha come obiettivo il corpus, ovvero la costruzione e esplorazione dei dati linguistici. La corpus linguistics si può tradurre come linguistica del curpus o la linguistica sul corpus.