Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


linguistica digitale prof. Ghezzi, Appunti di Linguistica

appunti di tutte le lezioni 2020-21

Tipologia: Appunti

2020/2021
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 21/06/2021

laura-fantoni
laura-fantoni 🇮🇹

4.5

(2)

5 documenti

1 / 44

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
LINGUISTICA DIGITALE 2020/2021
Prof. Chiara Ghezzi
Libri:
-L’italiano e la rete, le reti per l’italiano (capitoli segnati sulla slide) tot. 102 pagine, Patota, Giuseppe e Rossi
(online)
-Linguistica dei corpora, Freddi, Maria. Tot 144 pagine (compra)
MODULO 1: come può variare l’italiano nell’uso linguistico, differenze tra parlato, scritto e mediato.
IL REPERTORIO LINGUISTICO ITALIANO (ripasso di linguistica generale)
Esiste solo un italiano? Cosa è un repertorio linguistico?
Dire “io parlo italiano” non si può, è una pura astrazione, se pensiamo a ognuno di noi, parliamo tutti
diversamente dagli altri, ognuno usa la lingua in maniera soggettiva, con caratteristiche particolari…
Ognuno di noi parla un IDEOLETTO, una lingua che parla solo lui.
Inoltre, nessuno di noi è competente allo stesso modo in tutte le varietà di lingua, ognuno è specializzato in
diversi campi (familiare, medicina, scienza, letteratura)
Come in tutte le lingue di cultura, l’italiano ha sviluppato un’ampia gamma di varietà che sono
extralinguistiche, non dipendono dalla lingua in sé ma dall’uso che ne si fa nei diversi campi e da
determinate persone. (giovani/anziani, classi sociali, stati sociali…) Nessuno può dirsi parlante di italiano
vero.
Dobbiamo comprendere quali sono queste varietà, i rapporti tra loro, le loro gerarchie e come si
relazionano tra loro le diverse varietà, quali sono le loro norme d’uso.
ARCHITETTURA DELL’ITALIANO CONTEMPORANEO
Ci sono diverse dimensioni della variazione linguistica:
Variazione diacronica (nel tempo)
Variazione sincronica che racchiude:
-Variazione diatopica: italiani regionali marcati per pronuncia, lessico, morfosintassi
-Variazione diafasica: registri (situazione e contesto comunicativo in cui si interagisce), sottocodici
(argomento di cui si parla) e gerghi (funzione criptica, es. lingua dei giovani)
-Variazione diastratica: in base allo stato sociale e all’identità sociale del parlante e al grado di istruzione
(italiano popolare, regionale di semicolti e incolti che hanno il dialetto di lingua madre)
-Variazione diamesica: in base al canale utilizzato: scritto o orale, ma anche mediato (sincrono, italiano
mediale o asincrono, le e-mail)
LA GRAMMATICA DELLE VARIETÀ
Esempio di Berruto su slide (il gatto insegue il topo)
Anche applicata al lessico (morire) schema, un lessema può avere diversi modi per dirlo in base al registro,
allo stato sociale, al sottocodice, al grado di formalità…
LA VARIAZIONE DIAMESICA
Definizione di Mioni, 1983: L’insieme dei fenomeni linguistici connessi con la selezione di un determinato
mezzo di comunicazione (scritto, parlato, radiofonico, telefonico, telematico…).
Mioni introduce la variazione diamesica. La scelta del mezzo nella trasmissione del messaggio ha una
ricaduta importante sul modo in cui codifico il messaggio, lo scritto non avrà le ripetizioni e la ridondanza
dell’orale. L’orale è evanescente, non rimane, quindi c’è bisogno, per esempio, di ripetere ciò che viene
detto. A seconda del mezzo varia il linguaggio e il modo in cui organizzo il messaggio, nel parlato sono
molto più frequenti le ripetizioni, le riprese, le correzioni… i vari tipi di comunicazione comportano diverse
pianificazioni del discorso e di organizzazione testuale dell’enunciato.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
Discount

In offerta

Anteprima parziale del testo

Scarica linguistica digitale prof. Ghezzi e più Appunti in PDF di Linguistica solo su Docsity!

LINGUISTICA DIGITALE 2020/

Prof. Chiara Ghezzi Libri:

  • L’italiano e la rete, le reti per l’italiano (capitoli segnati sulla slide) tot. 102 pagine, Patota, Giuseppe e Rossi (online)
  • Linguistica dei corpora, Freddi, Maria. Tot 144 pagine (compra) MODULO 1: come può variare l’italiano nell’uso linguistico, differenze tra parlato, scritto e mediato.

IL REPERTORIO LINGUISTICO ITALIANO (ripasso di linguistica generale)

Esiste solo un italiano? Cosa è un repertorio linguistico? Dire “io parlo italiano” non si può, è una pura astrazione, se pensiamo a ognuno di noi, parliamo tutti diversamente dagli altri, ognuno usa la lingua in maniera soggettiva, con caratteristiche particolari… Ognuno di noi parla un IDEOLETTO, una lingua che parla solo lui. Inoltre, nessuno di noi è competente allo stesso modo in tutte le varietà di lingua, ognuno è specializzato in diversi campi (familiare, medicina, scienza, letteratura) Come in tutte le lingue di cultura, l’italiano ha sviluppato un’ampia gamma di varietà che sono extralinguistiche, non dipendono dalla lingua in sé ma dall’uso che ne si fa nei diversi campi e da determinate persone. (giovani/anziani, classi sociali, stati sociali…) Nessuno può dirsi parlante di italiano vero. Dobbiamo comprendere quali sono queste varietà, i rapporti tra loro, le loro gerarchie e come si relazionano tra loro le diverse varietà, quali sono le loro norme d’uso.

ARCHITETTURA DELL’ITALIANO CONTEMPORANEO

Ci sono diverse dimensioni della variazione linguistica: Variazione diacronica (nel tempo) Variazione sincronica che racchiude:

  • Variazione diatopica: italiani regionali marcati per pronuncia, lessico, morfosintassi
  • Variazione diafasica: registri (situazione e contesto comunicativo in cui si interagisce), sottocodici (argomento di cui si parla) e gerghi (funzione criptica, es. lingua dei giovani)
  • Variazione diastratica: in base allo stato sociale e all’identità sociale del parlante e al grado di istruzione (italiano popolare, regionale di semicolti e incolti che hanno il dialetto di lingua madre)
  • Variazione diamesica: in base al canale utilizzato: scritto o orale, ma anche mediato (sincrono, italiano mediale o asincrono, le e-mail)

LA GRAMMATICA DELLE VARIETÀ

Esempio di Berruto su slide (il gatto insegue il topo) Anche applicata al lessico (morire) schema, un lessema può avere diversi modi per dirlo in base al registro, allo stato sociale, al sottocodice, al grado di formalità…

LA VARIAZIONE DIAMESICA

Definizione di Mioni, 1983: L’insieme dei fenomeni linguistici connessi con la selezione di un determinato mezzo di comunicazione (scritto, parlato, radiofonico, telefonico, telematico…). Mioni introduce la variazione diamesica. La scelta del mezzo nella trasmissione del messaggio ha una ricaduta importante sul modo in cui codifico il messaggio, lo scritto non avrà le ripetizioni e la ridondanza dell’orale. L’orale è evanescente, non rimane, quindi c’è bisogno, per esempio, di ripetere ciò che viene detto. A seconda del mezzo varia il linguaggio e il modo in cui organizzo il messaggio, nel parlato sono molto più frequenti le ripetizioni, le riprese, le correzioni… i vari tipi di comunicazione comportano diverse pianificazioni del discorso e di organizzazione testuale dell’enunciato.

Le due polarità estreme scritto-scritto e parlato-parlato, sono il parlato prototipico e lo scritto prototipico, che presentano caratteristiche contrapposte (vedi tabella su slide)

  • canale uditivo (fonico acustico) nel parlato e canale visivo (grafico) nello scritto, nel parlato ho un’incidenza più forte della prosodia (velocità, intonazione…), nello scritto ha più importanza la punteggiatura, i paragrafi ecc.
  • il parlato è temporaneo, viene pianificato in tempo reale, ha una diversa pianificazione sintattica e testuale e presenta ridondanza, mentre lo scritto è permanente, può essere pianificato in anticipo, c’è maggior possibilità di controllo e di articolazione dell’informazione, più formale
  • nel parlato il contesto è condiviso, i destinatari sono compresenti (implicitezza di molti concetti, segnali discorsivi), mentre lo scritto è più esplicito e chiaro nell’organizzazione del discorso, maggior accuratezza e formalità
  • lessico: nel parlato più verbi e parole grammaticali, maggior dispersione di contenuto. Nello scritto Più varietà di vocaboli, termini astratti, frasi nominali, più parole lessicali che grammaticali, maggior densità informativa e maggior concentrazione di contenuti.
  • morfosintassi: nel parlato frammentarietà, frasi incomplete, ripetizioni, paratassi e dislocazione, meno connessione, meno uso di pronomi, passivi. Nello scritto sintassi più elaborata, frasi più lunghe, subordinazione, concordanze e meno dislocazione, maggior connessione
  • testualità: nello scritto discontinuità tematica, nello scritto maggior continuità e coerenza logica. All’intersezione tra scritto e parlato si collocano altre varietà intermedie che rappresentano un continuum ininterrotto disposto tra i due poli estremi della variabilità diamesica. Questo perché i due estremi non rappresentano entità discrete nettamente separabili e discriminabili, ma ci sono varietà intermedie. In una posizione intermedia tra parlato e scritto pieni si collocano una gamma di realizzazioni, di per sé orali, ma alle quali è estranea la caratteristica del parlato spontaneo, proprio delle interazioni verbali faccia a faccia. Queste varietà sono rappresentate rispetto alle varietà intermedie dello scritto (ci sono anche quelli dell’orale): →parlato scritto (es pubblicità), parlato recitato (imparato a memoria), parlato pubblico formale (molto più controllata), parlato dialogico letto (es. telegiornali), parlato-parlato Lingua trasmessa (Sabatini 1982): un insieme coerente di varietà ibride, specifico delle moderne forme di comunicazione linguistica a distanza (radio-parlato radiofonico, televisione-televisivo, cinema- cinematografico, telefonia-telefonico + italiano digitato e scritture brevi, lingua dei media, delle mail, delle chat online…) Esse rappresentano una nuova forma di comunicazione. Parlato radiofonico, la radio ha aiutato all’uniformità linguistica, ha agito sui singoli parlanti favorendo lo sviluppo di una maggior competenza, nuovo modello di lingua. Ha contribuito alla creazione dell’italiano neostandard Il parlato cinematografico invece offre un quadro più ampio delle varietà dell’italiano parlato, tipici del luogo o dell’epoca. Il telefonico invece ha caratteristiche di maggior strutturazione, perché non abbiamo un contesto condiviso quindi tendiamo a dare più informazioni. Infine, arriviamo alla comunicazione mediata da computer (CMC) e alle scritture brevi, che è ciò di cui parleremo, più sintetiche dello scritto e introdotte negli ultimi anni. Le differenze tra scritto e parlato (estremi), molto più nette, non possono però essere paragonate alle differenze di una comunicazione mediata da un canale, in questo caso da un computer, in cui le differenze sono molto più sfumate.
  • ambiente circostante Produzione di segni grafici (evoluzione del segno del toro). Dopo millenni, emergono nuovi pittogrammi (es. dal disco di Festo del 1700 a.C alle emoticon- icon of emotions). Abbiamo rifunzionalizzato (usare vecchie parti per qualcosa di nuovo) il nostro ambiente circostante per veicolare dei messaggi. Emoticon: sono definiti elementi che hanno la funzione di dare un’idea dello stato d’animo dell’emittente, ideate nel 1982 da Scott Fahlman, per rendere più espressiva la comunicazione di frasi felici o tristi Emoji (giapponese)= pittogramma, usati in sostituzione di intere frasi che ci mettono di fronte a una comunicazione efficace, veloce, intuitiva, degna dell’era digitale. La capacità dei bambini di riconoscere un viso conosciuto dipende da una parte del cervello che è la stessa che ci permette di conoscere le lettere su un foglio di carta. Siamo quindi da sempre abituati a rifunzionalizzare le nostre parti del corpo. Soprattutto quando nelle nostre vite si verificano cambiamenti (culturali, tecnologici, personali). Es del corpo (visione verticale e orizzontale) Es dell’ambiente circostante (come modifichiamo l’ambiente circostante per sfruttarlo in maniera differente), cose che sono materiali, vengono rifunzionalizzate come se fossero astratte (es. icone, pittogrammi dal simbolo della mucca alla lettera a, che svolge funzioni diverse). LA PRODUZIONE DEI SEGNI GRAFICI (rifunzionalizzazione moderna) Da dove deriva la @: separatore negli indirizzi di posta elettronica (a commerciale, at in inglese), introdotta nello Zanichelli nel 1998, ora è glossata come “gergale”. Ipotesi:
  • Ulman, un paleografo americano, per lui questo simbolo veniva usato dai trascrittori amanuensi nel medioevo per scrivere “ad” latino, secondo la scrittura onciale (degli amanuensi)
  • Giorgio Stabile mette in discussione questa ipotesi, e sostiene che questo simbolo era usato solo in testi mercantili più tardi, indica la parola “anfora”, nel suo valore di unità di misura, di capacità e di peso. In spagnolo invece (arroba) Indicava unità di peso (25 libbre) e una misura di vino. Questo simbolo è entrato in ambito commerciale grazie ai mercanti italiani, con il senso di anfora (peso, unità di misura), poi si è persa la nozione di unità di misura e è entrata nel mondo anglosassone con il significato di “at”, preposizione che intendeva un importo (at the price of). Questo valore è ancora in uso nelle transazioni di borsa via internet. In Italia viene usato come equivalente di Addi (per indicare una data), soprattutto nel 19 secolo, anche se compare nel 1666 con il significato di Addi @ è un modo di trascrivere “a” nella grafia mercantesca (unità di misura espressa dal termine anfora), nei secoli successivi: in area anglosassone ha il valore di “at”, in area italiana come abbreviazione di “addi”. 1884: viene introdotta nella macchina da scrivere Calligraph n.3 Commercial (con valore commerciale anglosassone) 1972: fra i caratteri disponibili nella tastiera, l’americano Ray Tomlinson la scelse come separatore, ma anche come significato di “presso” negli indirizzi di posta elettronica per ARPANET, la rete universitaria di origine militare da cui sarebbe nato Internet

Rifunzionalizzazione: cose vecchie, significati nuovi

Il linguaggio umano nasce arricchito, permeato di materialità biologica e culturale: è un sistema che si adatta e si modella in rapporto ai bisogni comunicativi; è in grado di cambiare in seguito all’esperienza e all’evoluzione tecnologica e di funzionare in contesti diversi anche impervi, ad esempio l’uso di nuovi canali di trasmissione.

Durante tutta l’evoluzione semiologica della specie, la comunicazione umana ha saputo adattarsi a diversi tipi di canale e all’interazione tra più canali contemporaneamente. La multicanalità non è quindi un’invenzione del 20 e 21 secolo ma fa parte del patrimonio semiologico della specie, è solo applicata a nuovi contesti. Esempi:

  • effetto McGurk, 1986: insieme a Mac Donald, esperimenti riportati su una rivista Nature di studi sulla biologia, che provano le influenze della percezione visiva sulla percezione uditiva. Verificano la percezione del suono BA, lo registrano e lo associano a qualcuno che muove la bocca senza produrre alcun suono ma dicendo cose diverse. Le persone che vedono il movimento della bocca che corrisponde ad esempio al suono GA ma ascoltano il suono BA percepiscono GA. La comprensione del solo suono vocale da risultati diversi dall’associazione di questo suono al movimento. Quello che vedo influenza ciò che sento
  • apprendimento lingue straniere: stesso ragionamento, quanto più una persona che parla con me in un'altra lingua si allontana, meno comprendo, la vicinanza con quella persona mi aiuta.
  • effetto cocktail party di Cherry, 1953: capacità umana di esercitare un’attenzione selettiva verso una specifica fonte acustica e riconoscerla in un ambiente, riusciamo a isolare a una festa qualcuno che parla di un determinato argomento, capacità molto importante.
  • L’integrazione audiovisuale non è limitata a questo; siamo più visti che ascoltati. I gesti non sono solo di supporto ma sono elementi determinanti in una conversazione, perché possono modificare anche completamente il significato di una frase (es. Claudio va a scuola da solo, se lo dico con una faccia felice indica qualcosa, se lo dico con una faccia imbronciata indica altro). A parità di segnale fonico, un mutamento nell’espressione facciale e nel movimento del tronco può determinare una diversa interpretazione complessiva dell’enunciato. Voghera dice che si modifica la modalità epistemica legata alla fonte della conoscenza, il parlante si pone come sicuro o incerto rispetto a quello che dice. Non tutta la comunicazione umana è multicanale (anche se la comunicazione monocanale è un’eccezione, es. solo scrittura) La monocanalità sembra più il frutto di innovazioni tecnologiche che riducono la ridondanza e l’impiego di energia per la comunicazione, concentrando tutta la carica di informazione su un unico canale massimizzandone l’efficienza. “La scrittura non nasce come una tecnica per rappresentare meramente una lingua nella sua forma fonica, ma come un codice comunicativo per superare i limiti del linguaggio nello spazio e nel tempo” (Valeri, 2001). Verba volant scripta manent In ogni caso qualsiasi comunicazione (sia multi che monocanale) avviene sempre in un contesto extralinguistico che gli utenti interpretano in modo da trarne significato, più o meno consapevolmente. Esempio la scrittura e la radio, c’è solo la parte acustica. DOMANDE
  • quali sono le conseguenze sul piano linguistico di questi dati semiologici di partenza?
  • quanto della forma delle lingue storico-naturali dipende dall’uso del canale utilizzato?
  • in che modo l’uso dei canali di trasmissione incide sulla grammatica delle lingue? DAL CANALE ALLA MODALITA DI COMUNICAZIONE Canali diversi comportano diverse modalità enunciative alle quali gli utenti reagiscono scegliendo le strutture ad esse più compatibili/congeniali. Le scelte linguistiche non sono quasi mai strettamente dipendenti dall’uso di un canale in senso stretto, ma dal fatto che il sistema di trasmissione, in questo caso l’essere umano, l’anello di congiunzione tra lingua e canale, determina quali sono le migliori scelte possibili per quel canale. L’uso dei vari canali comporta inevitabilmente modalità di comunicazione diverse associate con scelte linguistiche ricorrenti. Siamo guidati da un criterio di efficienza (minimo sforzo massimo risultato) Es. schema diap. 22 Abbiamo il canale fonico uditivo, quindi la voce, che fa uso della mimica, dell'espressione facciale e dei gesti che usa la modalità di veicolazione “in praesentia” inteso faccia a faccia in cui c'è uno scambio di

Non esiste solo lo scritto o solo il parlato ma una serie di tipologie ibride (es. scritto sotto dettatura, chat, sms…) I due criteri di continuità del processo e del testo ci aiutano a individuarle. Esse non vengono associate a un unico canale. La multidimensionalità non è una proprietà che deriva dallo sviluppo tecnologico del ventesimo secolo, ma appartiene alla storia biologica e culturale della specie. non c'è un rapporto deterministico tra canale in modalità grammatica e testi piuttosto rapporto di co variazione costante (al variare del canale varia la modalità, la grammatica…) → è possibile individuare dei principi basici di organizzazione che identificano classi di modalità che a loro volta sono associati a costruzioni linguistiche che si radicano nell’uso e contribuiscono a delineare i confini della grammatica di una lingua. La naturale multimodalità della comunicazione umana rende irrealistico un modello in cui l'universo semiotico e interpretato come derivazione del parlato della scrittura. NUOVE TECNOLOGIE E VARIAZIONE DIAMESICA Lo sviluppo delle nuove tecnologie ha posto in una luce diversa le possibili intersezioni tra usi scritti e parlati (written speech, writing speech, conversation…a partire dagli anni 80): cose in comune con l’orale: scarsa pianificazione dei testi, presenza di tratti informali dei registri parlarti, grado di dialogicità. Negli anni 80 nasce l'etichetta CMC (comunicazione mediata dal computer) include tutte le forme di interazioni mediate dai dispositivi elettronici → I sistemi più diffusi erano le mail. Una distinzione fondamentale è quella tra sistemi sincroni e asincroni, in base al fatto che ci fossero omino con presente nello stesso momento i due o più interlocutori i sistemi asincroni ottimizzano i tempi di trasmissione ma non prevedono interazioni mediata tra mittente e destinatario, mentre i sistemi sincroni prevedono la presenza di due o più interlocutori. 1.Negli anni 90 Internet conosce la svolta del web, che supporta lo scambio di file multimediali e scambio di file multimodali. 2.Dieci anni dopo nasce il Web 2.0 (web dinamico) caratterizzato dalla partecipazione degli utenti alla costruzione dei contenuti (folksonomy)

  1. la telefonia mobile rivoluziona il panorama della comunicazione (sms e messaggistica istantanea, whatsapp, telegram, snapchat..)
  2. social network (Facebook nel 2004, Youtube nel 2005, Instagram nel 2010): comunicazione frammentaria, sia come brevità dei testi (limite di caratteri) e come pratica di creazione di un profilo (foto, video, link…) la scrittura diventa sempre meno centrale. I social network supportano diversi canali di trasmissione La modalità di comunicazione nata con internet mostra un’evoluzione nei sistemi di scambio, che evolvono nel tempo, si passa dalle mail ai social, dal web statico al dinamico, con un allontanamento dalla scrittura tradizionale verso una nuova forma di scrittura mai conosciuta. La novità nella CMC sta nella possibilità di scambio (prima da uno a molti, ora da molti a molti), anche nei testi più scritti. Costante evoluzione dei sistemi di scambio con progressivo allontanamento dai generi della scrittura tradizionale verso produzioni prive di un antecedente. La vera rivoluzione è la possibilità di scambio quindi il dialogo semi sincrono Rifunzionalizzazione: la scrittura viene piegata verso usi inediti , perché i sistemi nativi digitali hanno generato nuovi spazi comunicativi e nuovi usi semiotici del canale (Voghera), lo stesso canale viene rifunzionalizzato per veicolare significati nuovi. Le ricerche su questi argomenti e le loro descrizioni si sono concentrate sulle:
  • tachigrafie (dal greco “taxù”, celere, rapido + “grafia”) scrittura rapida, sms, mail…
  • espedienti di simulazione del parlato: es. emoticon, maiuscole, ideofoni, ripetizione delle lettere…
  • deissi e lessico: progressiva analisi della scrittura al cellulare. Si sono consolidate due categorie di studio:
  • la prima si è concentrata sulla migrazione nel web dei generi testuali tradizionali, come un genere tradizionale testuale viene realizzato sul web (es. articolo di giornale), differenze, continuità…
  • la seconda sulla collocazione della CMC rispetto al continuum scritto-parlato: come si colloca la CMC rispetto al continuum? I primi studi dicono che si tratta di una varietà diamesica con forma grafica ma linguisticamente modellata sul parlato informale o trascurato. All’interno di questa categoria di studi, l’attenzione si è focalizzata sui tratti sub-standard, non su quelli standard delle produzioni digitali, associati poi al linguaggio giovanile. (i giovani non sanno più scrivere per colpa degli sms… stereotipi) si sono evidenziati gli aspetti più eclatanti di questa produzione, ad esempio:
  • l’uso potenziato degli aspetti iconici (emoticon, acronimi, numeri al posto delle lettere, l’arte ASCII…);
  • espedienti che mimano la voce (caratteri maiuscoli, reduplicazione delle lettere…)
  • abbreviazioni A partire da questi elementi si è proposta una nuova varietà di lingua: la Varietà Netspeak (Crystal, 2001) che in Italia ha ottenuto diverse denominazioni (italiano digitato, e-italiano, italiano dei nuovi media, cyberitaliano…) e collocazioni distinte nella rivisitazione dell’architettura dell’italiano contemporaneo (Berruto, 1987) Con la nascita del Web 2.0 l’attenzione si è spostata dal sub standard alla scrittura collaborativa e sui social network (come cambia la scrittura in questi contesti). Diversi studi a partire dal 2010 li troviamo nella slide al min. 22 della lezione 4. Con la CMC nascono nuove forme di comunicazione collaborative, dialogiche e frammentarie, rafforzate dai social media. Queste nuove forme non sono assimilabili al sistema dei generi tradizionalmente inteso. È un nuovo tipo di classificazione di generi che non è ancora stata fatta. (scrittura collaborativa: è la scrittura del Web 2.0, all’inizio c’erano delle pagine web che venivano create e messe online. C’erano dei programmi come Frontpage associati a office che creavano le pagine web facendo attenzione alla formattazione, al titolo ecc… adesso per creare un sito web è già tutto impostato, tutti possono farlo. Proprio perché è diventato così semplice farlo, è possibile anche interagire nei siti, fare commenti ad esempio su un articolo di giornale…prima non si poteva fare. Questi sono gli scritti collaborativi (collaborazione tra chi scrive l’articolo, chi lo commenta ecc). nei social network questa cosa si nota alla massima potenza, c’è un livello di interattività altissimo) Come siamo arrivati a dire che collocare la CMC nella variazione diamesica non è la scelta migliore? Partiamo dal dibattito su dove collocare nello schema di Berruto la CMC: le etichette che abbiamo dato prima (italiano digitato, cyberitaliano…) hanno un problema di fondo: l’assenza di una caratterizzazione specifica per generi e ambienti che tenga conto dell’interfaccia delle caratteristiche degli utenti, del contesto di interazione. Es. quali sono i tempi di scambio, quale è l’argomento, quale è la multimodalità… stenta ad affermarsi l’idea che la scrittura è oggi solo una componente, sempre più marginale, delle interazioni online, poiché molti studi continuano ad evocare la dimensione diamesica come asse dominante nell’interpretazione della CMC. David Crystal “although there are a few properties which different internet situations seem to share, these do not in aggregate make a very strong case for a view of Netspeak as a variety”: ci sono alcune proprietà che le situazioni in internet condividono, ma queste non si aggregano in un’unica varietà. Ci sono tante CMC, non possiamo assimilare la lingua delle mail a quelle dei social…

Perché l’uso della variazione diamesica è problematico?

La dicitura generica di italiano trasmesso comprende l’italiano dei mezzi di comunicazione di massa (radio, tv, internet), a loro volta distinti in orali e scritti. (1982, Sabatini) Berruto nel 2005 usa il termine di parlato grafico e distingue l’aspetto mediale (fonico/grafico) e i parametri concezionali che riguardano il modo in cui il testo viene concepito da chi lo produce: il carattere pubblico/privato della comunicazione, il grado di confidenza degli interlocutori, l’emotività del messaggio, l’ancoraggio referenziale, la natura spontanea o pianificata, la libertà telematica o il vincolo telematico…

  • Gli allocutivi di cortesia (pronomi) risposta di Luca Serianni su Accademia della Crusca: viene riportato un testo digitalizzato (prima era su carta) sugli usi dei pronomi allocutivi di cortesia: la lingua del testo è molto informale.
  • Facebook video sull’uso di “lei” o “voi”. Differenze tra i due testi: uno è un testo scritto, l’altro è parlato. Sintassi: nel primo vengono usati vocaboli più complicati, scritto da un linguista con un linguaggio tecnico, nel secondo essendo parlato non è presente un lessico complicato. Il secondo si preoccupa di mantenere attiva la concentrazione, il primo invece essendo scritto e più tecnico non se ne preoccupa. Il secondo video si trova in un contesto particolare, in cui sono presenti cose differenti, una pagina Facebook che ha come obiettivo insegnare l’italiano (è un video pubblicità per LearnAmo, una scuola di italiano). Sono presenti sottotitoli (il video è multimodale, rispetto al testo della Crusca, utilizza sia il parlato sia lo scritto, alcune interruzioni (schema per spiegare meglio, ragazza che balla) poi dal dialogo di passa alla scrittura di una mail). I due esempi parlano esattamente della stessa cosa, quando usare il “lei” e quando usare il “voi”, ma lo fanno in due modi completamente diversi, nonostante entrambi siano pubblicati sul Web. Questo ci fa capire come la CMC non possa essere ricondotta ad una sola varietà di italiano. È evidente, infatti che interpretare le nuove modalità di comunicazione come forme più o meno vicine al parlato o allo scritto fa perdere di vista la loro specificità e innovatività che non è necessariamente legata al canale in senso stretto ma ai nuovi usi semiotici del canale. Non è importante se è più vicino allo scritto o al parlato, ma i modi utilizzati. Lo stadio attuale è arrivato a permetterci di coniugare due proprietà che prima sembravano incompatibili: discontinuità di produzione e ricezione e discontinuità del testo. A produrre cioè dialoghi a distanza che non necessariamente contengono tutte le tracce della redazione del testo e della sua esecuzione, ma che possono mantenere la quasi sincronia. La collocazione delle scritture digitali nell’architettura dell’italiano contemporaneo coinvolge anche la lettura diafasica (contesto in cui mi trovo, tempo di attesa…) e diastratica (stato sociale degli interlocutori) della CMC, non solo la diamesica, perché l’elemento centrale è quanto il canale sia dialogico, dal grado di dialogicità. La scrittura si sta modificando, l’autonomia dello scritto si è dileguata nel tempo, non fa più da sfondo a se stesso, grazie alla tecnologia. Gli aspetti non standard delle scritture digitali sono ricondotti alle convenzioni scrittorie, al “linguistic whateverism”, allo scarso dominio dell’italiano da parte degli utenti, su internet troviamo di tutto, soprattutto una lingua sub-standard, la cosiddetta “lingua selvaggia”, Fiorentino 2013. In questo senso internet ha fatto emergere le ridotte competenze scrittorie di molti italiani. 3 esempi: scritti simili trovati online (trattano il tema politico del Pd) sulla Repubblica. Il testo commentato è lo stesso, ma gli scrittori sono diversi, si notano quindi le grandi differenze. I lettori della Repubblica possono quasi essere racchiusi in una grande comunità, così come i commentatori, anche se uno magari si trova lì per caso e commenta. I commentatori (più di 2000) sono polarizzati, hanno idee contrastanti. I tre commenti scritti da tre persone diverse sono molto diversi tra loro: i primi due sono informali, l’ultimo è molto più formale, il terzo ha un controllo maggiore dei primi due, che invece usano un linguaggio tipico del parlato, con espressioni informali e errori grammaticali, abbreviazioni… Sono tre varietà di italiano diverse, nonostante si trovino all’interno di uno stesso sito. Possiamo distinguere tra:
  • institutional literacy (alfabetizzazione istituzionale): forme di composizione tradizionali, praticate a scuola e nelle professioni, con rispetto dello standard
  • digital vernacular literacy (alfabetizzazione vernacolare digitale): scritture informali, spontanee e prive di un riferimento codificato, risultato di una pratica quotidiana, le cui norme esplicite o implicite dipendono

dalla negoziazione interna alle diverse comunità. Sul Web la gente scrive come vuole, come sa fare. Non ci sono norme per partecipare a gruppi online, solo in alcuni casi (es sito dell’Accademia della Crusca), questo perché è un ambiente ancora nuovo.

APPROCCIO ALLA CMC

L’approccio generale a cui ci affidiamo è questo: ci sono due proprietà (continuità di produzione e continuità del testo) per comprendere i nuovi usi semiotici del canale senza ricadere nelle dicotomie e irriducibilità di scritto e parlato limitata al canale. I social media hanno prodotto un rapido invecchiamento dei modelli interpretativi, es quelli della diamesia sono vecchi per i social media. L’idea di una varietà unica si può quindi considerare superata. (Androutsopoulos 2006) “una varietà di lingua si può definire come un insieme coerente di elementi (forme, strutture, tratti…) di un sistema linguistico che tendono a presentarsi in concomitanza con determinati caratteri extralinguistici, sociali… è quindi sempre un’entità che presuppone una correlazione tra fatti linguistici e fatti non linguistici, e deve essere caratterizzata sulla base di entrambi. Una definizione più tecnica di varietà di lingua è: un insieme solidale di varianti di variabili sociolinguistiche” Berruto, 2011 L’aspetto centrale è la coerenza tra aspetti linguistici e non linguistici. Nella CMC invece questa coerenza non c’è quindi la definizione di Berruto sopra citata non corrisponde alla CMC.

MODULO 2 CHE COSA E UN TESTO?

Diapositiva 1: numeri e lettere sottoforma di codice; è un testo? No Il cartello stradale invece è un testo perché comunica qualcosa al lettore tramite il canale grafico visivo Geroglifici: si sono un testo.

CARATTERISTICHE DI UN TESTO

La parola testo viene dal latino “textus”, tessuto, e poi narrazione, argomento, testo. Come un tessuto è l’insieme di nodi legati tra loro da fili, così il testo è un insieme di elementi legati insieme da corrispondenze (coesivi) e legami (connettivi) linguistici. Coesione e coerenza sono gli elementi costitutivi di un testo. Qualunque produzione che comunica un messaggio compiuto, che lo faccia attraverso parole, icone, simboli, gesti, musica, immagini o altro è un testo. Le uniche condizioni da rispettare perché un oggetto sia identificabile come testo sono:

  • la compiutezza del messaggio comunicato
  • la coerenza : l’armonia semantica tra le componenti dell’oggetto e tra queste e le conoscenze che il ricevente della comunicazione già possiede sulla realtà entro cui il testo si situa, il mondo reale o un mondo immaginario. Un’altra condizione fondamentale per la composizione di un testo è la coesione , qualità che riguarda il corretto legame tra gli elementi che lo compongono. (questa però non è indispensabile come invece le altre due)

ENUNCIATO

Una produzione semiotica che modifica la realtà in qualche modo sia che rappresenti eventi o descriva situazioni, introduca nuove nozioni, induca gli altri ad agire in un determinato modo. Grazie a questa capacità pragmatica degli enunciati, essi vengono definiti atti linguistici. In ogni atto linguistico si distinguono 3 livelli:

  • un livello locutivo: la produzione di parole, suoni, simboli, gesti
  • un livello illocutivo: le intenzioni comunicative dell’emittente
  • un livello perlocutivo: gli effetti che produce nel destinatario (che possono coincidere con le intenzioni dell’emittente oppure no) Int. 1 Che caldo! Int. 2 apre la finestra (perlocutivo)

2 - Il ruolo del contesto. Di cosa parla il testo? 3 - Esempio per capire quando usiamo cornici per capire testi: “sono andata al mercato e ho comprato nuovi grocieri.” Cosa sono i grocieri? Potrebbe essere tante cose, frutta e verdura, oggetti della cucina, pesce, comunque tutte cose che si acquistano al mercato. Se aggiungo “di porcellana”, mi riferisco a tazze, tazzine, escludo gli alimenti. E così via. In automatico creiamo cornici per comprendere al meglio ciò che leggiamo o ascoltiamo. 4 - Anche in assenza di un segnale concreto, diamo un senso al teso. Sappiamo già di cosa parliamo, a grandi linee. L’accettabilità e l’intenzionalità del testo sono due elementi studiati nella linguistica da una teoria fondamento della linguistica pragmatica, fondata da Paul Grice nel 1975 nel volume “logic and conversation”. Egli sostiene che in qualche modo c’è un principio che governa il nostro modo di comprendere e produrre testi. “Dai il tuo contributo alla conversazione nel modo richiesto, allo stadio in cui è richiesto, dallo scopo condiviso o dalla direzione dello scambio comunicativo in cui sei impegnato”. Il principio generale della comunicazione si racchiude in 4 massime della cooperazione:

  • quantità: non essere reticente o ridondante: l’informazione è abbastanza o troppa o troppo poca? La ridondanza è intrinseca nei sistemi di segni (la comunicazione gestuale è sempre presente, come un rumore, qualcosa in eccesso)
  • qualità: sii sincero, aspetti legati alla modulazione epistemica (es. condizionale)
  • relazione: sii pertinente
  • modo: evita l’ambiguità (sappiamo che comunque il linguaggio è vago) Queste massime sono ignorate quando chi comunica ha l’intenzione di non far passare il messaggio. Un testo, più decisamente che in ogni altro messaggio, richiede movimenti cooperativi attivi e coscienti da parte del lettore. Per organizzare la propria strategia testuale, un autore deve assumere che l’insieme di competenze a cui si riferisce sia lo stesso a cui si riferisce il proprio lettore. Pertanto, prevederà un Lettore Modello capace di cooperare all’attualizzazione testuale come l’autore pensava e di muoversi interpretativamente così come egli si è mosso generativamente. Anche il lettore empirico come soggetto concreto degli atti di cooperazione, si deve disegnare un’ ipotesi di Autore, deducendolo appunto dai dati di strategia testuale (Umberto Eco) Eco ci dice: c’è l’autore, c’è il mittente, ci sono le intenzioni comunicative e il lettore si fa delle aspettative testuali su quello che leggerà. L’autore rappresenta il testo mentre il lettore lo interpreta, a partire dalle conoscenze che condividono. Es. murales (7 mesi stupen, polpette (donne) al potere-da Jersey Shore) Di uno strumento per comunicare: forse un megafono? Il testo va letto con un disegno accanto, questo: senza il disegno questo testo non sarebbe comprensibie

INFORMATIVITA DI UN TESTO

La funzione di un testo è trasmettere informazioni. Il grado di informatività non è assoluto, ma dipende dalle conoscenze del ricevente e dal suo interesse per l’argomento trattato. L’informatività di un testo è massima quando il principio di accettabilità viene infranto, cioè quando il ricevente sbaglia le sue previsioni sull’esito della comunicazione. (es. sei stanco? No)

SITUAZIONALITA DEL TESTO

Ogni testo si trova in una situazione che lo determina in qualche modo. La situazione extralinguistica, cioè l’ambito della realtà in cui il testo opera, viene chiamato contesto (definito dall’incrocio delle coordinate spaziali e temporali, ma anche dalle convenzioni sociali, dagli usi, dalle tradizioni proprie di una lingua e una cultura). I testi che operano direttamente nella realtà hanno un rapporto diretto con il contesto, altri testi invece, come i testi riportati, il rapporto con la dimensione extralinguistica (contesto) è mediato. Tipicamente per le narrazioni e i testi scritti, il contesto è codificato sotto forma di materiale linguistico, il contesto viene costruito linguisticamente e prende il nome di cotesto.

APPROPRIATEZZA DEL TESTO

La necessità di usare un linguaggio appropriato non rientra tra i principi costitutivi del testo ma tra le sue caratteristiche preferenziali. Il lessico, la sintassi e l’organizzazione delle informazioni devono essere adatti alla funzione del testo che si sta producendo, al mezzo, all’identità del ricevente e al rapporto sociale che c’è tra emittente e ricevente. Due destinatari diversi, due linguaggi diversi.

INTERTESTUALITA DEL TESTO

Il richiamo tra i testi può essere esplicito, sotto forma di citazione, più o meno mascherata, di riferimento, plagio, parodia, traduzione, transcodificazione o traduzione intersemiotica (es. trasposizioni cinematografiche dei romanzi). L’intertestualità è anche il principio che raggruppa i testi in base a caratteristiche simili che rendono possibile confrontarli tra loro. Il rispetto di questa corrispondenza da parte dell’emittente e la conoscenza di questa appartenenza da parte del ricevente, facilitano il passaggio delle informazioni. IPERTESTI, TESTI DIGITALI E TESTI DIGITALIZZATI. Vedremo le differenze tra queste tipologie e con i testi normali, oltre a capire come queste nuove tipologie di testo stanno modificando la tipologia tradizionale. La storia delle “tecnologie della parola” (Ong 1986) è proceduta di pari passo con l’evoluzione delle modalità di fissazione del pensiero in forma scritta. Le tecnologie della parola sono tutte quelle tecnologie che cercano di dare consistenza e permanenza nel tempo alla diffusione nello spazio del testo in forma orale, di aiutare quindi la parola a non essere evanescente. Si tratta di una storia millenaria che lascia in eredità generi testuali codificati e condivisi che compongono una piramide al cui vertice si colloca il testo lineare e continuo , affidato a un supporto cartaceo, strumento di trasmissione del sapere come complesso e analitico. Su questa forma-testo (testo tipografico) hanno lasciato il segno due ulteriori innovazioni:

  • il cinquantennio elettronico-analogico (caratterizzato dal predominio del medium televisivo nella seconda metà del XX secolo);
  • la rivoluzione digitale e la diffusione della rete (ipertesto).

IPERTESTO: modalità di aggregazione delle unità informative (ideata da Ted Nelson nella metà degli

anni 60, elaborata a partire dagli anni 70, diventata patrimonio comune dagli anni 90).

  • intermedio: ( testi digitalizzati ), scritti con l’ausilio del supporto digitale ma concettualmente non dissimili dal testo tipografico (articolo per una rivista scientifica, una tesi di laurea…)
  • alto: ( testi digitali ) nei testi concepiti per la rete e inconcepibili al di fuori di essa (una conversazione in chat, un blog, i post sui social). In queste scritture, native digitali, caratteristiche del cosiddetto Web 2. (web collaborativo), si concentrano le maggiori innovazioni della testualità digitale.

TESTUALITA DIGITALE

Umberto Eco un po’ di tempo fa scrisse un articolo “Le bustine di Minerva”, in cui diceva che l’eccesso di informazione equivale alla mancanza di informazione, quando ho troppa informazione come in rete, rischio di perdermi e non riesco a capire quali siano affidabili e quali no. Questo sovraccarico informativo della comunicazione in rete viene selezionato dai motori di ricerca. Perché i contenuti siano recuperabili dai motori di ricerca, occorre che siano modellati (web semantic) e che possibilmente compaiano ai primi posti tra i risultati. Esiste una strategia (detta enveloping ) che viene usata in robotica e consiste non nel tentare di far assomigliare la macchina all’uomo, ma nel ridisegnare a partire dalle esigenze della macchina l’ambiente entro cui essa opera. Per i testi il motore di ricerca condiziona le regole di scrittura per il web. Le necessità della macchina sono le norme della cosiddetta SEO (search engine optimization): il testo deve essere ottimizzato per essere conforme alle norme del motore di ricerca, che determinano la struttura profonda ideale di un testo digitale, attraverso tag, metatag, marcatori invisibili a chi legge il testo ma che influenzano il testo. In generale la scrittura digitale non ama la profondità sintattica, troppe subordinate. Ma è caratterizzata dalla verticalità della codifica del testo. Questo è il livello base di codifica dei testi digitali. Ci sono altri livelli di codifica:

  • formattazioni (corpo del testo, corsivo, colore, sottolineato…) sono operazioni di marcatura ( tagging ) che determinano l’aspetto finale del testo (il linguaggio utilizzato è l’HTML, Hyper Text Markup Language)
  • descrittivi, che corredano il testo di metadati (es. chi è l’autore, di cosa parla il testo, quali sono le parole chiave…) e lo dotano di una semantica secondaria. In sintesi, al testo si sovrappongono delle informazioni di supporto, che ne determinano l’aspetto e servono a rintracciare quel testo nelle informazioni di rete. Il testo digitale è concepito per un doppio destinatario: il lettore umano e il motore di ricerca. A volte le esigenze di lettura e comprensibilità del testo che riguardano soprattutto il lettore umano, si alleano con le esigenze di indicizzabilità, necessarie al motore di ricerca. (es. testo breve e semplice, utile al lettore per capire meglio ma anche al motore di ricerca). A volte invece la processabilità per la macchina entra in conflitto con le esigenze di comprensibilità del lettore, a volte gli strati di codifica non sono visibili a chi legge né ai motori di ricerca. Ma grazie allo sviluppo del web interattivo, l’atto del taggare è affidato all’utente comune che però non sa come funziona. Nel Web 2.0 il tagging è diventato social tagging, cioè una tassonomia cooperativa. Ad esempio, quando Cosa si nasconde sotto la superficie di ciò che leggiamo su uno schermo di un dispositivo elettronico? Ogni volta che premo un tasto sulla tastiera o immetto dei dati toccando lo schermo, non produco segni grafici, ma genero un impulso elettrico che viene tradotto in un codice binario, una sequenza di 0 e 1. Questi codici consentono di rappresentare l’intera serie dei numeri interi. Attraverso un altro passaggio questi codici binari vengono convertiti in codici ASCII (American Standard Code for Information Interchange). È possibile con il codice ASCII rappresentare l’alfabeto latino e molti altri simboli. Ci sono quindi impulsi elettrici che si traducono in codici binari che si traducono in codici ASCII che si traducono in simboli grafici sullo schermo.

contrassegniamo i luoghi e le persone presenti su una foto che condividiamo sui social. Il social tagging può interessare anche il contenuto di testi e manifestarsi in superficie, come avviene per esempio con l’uso dei simboli @ e #. IL # (CANCELLETTO O HASHTAG) Venne usato per la prima volta nel 2007 su Twitter ed è un’innovazione nata dal basso, per favorire la reperibilità di tutti i messaggi con lo stesso argomento, poi venne accolta dai gestori del sistema come strumento utile per facilitare l’indicizzazione dei contenuti. Dal 1° giugno 2009 Twitter assegna automaticamente un collegamento ipertestuale a tutti i messaggi che adoperano la medesima parola o espressione preceduta dal cancelletto. Il cancelletto si usa ormai anche in altri ambiti digitali ed è addirittura uscito dalla rete, ad esempio usato negli slogan pubblicitari, è un simbolo usato nel parlato, pubblicità progresso, campagne politiche… Funzionalità:

  • è un marcatore tematico, non occultato in uno strato profondo della codifica digitale ma visibile in superficie e gestibile anche da utenti comuni.
  • la sua portata è la stringa di testo che lo segue, non separata da spazi grafici. In testi lunghi la posizione della sequenza contenente l’# è libera, ma più frequentemente è collocata all’inizio o alla fine del messaggio.
  • si integra parzialmente con la catena sintagmatica della frase (è inserito nel testo, contrassegna il tema di un testo, a volte indica il tono del testo o il suo argomento principale, ma modifica le convenzioni di scrittura)
  • per piegarsi alla logica del linguaggio della macchina, l’uso dell’# modifica le convenzioni di scrittura e contribuisce a riorganizzare il testo secondo la logica del database. Altre funzioni:
  • può avere valore performativo e identitario che la stringa contenente il simbolo può assumere (slogan, petizioni o campagne di opinione), ad es. #iovotono
  • può segnalare il rema (ciò che di nuovo dico sul tema) dell’enunciato o servire da commento al messaggio.

Compiti dell’#

  • funzione di metadato, in quanto consente l’indicizzazione per tema di messaggi appartenenti a un più ampio flusso discorsivo
  • funzione di marcatore della struttura tematica dell’enunciato (segna il tema o il rema)
  • funzione di segnale metadiscorsivo, in quanto il suo impiego determina, di là dal contenuto del messaggio, un commento o uno schieramento all’interno della comunità virtuale di riferimento. IPERTESTI COME SCRITTURE DISCONTINUE Gli ipertesti sono scritture che si sviluppano in verticale e sono scritture discontinue e multilineari, rispetto al testo tipografico. Questa caratteristica è ancora più evidenziata da alcuni accorgimenti che finiscono per far assomigliare le unità informative di cui si compone il testo ai campi di un database Es. le e-mail, ho campi differenti (destinatario, oggetto, testo, allegati) e altre informazioni possono essere automaticamente inserite nel programma (mittente, data e ora...). un altro esempio è quello di mandare insieme all’abstract di un saggio scientifico o altro delle parole chiave che indicano il tema. Anche la recensione online su una struttura turistica o su un ristorante… abbiamo per esempio il campo degli elementi positivi, di quelli negativi, della pulizia…campi già impostati. Queste innovazioni che abbiamo visto sono solo apparentemente marginali, incidono sulle convenzioni di strutturazione del testo (vengono rimosse molte parti come i connettivi…). Il testo non appare più come Textus (tessuto) in cui le parti sono tutte collegate e intrecciate tra loro, ma il testo digitale è costruito su principi diversi.

Esempi: tweet di Michela Murgia diapositiva 33: nonostante sia un testo più lungo e complesso dei soliti su Twitter, rimane incomprensibile senza il link che rimanda all’articolo completo. Esempio 2: senza gli hashtag non avremmo nemmeno idea di quello di cui stiamo parlando Esempio 3: post su Instagram, il contesto è fondamentale per capirlo. Sui testi sui social vengono meno le barriere tra il cotesto (ciò che sta intorno all’enunciato) e il contesto (coordinate spazio-temporali dell’enunciato). la categoria di senso dell’enunciato deve essere ristabilita, da cosa dipende in un testo online? I vari studiosi individuano diversi limiti di questa organizzazione del discorso:

  • Antonelli 2016: ciò che rende i testi digitati diversi dai testi scritti tradizionali è la loro frammentarietà. Non sono solo brevi, ma anche incompleti: singole battute di un testo molto più ampio costituito dall’insieme del dialogo a distanza.
  • Raffaele Simone 2012: si tratta piuttosto di non testi: frasi brevi, storie, citazioni, battute, barzellette, motti celebri, volgarità, commenti liberi e stupidaggini a cascata.
  • Tavanis e Bonomi 2011: le analisi sintattiche dei messaggi sui social media: in Twitter e Facebook i periodi sono prevalentemente monoproposizionali. La lunghezza media dei periodi postati su Twitter è di 11, parole mentre la lunghezza media dei periodi su carta stampata (20 parole circa) è di poco inferiore a quella dei blog a carattere informativo, questo perché c’è la necessità di attirare l’attenzione vista la varietà dei temi online. Si esprimono anche emozioni, si commentano determinati avvenimenti o si informa in maniera breve su qualcosa. Sono stati fatti molti studi su questo, in particolare sul modo in cui i politici comunicano; es. di Alfano e hanno notato che la lunghezza dei periodi è di 17 parole circa. È comunque inferiore della media dei testi scritti. Conclusioni: ci sono sicuramente dei fenomeni tipici della sintassi segmentata, tipici del parlato (dislocazioni, frasi scisse, uso del c’è presentativo…). La sintassi è quindi più simile al parlato rispetto allo scritto. Ma queste caratteristiche non vanno lette come un effetto del trasferimento dell’oralità nella scrittura ma è una verticalità prospettica; si ricorre alla modalità di costruzione dell’architettura testuale che aiuta il lettore a distinguere le informazioni in primo piano da quelle sullo sfondo (con le focalizzazioni): sia attraverso strumenti linguistici (diverse modalità di evidenziazione del tema e del rema dell’enunciato) sia attraverso strumenti non linguistici, cioè la disposizione dell’unità di contenuto nella pagina-schermo e la sua collocazione nell’architettura dell’ipertesto, per esempio nella home page o in posizione più incassata. Nel testo scritto c’è una verticalità sintattica che corrisponde a quella del contenuto, mentre nel testo digitato no: c’è la verticalità prospettica, che rimanda ad altri testi. MODULO 3 Passiamo a un modulo più tecnico

LA DIGITALIZZAZIONE DEI TESTI:

cosa succede quando vengono messi online dei testi nati in un’altra forma ovvero su carta. Quali domande dobbiamo porci? Due macro-temi: gli strumenti per la digitalizzazione di testi nati esclusivamente su carta e gli strumenti per l’analisi linguistica.

LA CODIFICA DIGITALE DEL TESTO

È la rappresentazione del testo su supporto digitale in un formato leggibile da un computer, in termini tecnici si chiama MRF Machine Readable Form: i computer memorizzano ed elaborano dati sotto forma di sequenze di due soli simboli: 0 e 1 (cifre binarie). Ogni tipo di informazione deve essere codificata in cifre binarie (codificare un’informazione significa associare a ogni unità di informazione un codice, ovvero una sequenza di cifre binarie, che la identifica in maniera univoca).

I testi per poter essere elaborati o trasmessi da un programma devono avere una rappresentazione (codifica) binaria. Slide con l’incipit di Pinocchio: se abbiamo questo testo, che tipo di rappresentazione digitale del testo vogliamo o dobbiamo dare? Quali informazioni dobbiamo avere per poterlo digitalizzare? Innanzi tutto, un’intestazione, un capitolo, il titolo e il testo (sono informazioni utile per organizzare il testo digitalizzato). Slide successiva: analisi della struttura linguistica, a seconda dell’obiettivo della codifica. La macchina deve riconoscere i caratteri, le maiuscole, i segni di punteggiatura, separare le parole, mantenere le partizioni strutturali dei testi (capitoli, paragrafi…) e eventualmente codificare contenuti utili per le indagini linguistiche (recuperabili attraverso interrogazioni complesse). Esercitazione su sketch engine. Per capire come muovermi devo stabilire l’obiettivo della digitalizzazione, per capire poi se muovermi a livello della morfosintassi, della fonetica, della semantica o della pragmatica. Quindi l’annotazione linguistica rende esplicita ed esplorabile la struttura linguistica del testo. È preferibile che la codifica sia standardizzata per facilitare la portabilità dei dati (se voglio analizzare un testo dal punto di vista morfosintattico e lo carico su sketch engine, deve essere leggibile su quel supporto). Il testo è quindi una sequenza di caratteri, ciascun carattere alfanumerico, di punteggiatura o di controllo che compone il testo deve essere rappresentato nei termini di un codice binario. Il testo digitale è un surrogato del testo originario; presenta una completa equivalenza solo dal punto di vista dei caratteri che lo compongono, ma perde alcune informazioni implicitamente veicolate dalla formattazione del testo, relative alle coordinate meta-testuali (il nome dell’autore, il titolo ecc.), la struttura e l’organizzazione testuale (la suddivisione logica in sezioni, capitoli, paragrafi ecc.). Non guadagna nessun tipo di informazione, l’informazione sulla struttura linguistica rimane implicita e nascosta (come nel testo originale) LIVELLI DI CODIFICA: sono 2:

  • codifica di basso livello (livello 0): riguarda la rappresentazione binaria della sequenza ordinata dei caratteri. Questo testo codificato al livello 0 si presenta come un manoscritto in scriptio continua.
  • codifica di alto livello: arricchisce il testo codificato al livello 0 con informazioni relative alle dimensioni strutturali (organizzazione del testo in strutture macrotestuali o articolazione del testo in strutture linguistiche). La codifica di alto livello permette di rendere esplicita qualsiasi interpretazione, anche di tipo linguistico, si voglia associare al testo. Quindi se vogliamo trascrivere un testo a partire da un manoscritto dobbiamo fare una codifica digitale di alto livello. Questa codifica rende esplicito ciò che è congetturale e implicito, con lo scopo di guidare il lettore (umano vs computer) nell’interpretazione del testo. Il compito della codifica ad alto livello è 1 - dare una forma alla sequenza dei caratteri del testo rendendo esplicita l’informazione che è veicolata attraverso convenzioni tipografiche, testuali e linguistiche (organizzazione del testo, conoscenza linguistica necessaria per la comprensione del testo e ogni interpretazione che si voglia affiancare al dato testuale), 2-tracciare sentieri di lettura all’interno del testo, 3 - rendere machine readable informazioni sul testo e tratti del testo che altrimenti non sarebbero esplorabili dal computer. Perché codificare? Un testo come flusso di caratteri e parole è una fonte di dati linguistici. Il testo è un’entità altamente strutturata nella quale i dati linguistici sono correlati secondo piani di organizzazione multipli (struttura del testo - articolazione in sezioni, capitoli o titoli-, struttura del contesto - autore, data di produzione, finalità del testo- e la struttura linguistica (implicita nel testo!!) - informazioni morfologiche, sintattiche, semantiche) La codifica di alto livello trasforma il dato testuale grezzo in fonte esplicita di informazione.