
Linguistica 5
La brevita= tratto costitutivo scrittura digitale
(limite140 caratteri fino a poco tempo Twitter)
→ costruzione telegrafica (sintassi
tendenzialmente monofrasale e parallelismo=
l’utilizzo di costrutti ellittici. Ci possono essere
delle censure esterne
ELEMENTI COSTITUTIVI DELLA
SCRITTURA DIGITALE
Es. facebook, se messaggio e lungo> oscura il
messaggio=cliccare leggere il messaggio
completo
Possiamo avere anche censure interne
→messe dall'autore stesso → l'autore si
sforza di mantenere il messaggio dentro
poche righe.
Quando non succede, l'autore> dovere di
scusarsi di questa cosa lo invita a
proseguire nella lettura=andare oltre
all'oscuramento del messaggio
Saviano Invita a leggere fino in fondo=
testo non caratteristiche di un’agenzia,
ma per ragionare serve leggere tutte le
parole.
Un altro esempio>Manzoni, finzione
narrativa origine ai promessi sposi, chiede
ai lettori se fossero in grado di resistere
lettura di tutto il manoscritto.
Tra le dichiarazioni di Manzoni e quelle di
Saviano passa:
1. Cinquantennio televisivo →
spettacolarizzazione dell’informazione →
molti trovati in questa gabbia dei pochi
secondi di durata media di una
dichiarazione (slogan, frasi fatte, battute
di spirito, etichette) →tenere viva
l'attenzione.
2. Social media → discesa vertiginosa della
soglia di attenzione media del ricevente
L’attenzione tenuta viva sempre di piu
perche
l’attenzione dura sempre di meno
(INDIPENDENT, maggio 2015: soglia di
attenzione media di chi dedica molto tempo
alla navigazione in rete >crollata dai 12
secondi del 2000> 8 secondi nel 2012).
• Brevita
• Frammentarieta
• Dipendenza dal contesto → e piu o meno
marcata; ma dire che per i testi che ci sono in
rete vengono meno le barriere tradizionali tra
il co-testo (sta intorno all'enunciato) e il
contesto ( coordinate spazio temporali della
comunicazione).
PROPRIETA' DELLE SCRITTURE DIGITALI
Con lo sviluppo dei social media=
nuova forma intertestualita esasperata..
Prada=intertestualita attiva → attiva=
rende i singoli micro testi dei frammenti
incompleti e necessariamente
dipendenti da altri micro testi per piena
interpretazione. Vengono meno serie di
elementi del testo tipo grafico.
Limiti di questa organizzazione del discorso:
1.«ciò che rende davvero diversi i testi digitati
dai scritti tradizionali> frammentarietà. Non
solo brevi, incompleti: singole battute di un
testo molto più ampio costituito dall’insieme del
dialogo a distanza> Non ipertesti, ma ipotesti
(Antonelli 2016b: 14).
2.Raffaele Simone (2012: 124) «si
tratta di non testi: frasi brevi, storie,
citazioni, battute, barzellette, motti
celebri, volgarità, commenti liberi e
stupidaggini a cascata».
3.Le analisi sintattiche dei messaggi sui
social media: (a) in Twitter e Facebook i
periodi prevalentemente
monoproposizionali> lunghezza media
dei periodi postati> Twitter è di 11,7
parole (Tavosanis2011: 209) vs
lunghezza media del periodo nella carta
stampata (20-25 parole) e di poco
inferiore a quella dei blog a carattere
informativo (19,4) (Bonomi 2011).
=ci sono temi molto vari= cercare di attirare
l'attenzione in maniera immediata. Si cerca di
esprimere emozioni o commentare di un avvenimento
in maniera immediata per poi rimandare ad un
avvenimento esterno> molte analisi sul modo in cui i
politici comunicano. Molti studiosi > lunghezza media
dei loro periodi e di 17,7 parole>molto inferiore
rispetto lunghezza del periodo nella carta stampata.
come mai i periodi su twitter e facebook sono così
brevi??
cosa possiamo dedurre?
1. Ci sono molti fenomeni tipici della
sintassi segmentaria, tipici del parlato →
dislocazioni, frasi scisse, uso del c'e
presentativo>La sintassi nei social
media> piu simile a sintassi del parlato.
non trasportiamo la lingua parlata online. →ma
modalita di costruzione del testo >aiutare
lettore a distinguere le info di primo piano da
quelle di sfondo. Tutte quelle costruzioni=
focalizzazioni> mettere a fuoco nella frase
l'elemento piu importante → come? Mettendolo
all'inizio per andare ad evidenziare il tema di
quella frase. Il contenuto del messaggio deve
essere evidente>tale strategia ripresa dal
parlato, ma non e che il parlato e trasportato in
rete.
2. Abbiamo una verticalità prospettica:
modalita costruzione dell'architettura
testuale aiuta il lettore a distinguere le
informazioni primarie da quelle sfondo: sia
attraverso strumenti linguistici sia strumenti
non linguistici= disposizione dell'unita del
contenuto nella pagina-schermo e la sua
collocazione nell'architettura dell'iper testo
La codifica digitale del testo:
→ rappresentazione del testo su un
supporto digitale in un formato leggibile da
computer> memorizzano ed elaborano
dati sotto forma di sequenze di due soli
simboli 0 e 1 ( cifre binarie)
STRUMENTI PER LA
DIGITALIZZAZIONE DEI TESTI E
L'ANALISI LINGUISTICA ( modulo 3)
Ogni tipo di informazione>codificata in
cifre binarie
• codificare informazione = associare a
ciascuna unita di informazione un
codice (sequenza cifre binarie) che la
identifica in maniera univoca
I testi per elaborati avere questa
rappresentazione binaria
Quali info vogliamo che ci siano se
vogliamo digitalizzare questo tipo di
testo?> capire quel'è l'obbiettivo della
digitalizzazione
Queste sono tutte informazioni sulla
codifica digitale del testo. Abbiamo
info sull'organizzazione del testo.
Es: immaginiamo elaborare struttura linguistica
La macchina fare quando codificare a livello
informatico un testo?
• Riconoscere caratteri, maiuscole, segni di
punteggiatura
• separare le parole
• mantenere partizioni strutturali dei testi (
capitoli, paragrafi)
• codificare contenuti utili per indagini
linguistiche ( recuperabili> interrogazioni
complesse)
Es: possiamo interpretazioni di tipo
morfosintattico, fonetico, semantico= →
l'annotazione linguistica esplicita ed esplorabile la
struttura linguistica del testo> preferibile codifica
sia standardizzata per facilitare la portabilita dei
dati (se voglio analizzare un testo da un punto di
vista linguistico ( codifica morfosintattico), devo>
maniera standardizzata= se lo carico su sketch
engine leggibile
Ci sono standard di riferimento> dicono che i testi
essere costruiti in quel modo per essere
portabili=leggibili su piu supporti.
Deve essere
un surrogato parziale del testo originario
• completa equivalenza solo dal punto di vista dei
caratteri che lo compongono
• perdita di informazione
l’informazione implicitamente veicolata dalla
formattazione del testo relativa a:
• le coordinate meta-testuali
• il nome dell’autore, il titolo, ecc.
• la struttura e organizzazione testuale
• la suddivisione logica in sezioni, capitoli, paragrafi
• nessun guadagno di informazione
l’informazione sulla struttura linguistica rimane
implicita e nascosta (come nel testo originale)
due livelli di codifica del testo digitale
la codifica digitale del testo
codifica di basso livello (livello 0)=
rappresentazione binaria sequenza
ordinata dei caratteri
codifica di alto livello; arricchisce il testo
codificato al livello zero> informazioni a
dimensioni strutturali; organizzazione del
testo in strutture macro testuali;
articolazione del testo in strutture
linguistiche
La codifica di alto livello trasforma dato
testuale grezzo> fonte esplicita di
informazione → Definizione vocabolario lingua
italiana
Informazione: notizia, dato o elemento>avere
conoscenza piu o meno esatta di fatti,
situazioni, modi di essere.
Dato: cio immediatamente presente alla
conoscenza, prima di ogni elaborazione; (in
informatica) elementi informazione costituiti
simboli essere elaborati.
DATO VS INFORMAZIONE
la codifica di alto livello=rendere esplicita
qualsiasi interpretazione, anche di tipo
linguistico, si voglia associare al testo
Il testo codificato al livello 0= manoscritto
in scriptio continua → no interruzione
La codifica di alto livello rende esplicito
cio che e congetturale e implicito> scopo
guidare il lettore (umano vs computer)
nell’interpretazione del testo
Compito della codifica di alto livello
• Dare forma alla sequenza dei caratteri del
testo> esplicita l'informazione che e veicolata
attraverso convenzioni tipografiche, testuali e
linguistiche
-informazioni sull'organizzazione del testo (titoli,
paragrafi)
-La conoscenza linguistica necessaria per la
comprensione del testo
-piu in generale ogni interpretazione che si
voglia affiancare al dato testuale
• tracciare “sentieri” di lettura all’interno
del testo
• rendere machine readable informazioni
sul testo e tratti del testo che altrimenti
non sarebbero elaborabili dal computer
PERCHE' CODIFICARE?
Il testo e un entita altamente strutturata, nella
quale i dati linguistici sono correlati secondo
piani di organizzazione multipli
• struttura del testo
l’ articolazione in sezioni, capitoli, titoli, ecc.
• struttura del contesto
l’autore, la data di produzione, la finalita del
testo, ecc.
• struttura linguistica (implicita nel testo!!)
informazioni morfologiche, sintattiche,
semantiche
1. La gerarchia dell’informazione
I dati no significato intrinseco a
meno di non inserirli in schema o
struttura che li organizza e li
trasforma in informazione
La codifica di alto livello= rendere
espliciti e accessibili al computer i
livelli di organizzazione strutturale
di un testo e trasforma fonte di
informazione linguistica
Per prima cosa bisogna
1.Individuare il livello di info da codificare
1. Strutturale, linguistica
2. la codifica esplicita di informazione
linguistica> detta annotazione del testo
(morfologico, sintattico, semantico )
2. Definire il repertorio dei tratti giudicanti
rilevanti per la codifica
• Es: codifica morfo- sintattica
Oggetto: codificare la categoria grammaticale
e le proprieta morfologiche delle parole di un
testo
Bisogna definire quali attributi codificare (
cat. Grammicale → genere, persona,
numero) , quali valori avere i diversi attributi (
numero=sing,plur/ caso= Nominativo,
genitivo)
Schema di codifica
• un repertorio di categorie per la codifica, corrispondenti
alla tipologia dei tratti da rappresentare nel testo
generalmente nella forma di attributi e loro possibili
valori
• la definizione delle regole di compatibilita tra
categorie
es. l’aggettivo no attributo di persona, o un nome
quello di tempo
• la specifica accurata dei criteri di applicazione al
testo delle categorie selezionate
Schema di annotazione linguistica → codifica di
informazione linguistica
Uno schema di codifica (annotazioni)= definisce
contenuto linguistico dell’annotazione, no modo in cui
la codifica è proiettata sul testo
Formato solo testo (plain text o txt)
• un file solo testo= una sequenza di bytes
dove ciascun byte= un carattere secondo un
particolare codice
• gli editori di testo= programmi> creare e
leggere files di tipo solo testo
FORMATI DIGITALI
Emacs, Blocco Note, ecc.
quando un editore di testo legge un file=
associare ogni sequenza di bits a un
carattere secondo un particolare codice
Vantaggi
1.formato “aperto”, indipendente dal sistema
operativo e dal programma che lo ha creato
2.massima portabilita e interscambiabilita dei
testi
Svantaggi
1.no rappresentare aspetti relativi alla codifica
di alto livello
2.minima espressivita
Formati “proprietari” (doc, pdf, ecc.)
• essere creati, letti e interpretati solo da
specifico programma (es. Word, Adobe)
• oltre a sequenze di bits codificano
caratteri, il file>sequenze binarie
corrispondono a istruzioni di
formattazione, codificate secondo le
convenzioni di un certo programma
Vantaggi
• massima capacita espressiva e fruibilita per
l’utente umano
• rappresenta aspetti relativi codifica di alto livello
• ma solo per quanto riguarda la struttura testuale!!
Svantaggi
• formato “chiuso” minima portabilita e
interscambiabilita
• codifica no categorie testuali “astratte”, ma
modalita di visualizzazione
• le informazioni linguistiche comunque implicite nel
testo
Codifica di alto livello con linguaggi di
mark-up (linguaggi di marcatura)
• dal punto di vista del formato digitale un
testo codificato con un linguaggio di
marcatura= formato solo testo
• l’informazione strutturale rapp attraverso
l’aggiunta al testo di etichette di marcatura
UNA POSSIBILE ALTERNATIVA: I
LINGUAGGI DI MARCATURA
sequenze di caratteri visibili secondo
una convenzione standard, intercalati nel
testo precise regole di combinazione
“marcano” blocchi di testo> viene
assegnata determinata interpretazione
Vantaggi
• portabilita e interscambiabilita dei testi
codificati
• massimo grado di espressivita
• e possibile esprimere aspetti della
codifica di alto livello, compresa
l’informazione linguistica
TIPI DI MARCATURA DEL TESTO
1. Marcatura procedurale (tipografica)> serie di
istruzioni operative= forniscono specifiche di
formattazione e impaginazione del testo per la
visualizzazione e la stampa ( Es: RTF, TeX)
2. Marcatura dichiarativa (descrittiva) →codici di
marcatura indicano funzione assolta al blocco
di testo a cui si riferiscono=titolo, paragrafo,
nota. senza fornire indicazione>come tali
elementi del testo apparire fisicamente sulla
pagina o video ( es: SGML, XML)
>basata sull’aspetto
• ad ogni elemento del documento associata la procedura
per visualizzarlo in maniera voluta: font, dimensione,
corsivi, grassetti.
Marcatura procedurale
dipendente dal sistema
• ogni sistema di visualizzazione impone regole e
propria sintassi
associata agli individui
• ogni elemento possiede proprie procedure per
visualizzazione> anche essere diverse anche per
elementi dello stesso tipo.
non contestuale
• le regole di visualizzazione non dipendono dal
contesto in cui fatte, ma ognuna specie a se
• no possibile porre vincoli sulla "correttezza" di un
documento.
Marcatura dichiarativa
basata sul ruolo
• di ogni elemento descritto il ruolo all’interno del testo,
piu che regole per visualizzazione
indipendente dal sistema
• poiche
il markup descrittivo assegna ruoli agli elementi
del testo, questi intrinseci agli elementi stessi, e non alle
funzionalita disponibili nel sistema di visualizzazione
contestuale
• con il markup descrittivo= definire regole che
permettano o impediscano l’assegnazione ruolo ad un
elemento del testo a seconda del contesto
• e possibile specificare regole di correttezza sui
documenti, > un'immagine segua necessariamente una
didascalia, ecc. Vantaggi
1. facilita nella creazione: l’autore si concentra ruolo
organizzativo singole parti di testo, piuttosto che
aspetto stampato
2.indipendenza dalla formattazione: riformattare un
documento nuove regole= ricodificare parametri
esterni, non modificare il testo codificato
2. flessibilita: riusare testo codificato nuovo contesto e
facile= no necessario rimuovere vecchia
informazione per far posto alla nuova
3. visioni di documenti dinamicamente riconfigurabili: e
possibile selezionare viste diverse dello stesso
documento
=insieme di convenzioni per la marcatura
di testi
COS'E' UN LINGUAGGIO DI
MARCATURA?
anche marcatura ( etichettatura) di
documenti>permette rendere esplicita
un'interpretazione di un testo.
• Storicamente → annotazioni in testo
che descrivono tipografo come stampare
o comporre parte di un testo
• Oggi → qualsiasi tipo di codice inserito
in un testo in forma elettronica
=linguaggio di marcatura (no metalinguaggio)
• Definito in termini di SGML
• Insieme di etichette prefissato
La marcatura non denota il significato= struttura
logica di un documento.
Viene studiato espressamente per il web
Collegamenti ipertestuali, immagini, marcatura
finalizzata presentazione documento come pagina
Web.
No legame tra marcatura e tipi di informazione del
documento
Esempio : HTML – Hypertext markup language
La marcatura dettata dalla struttura logica del documento.
L'insieme di etichette puo cambiare in base all'applicazione.
usato il concetto di tipo di documento
• Specificato attraverso Document Type Definition o DTD (parte
dello standard XML)
• Permette imporre al documento certa struttura (come si
compongono le sue parti)
E' un naturale successore di HTML come linguaggio per il Web
• Piu espressivo e flessibile
• Per visualizzazione>una descrizione a parte con un altro
linguaggio (XSL)
XML – Extensible mark-up language
Ma per lo stesso documento XML e possibile definire piu
visualizazione