Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Concetti di ipertestualità e testualità nella comunicazione scritta, Appunti di Elementi di Informatica

I concetti di ipertestualità e testualità, partendo dalla concezione di testo sacro e arrivando ai testi digitali. Vengono distinte diverse tipologie di testi in base alla loro funzione, come descrittivi, narrativi, informativi e argomentativi. Viene inoltre introdotta la nozione di ipertesto, un insieme di materiali interconnessi in modo complesso, e vengono discusse le implicazioni della digitalizzazione dei testi. Infine, si parla della creazione di un corpus di testi e dell'annotazione del testo.

Tipologia: Appunti

2019/2020

Caricato il 07/05/2020

Utente sconosciuto
Utente sconosciuto 🇮🇹

1 / 30

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Laboratorio di informatica
PROF SILVIA LATTERIO
Prima audio lezione a distanza
INFORMATICA MODULO B.
PERCHè UN LABORATORIO DI INFORMATICA? Perché è scritto nel decreto della classe delle lauree nelle
scienze della mediazione linguistica. All’interno di questo documento sono elencati gli obbiettivi formativi
qualificanti, quindi le competenze che devono avere i laureati in scienze della mediazione linguistica
(competenze diverse da quelle degli studenti di altri corsi di laurea). Tra gli obbiettivi ci sono:
 Studio di 2 lingue + relative culture
 Competenze giuridiche, economiche, storiche, politiche, letterarie, socio-antropologiche
1. Fonti primarie: decreto ministeriale
2. Fonti secondarie: statuti (come quello della nostra università) e leggi
3. Fonti terziarie: usi e consuetudini
Art. 33-34  principio di libertà di insegnamento e l’obbligo scolastico.
Nel decreto ministeriale c’è scritto che le competenze sopra elencate si devono affiancare all’utilizzo di
strumenti per la comunicazione nella gestione dell’informazione. Inoltre, elenca le attività formative
indispensabili che coprono un totale di 10 cfu in questi crediti rientrano, oltre alle attività di tirocinio,
anche le abilità informatiche.
DR (decreto del rettore) nel maggio del 2012 ha recepito la certificazione delle competenze informatiche.
Ogni università ha il proprio statuto e quindi stabilisce dei propri obbiettivi\missione. Al titolo 1° dello
statuto si trova l’obbiettivo principale dell’università; la vocazione dell’UNISTRASI è quella di ateneo
internazionale.
(art.3 importante).
Le tecnologie devono essere distinte dalle tecniche:
 Tecnologie: sono l’apparato di strumentiteorico (strumenti che supportano le tecniche) esse sono
indipendenti, vengono prima delle tecniche.
 Tecniche: sono il modo in cui si mette in pratica una tecnologiapratico (procedure concrete\operative
grazie alle quali le tecnologie si mettono in atto) le tecniche non sono autonome, e sussistono solo in
quanto operazione applicativa della tecnologia.
Nel DR c’è scritto che l’università si occupa di favorire la diffusione delle tecnologie digitali (digitale: relativo
all’informatica)
[Digitale: (aggettivo) deriva dalla parola inglese “digit” = “cifra” rimanda direttamente all’informatica.
Digitare: (verbo) deriva dal latino “ditus” = “dito” e significa “scrivere qualcosa battendo le dita su una
tastiera”]
Art.24 c.12-G1 dello statuto UNISTRASI, si parla del DADR (leggilo).
[IMPORTANTE: domanda d’esame con quale modalità troviamo, inserite all’interno del corso di laurea, la
certificazione delle competenze informatiche? La certificazione delle competenze è stabilita per legge!!]
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Anteprima parziale del testo

Scarica Concetti di ipertestualità e testualità nella comunicazione scritta e più Appunti in PDF di Elementi di Informatica solo su Docsity!

Laboratorio di informatica

PROF SILVIA LATTERIO

Prima audio lezione a distanza INFORMATICA MODULO B. PERCHè UN LABORATORIO DI INFORMATICA? Perché è scritto nel decreto della classe delle lauree nelle scienze della mediazione linguistica. All’interno di questo documento sono elencati gli obbiettivi formativi qualificanti, quindi le competenze che devono avere i laureati in scienze della mediazione linguistica (competenze diverse da quelle degli studenti di altri corsi di laurea). Tra gli obbiettivi ci sono:  Studio di 2 lingue + relative culture  Competenze giuridiche, economiche, storiche, politiche, letterarie, socio-antropologiche

  1. Fonti primarie: decreto ministeriale
  2. Fonti secondarie: statuti (come quello della nostra università) e leggi
  3. Fonti terziarie: usi e consuetudini Art. 33-34  principio di libertà di insegnamento e l’obbligo scolastico. Nel decreto ministeriale c’è scritto che le competenze sopra elencate si devono affiancare all’utilizzo di strumenti per la comunicazione nella gestione dell’informazione. Inoltre, elenca le attività formative indispensabili che coprono un totale di 10 cfu in questi crediti rientrano, oltre alle attività di tirocinio, anche le abilità informatiche. DR (decreto del rettore) nel maggio del 2012 ha recepito la certificazione delle competenze informatiche. Ogni università ha il proprio statuto e quindi stabilisce dei propri obbiettivi\missione. Al titolo 1° dello statuto si trova l’obbiettivo principale dell’università; la vocazione dell’UNISTRASI è quella di ateneo internazionale. (art.3 importante). Le tecnologie devono essere distinte dalle tecniche:  Tecnologie: sono l’apparato di strumentiteorico (strumenti che supportano le tecniche) esse sono indipendenti, vengono prima delle tecniche.  Tecniche: sono il modo in cui si mette in pratica una tecnologiapratico (procedure concrete\operative grazie alle quali le tecnologie si mettono in atto) le tecniche non sono autonome, e sussistono solo in quanto operazione applicativa della tecnologia. Nel DR c’è scritto che l’università si occupa di favorire la diffusione delle tecnologie digitali (digitale: relativo all’informatica) [Digitale: (aggettivo) deriva dalla parola inglese “digit” = “cifra” rimanda direttamente all’informatica. Digitare: (verbo) deriva dal latino “ditus” = “dito” e significa “scrivere qualcosa battendo le dita su una tastiera”] Art.24 c.12-G1 dello statuto UNISTRASI, si parla del DADR (leggilo). [IMPORTANTE: domanda d’esame con quale modalità troviamo, inserite all’interno del corso di laurea, la certificazione delle competenze informatiche? La certificazione delle competenze è stabilita per legge!!]

TIC le Tecnologie dell’Informazione e della Comunicazione, sono un insieme di competenze che l’UE ci dice che gli studenti di oggi devono acquisire. “informazione” fa riferimento all’informatica, la “comunicazione” richiama internet.

  1. Informazione = tipo di conoscenza\contenuto che è potenzialmente comunicabile (insieme di conoscenze comunicabili, insieme con gli elementi con cui essa è strutturata i dati)
  2. Comunicazione = presuppone un’informazione, non si può comunicare senza un’informazione (insieme di dati organizzati in conoscenza). Essa è, quindi, il passaggio dell’informazione tra due soggetti tramite un canale materiale (in questo ambito, i due soggetti non devono essere necessariamente 2 esseri umani, ma possono essere anche un computer ed un essere umano, o 2 computer). Essa presuppone che ci sia: o Un’origine o Un mezzo = canale di trasmissione o Destinatario Ma presuppone, anche che, chi emette l’informazione utilizzi un linguaggio comprensibile a chi lo ricevano (i 2 soggetti devono condividere lo stesso linguaggio). COMPUTER E APPRENDIMENTO. Il computer ha fatto il suo ingresso nell’apprendimento come “macchina per insegnare”; si creavano dei video contenenti delle informazioni, molto dettagliate, organizzate per categorie che venivano sottoposte agli studenti, che vedevano passivamente scorrere in sequenza le slides contenenti le informazioni. L’alunno aveva un ruolo passivo e poteva solo recepire le informazioni senza nessuna interazione. Si parlava, quindi, di macchina per insegnare. Successivamente si parla di computer come macchina per pensare; il computer non era più un contenitore di conoscenze, ma lo studente doveva rivestire un ruolo attivo è stato introdotto l’insegnamento della programmazione, quindi lo studente deve essere in grado di programmare e parlare il linguaggio dei computer. Sono gli anni in cui si introduce nelle scuole l’insegnamento del “basic” e del logo del “MIT” di Boston. Ruolo attivo dello studente. Vengono inseriti suits di programmi come Excel, Powerpoint, ecc. -anni ’60, USA Si inizia a parlare di comunicazione, condivisione di dati fra computer. -anni ’70 in Gran Bretagna. -1982 La prima definizione di Internet; l’Italia è uno dei primi paesi al mondo a connettersi a internet. -1990 nasce Il WWW (world, wide, web) al CERN di Ginevra. -Fra gli anni ‘80 e ’90 si ha il passaggio dall’web 1.0 al 2.0, ciò che cambia tra queste due è “internet”, prima si hanno delle reti in grado di trasmettere dei dati e poi si passa alla comunicazione = computer come strumento per comunicare. Oggi siamo nel web 3.0 quindi non solo internet, ma abbiamo a disposizione altri servizi che nel web 2.0 non c’erano geolocalizzazione, realtà aumentata, ecc. Con questa fase ci avviciniamo all’interattività e all’ipermedialità delle attività su internet. Con l’arrivo di internet si ha l’abbattimento dei costi della rete e lo sviluppo di una nuova dimensione autorialechiunque può produrre contenuti per il web, anche senza la necessità di avere competenze informatiche (programmare, ecc.). Ciò si connette con un’altra delle competenze, che ci suggerisce l’UE, che è la “life long learning” = “l’apprendimento lungo il corso della vita”. L’UE suggerisce di sfruttare le risorse della rete, in particolare quando si parla di questa competenza, ci si riferisce al fatto che non è con il titolo di studio che si deve smettere di apprendere (anche una volta che si è formati, non dobbiamo smettere di imparare).

c. fornisce, utilizza e rende accessibili, sia pubblicamente che privatamente, servizi di alto livello che poggiano sui differenti strati di comunicazione e di infrastrutture a esse correlate. Seconda lezione in classe L’informatica oggi è una disciplina trasversale poiché abbraccia e tocca contenuti anche di altre materie. Il motivo legislativo per cui siamo tenuti a fare questo esame, detenuto dallo statuto della nostra università. Le Tic (tecnologia, informazione e comunicazione) CONDIVISIONE Condivisone  passaggio da file a cloud (spazio digitale che ci serve per archiviare i documenti). Il computer fa la comparsa nelle nostre abitazioni in maniera massiccia tra gli anni ’90 e l’inizio del nuovo millennio, è possiamo dire che è un personal computer  macchina personale ma è soprattutto uno spazio di archiviazione (magazzino dove conservare documenti e immagini, file musicali ecc.)  quindi possiamo dire che il computer si diffonde alla fine degli anni ’90 come spazio di archiviazione. Questa concezione di personal computer sta scomparendo per lasciare spazio alla dimensione del WEB. Oggi i computer e i devices che abbiamo a portata di mano servono per lo più a fruire dei servizi in rete. I computer personal servivano per far girare dei software, dei programmi che oggi sono sostituiti dalle Webapp , le applicazioni del telefono. All’inizio del millennio gli utenti pensavano a come organizzare lo spazio digitale in cartelle e in file. Si cercava di capire come funzionava il file-sistem. Oggi siamo ignari di come funziona lo spazio di archiviazione dei nostri device, spesso sottoscriviamo contratti che non leggiamo nemmeno. Quando un servizio è completamente gratuito la merce siamo noi, i nostri dati e comportamenti. È cambiata la percezione per il quale si adoperava il computer anche offline, internet si fluiva in maniera parzializzata a causa della percezione di internet 56k. Internet illimitato è una cosa che non era assolutamente scontata fino ad una decina di anni fa. L’organizzazione del computer in cartelle, sottocartelle, directory e file rispecchiava l’idea di scrivania in ufficio.  organizzazione in cartelle. Computer come nuova macchina d’ufficio. La trasposizione della disposizione di ufficio perde di significato. Su internet si parla piuttosto di servizi e funzionalità. Uno dei servizi più diffusi è quello del cloud (spazio di archiviazione al di fuori del dispositivo). Si potrebbe pensare che oggi, nella nostra città basata sul capitalismo (scambio della merce, dove ogni cosa ha un prezzo), siano scomparse le forme di condivisione gratuita basata sulla reciprocità. Ma possiamo vedere che ci sono diversi esempi in questo senso ci vengono proprio dalla rete: abbiamo fenomeni come il file celle, open-sorse, trasmissione di saperi pire to pire  sono tutte evidenze della sopravvivenza di quello che Morse ha studiato in maniera sistematica per prima  cioè il concetto antropologico di dono.

La trasmissione di saperi pire to pire è la trasmissione di conoscenze da pari a pari, ciò che avviene nelle chat, nei forum. Un altro esempio di condivisione gratuita che la rete ci offre è Wikipedia  enciclopedia online all’interno della quale troviamo le informazioni più svariate online. Le voci di Wikipedia vengono scritte dagli utenti in maniera anonima. questo fatto è molto significativo da un lato, però nello stesso momento possiamo dire che è improponibile se si vuole usare questa come fonte autorevole. Parlando dell’evoluzione del ruolo del computer nella didattica abbiamo visto che la scuola e l’università sono cambiate nel corso del tempo. A cavallo delle due guerre la scuola e l’università erano depositare di un sapere, nozione che rimanevano oscure alla maggior parte della popolazione ci si istruiva per accedere a delle informazioni che altrimenti sarebbero rimaste precluse. Le accademie erano elitarie, riservate per pochi. Oggi il ruolo della scuola non è più questo, perché i contenuti e le informazioni sono alla portata di tutti e le conoscenze ci vengono dappertutto. Oggi abbiamo il problema opposto, siamo cioè circondati da troppi dati. Ha ancora senso istruirci perché dobbiamo imparare a discernere la bontà delle informazioni, studiamo per capire quali sono quelli validi e attendibili. L’autorevolezza e l’attendibilità delle fonti. Wikipedia è uno dei luoghi dove è bene diffidare delle informazioni che troviamo, perciò dobbiamo metterle in dubbio e verificarle. Il problema principale consiste nel fatto che non sono rintracciabili gli utenti che scrivono le voci. (di solito ci sono dei passaggi prima di pubblicare un libro, che devono dimostrare l’affidabilità delle informazioni da esso contenute, ad esempio se si tratta di un libro scientifico ecc.)tutto questo in rete non avviene per cui possiamo spesso trovare informazioni che non sono affidabili. (All’esame ci sarà sicuro un esame su Wikipedia, su chi la scrive, come si usa e se si può usare quando facciamo i riferimenti bibliografiche in ambito accademico) Se l’autore non fosse rintracciabile, la fonte non potrebbe essere attendibile perché nessuno si prende la responsabilità di quello che c’è scritto. (un articolo non firmato non lo possiamo citare). I fenomeni di sopravvivenza del dono in rete sovvertono i principi mercantili della proprietà intellettuale. La conservazione dei documenti del passato (libri manoscritti e la stampa, a partire da Gutenberg), dall’introduzione in Europa della stampa a caratteri mobili avvenuta alla metà del ’15 secolo (400). Si tratta di documenti che spesso vengono digitalizzati, essi si staccano dalla loro forma materiale  questo scollamento prevede una perdita di informazioni storiche, perché i testi manoscritti tramandati a stampa potrebbero essere presi in considerazione indipendentemente dalla loro forma materiale. Chi volesse approfondire i libri antichi non deve basarsi solo sulle biblioteche digitali, ma deve risalire alla forma materiale del libro. I documenti antichi vengono spesso digitalizzati, messi a disposizione di tutti, spesso in maniera gratuita  spesso la digitalizzazione non è un’operazione neutra perché non si può digitalizzare tutto indiscriminatamente  ci sono state delle priorità ed è stata effettuata anche una selezione. Quello che abbiamo online è una selezione dei testi antichi che ci sono arrivati. Questa selezione indica il fatto che non tutto si conserverà.

momento storico o socioculturale). All’interno della dimensione sincronica la lingua si diversifica in base ad altri fattor:  Luogo  variazione diatopica  la lingua varia in base al luogo di provenienza del parlante  Livello sociale  variazione diastratica o sociale  livello sociale e di istruzione  Contesto  variazione diafasica  Mezzo di trasmissione  variazione diamesica  la marco-distinzione è tra lingua scritta e lingua orale, poi esistono dei sott-gruppi  si è parlato anche di lingua trasmessa dai media, dalla TV e dalla radio. Berruto partendo dalle variazioni linguistiche approda allo schema dell’architettura linguistica dell’italiano contemporaneo. Agli estremi opposti dei vari assi possiamo individuare dei poli (quindi si valuta un minimo e un massimo). È da intendere che non ci siano fratture all’interno dell’asse e che si passi lungo un continuum di dati da una caratteristica all’altra (quindi non c’è un italiano colto o incolto che ha solo elementi colti o incolti, nel mezzo c’è una variazione linguistica graduale.). Sull’asse della diastratia si va da un italiano colto e aulico ad un italiano incolto, mentre sull’asse della diamesia possiamo individuare il parlato e lo scritto ma ci sono delle fasi intermedie come le chat che conservano degli elementi dell’oralità. Sull’asse della diafasia andiamo da un italiano formale ad uno informale. Al centro dell’intersezione fra i vari asti troviamo l’italiano standard compreso da tutti e parlato dalla maggior parte delle persone. Sull’asse della diafasia, molto vicino all’italiano aulico possiamo notare l’italiano scientifico. La lingua burocratica o burocratese la lingua della pubblica amministrazione, questure, ambienti di polizia, uffici…

Lo standard letterario è l’italiano a cui dobbiamo puntare, italiano corretto senza troppi giri di parole. La prima regola è non scrivere buongiorno, buonasera  perché una mail è asincrona quindi dobbiamo usare l’italiano letterario standard. Il parlato colloquiale che si colloca sull’asse della diamesia verso il polo del parlato. C’è un tipo di italiano che manca in questo schema che è l’italiano digitato o e-taliano. Terza lezione in classe La dimensione diacronica ci interessa in maniera minoritaria in questa materia, mentre quello che più ci interessa è fotografare la lingua in un determinato momento, all’interno della quale noi individuiamo le variazioni della lingua. Quando scriviamo dobbiamo pensare che il nostro interlocutore non sappia nulla di quello che noi stiamo trattando.

TESTI

Che cos’è un testo? Il termine deriva dal latino texus dove l’accezione non era quella di testo in senso moderno ma ci si riferiva a qualcosa che fosse tessuto. La parola testo nel senso di successione di parole è tarda, la troviamo infatti a partire dall’età imperiale. La concezione di testo come qualcosa che viene fissato su carta in opposizione a una oralità che cambia continuamente. La nozione di testo viene riferita prima di tutto al testo per eccellenza (il testo sacro “La Bibbia” ). Inizialmente è il testo sacro. Successivamente, dopo la concezione di testo sacro abbiamo una nuova tipologia di testi che hanno necessità di essere fermata su un supporto materiale, in modo che sia certo e chi si abbia la certezza che non muti  si tratta delle leggi, le norme, le regole ... La prima caratteristica intrinseca di un testo che è l’immutabilità, cioè non cambia e possiamo considerarla un’entità autonoma. La filologia è una disciplina che si preoccupa di rendere un testo fruibile, e per fare questo ne offre una versione certificata. I testi si tramandano da una pluralità di fonti che modifica il testo ad ogni passaggio. Tipicamente ad ogni passaggio di copia, quindi possiamo dire che un testo nonostante è fermato in una sua veste muta nell’atto di copia, perché il copista interviene volontariamente o involontariamente su ciò che sta scrivendo, ricopiando. La filologia nasce proprio dall’esigenza di un avere solo un testo che sia ritenuto valido a cui possiamo riferirci.  lo scopo di costruire l’ultima volontà dell’autore (qualcuno che scrive qualcosa, la rielabora e infine sceglie la versione da rendere ufficiale). Il testo è immutabile nella sua forma stampata ed è pubblica (a causa dell’invenzione della stampa anni ‘60/’70). Testo sacro leggi  testi letterari. I test indipendentemente dalla loro struttura possono essere trattati con strumenti informatici. Come facciamo a spiegare al computer che cos’è una parola??  il computer ha bisogno di indicazioni univoche, non interpretabili e quindi in linguistica computazionale (linguistica che si

Oggi ha senso distinguere testi:  che esauriscono il proprio circuito di fruizione in rete  come le chat, tweet  testi che possono essere concepiti in digitale ma che possono percorrere un tratto di strada su carta  come le tesi (vengono concepite e codificate in digitale e poi vengono stampate) Massimo Palermo ha parlato di gradiente di digitalità –> tasso di elementi digitali dei testi. È ciò che misura se un testo è nativo digitale o immigrato. Avremo testi con un gradiente di digitalità:  nullo (testi nati prima del computer),  medio (scritti con l’ausilio di un supporto digitale ma non dissimili dal testo tipografico lineare)  le tesi  Alto  quelli concepiti per la rete e inconcepibili al di fuori della rete. Fra le caratteristiche che distinguono un testo digitale da un testo tipografico (libri gutemberghiani) è che quest’ultimo è un testo lineare, si sviluppa in una successione lineare di concetti. Anche nel testo tipografico sono presenti degli elementi che interrompono questa linearità  ad esempio le note (non dobbiamo creare le note in mezzo alla frase ma alla fine di essa), gli schemi, immagini (tutti gli apparati para-testuali, tra cui troviamo anche gli indici, biografia dell’autore, sintesi ecc.) che interrompono la lettura lineare del testo. Scrivere testi al computer consente di sovrapporre il momento di stesura e il momento di revisione, rielaborazione e modifica.  si perdono le tappe di stesura di un testo. I testi elaborati a computer e poi stampati hanno un grosso difetto che è quello di essere molto coerenti e chiare nei microcontesti (ad esempio nei paragrafi) ma sono carenti nella coesione e nella coerenza globale del lavoro (nella successione logica…)  perché si da maggiore peso alle micro-parti.

IPERTESTUALITA’

I testi non sono entità divise dagli altri testi, tendenzialmente non vivono di vita propria come lo dimostra la presenza delle note (che sono un dialogo tra un testo all’altro). I testi sono continuamente in dialogo tra di loro. Il fenomeno non è nuovo ma è nuova la terminologia che usiamo per indicarci ad essa, cioè l’ipertestualità, introdotta solo nel ‘900. L ’ipertestualità è l’influenza continua e reciproca tra testi diversi. Una delle discipline che si servono di questa caratteristica è proprio la filologia.

La parola ipertestualità nasce negli anni 60 del 900 ed è introdotta da una semiologa bulgara Julia

Kristeva che non solo introduce il termine ma postula l’esistenza di una relazione non solo

unidirezionale tra testi più recenti e testi più antichi ma a essa affianca una concezione bidirezionale  di influenza reciproca tra testi (non solo un testo scritto prima che influenza uno scritto dopo, ma anche quello scritto dopo influenza la nostra lettura di un testo più antico. L’aver letto l’Ulisse di Joice ci può far leggere con occhi diversi l’Ulisse omerico rispetto a come potevamo leggerlo una prima volta. L’ipertestualità diventa BIDIREZIONALE Ipertesti

Che cos’è un ipertesto? Daremo una definizione e poi un’altra contrastiva al testo, perché sappiamo che testo e ipertesto hanno caratteristiche contrastive e diametralmente opposte. La comunicazione prevede oltre ai soggetti che comunicano prevede una capacità di decodifica, questo implica che il ricevente svolga un ruolo attivo all’interno della comunicazione non semplicemente passivo di ricevente ma di decodifica. Lui infatti deve conoscere il codice. Nell’ipertesto il lettore è cooperativo, quindi se nel testo abbiamo solo un lettore (dove l’autore sancisce la versione del testo che ha scritto e redatto, e decide la versione che lui vuole venga pubblicata e in questo senso il lettore ha un ruolo passivo perché non può intervenire sul testo stesso, può farlo ma non ne modifica la versione pubblica), cosa che non succede nell’ipertesto dove il lettore coopera. Partiamo dalla parola hypertext  che è stata introdotta da Ted Nelson (filosofo e sociologo) che in un congresso nella prima metà del ‘900 si trovò a comunicare agli altri che cos’è l’ipertesto. Questo termine era stato cognato da lui che in un primo momento si trovava in difficolta perché era una parola nuova e avendo difficoltà a definirla e disse che poteva definirla solo per difetto nel senso che poteva dire cosa non è l’ipertesto. Cit. “mi si è consentito di introdurvi la parola ipertesto per far riferimento ad un corpus di materiali scritti o iconografici, interconnessi in una maniera così complessa che non potrebbe essere adeguatamente presentata o rappresentata su carta” L’ipertesto è un corpus, un insieme composto da più parti e da più membri scritti o iconografici che sono interconnessi, le cui connessioni non sono soltanto unidirezionali ma possono essere bidirezionali e possono addirittura saltare da un’immagine ad un testo e ad un’altra immagine e poi tornare al testo precedente e da lì possono partire altre infinite connessioni. Il testo e le immagini sono connessi in maniera molto complicata e sono anche complessi per essere rappresentati su carta. L’ipertesto è il percorso che ognuno di noi fa quando passa da pagina all’altra, è un percorso individuale che non assumerà mai una forma pubblica come il libro stampato ma che invece ha tante forme private quanti siamo noi. Le tappe saranno diverse perché anche se le parole sono le stesse saranno diverse le sequenze. Noi che andiamo avanti e indietro su queste strade non siamo più soltanto lettori perché noi non leggiamo tutto quello che c’è scritto sul post ma ne leggiamo una porzione che costituiscono il nostro personale ipertesto. Si può leggere un video secondo diverse modalità, segnaliamo per ora solo 3:  lo scimming  la lettura veloce a video nella quale gli occhi afferrano solo mucchi di parole per arrivare alla conclusione, poi se le abbiamo considerate degne possiamo tornare e leggere dall’inizio.  lo scipping  lettura per salti che non prevede di non leggere frasi o paragrafi  brausing  scorrimento veloce e il mio occhio capta una parola che mi può interessare. in tutte e tre i casi parliamo di lettura che avviene a video e ciascuno di questo caso è un tipo di lettura non continuo perché non leggiamo in sequenza tutte le parole, ma sono letture che si interrompono. Queste 3 letture non continue comportano:

  1. la perdita dei dettagli.
  2. la diversa modalità di focalizzazione dell’attenzione che non è più rivolta al concetto generale attraverso tutto il testo ma l’attenzione sarà catturata dalle parole chiave. UNA DEFINIZIONE CONTRASTIVA

Si possono effettuare diversi tipi di indagine automatica su un testo che è già in un formato digitale. I tipi di indagine che è possibile condurre su un testo informatizzato dipendono essenzialmente da due fattori:  la potenza della macchina  fattore puramente fisico. In particolar modo la RAM (?)  la mente umana  dipende dalla preparazione, dalle competenze e dagli scopi di chi effettua la ricerca. Il computer ci può aiutare tanto se usato con consapevolezza e con le antenne ritte. Il computer ci permette di svolgere delle indagini in maniera molto più rapida e molto più flessibile perché consente dei ripensamenti. Rischiamo però di perdere tempo se non razionalizziamo a priori la ricerca.

Definizione  Corpus  un corpus in linguistica è un insieme di testi o si parti di testi che assume essere

rappresentativo dello stato di una lingua o di una varietà di essa, al fine di ottenerne una descrizione complessiva. (rappresentatività- varietà) Un corpus è quindi un campione estratto da una popolazione più ampia. Questo significa che nella linguistica dei corpora alla popolazione (insieme di tutte le possibili osservazioni) il campione (una parte, una selezione). L’intera popolazione è nella linguistica dei corpora l’insieme di tutte le manifestazioni possibili e reali di una determinata tipologia testuale. Il corpus naturalmente non può ambire a raccogliere l’intera popolazione ma deve limitarsi ad una parte, ritaglio. Questa selezione avviene al fine di poter condurre sul campione una determinata indagine linguistica, analisi i cui esiti devono poter essere generalizzati quindi estesi anche alla parte che resta esclusa dal campione -> all’intera popolazione. La definizione di Freddy la possiamo raffinare dicendo che i corpus è un campione di testi e quindi lo si considera rappresentativo. Un insieme di testi che non è possibile considerarlo rappresentativo non è un corpus. Modernamente il corpus si intende sempre informatizzato i testi siano in formato digitale, in file TXT stoccati in cartelle e sottocartelle. è quindi accessibile elettronicamente e accessibile via computer. La linguistica dei corpora: problemi, questioni e metodi Caratteristiche essenziali del corpus, indispensabili che se ne viene a mancare anche solo uno non possiamo parlare di corpus (esempio un insieme di testi non rappresentativo non è un corpus) e sono:

  1. l’autenticità  sono autentici gli esempi dell’uso linguistico attestati che si sono effettivamente verificati e non artificiosamente inventati in laboratorio da un linguista per illustrare un determinato fenomeno della lingua. Il problema più grande rimane quelli che sono i testi orali poiché è difficile acquisire una conversazione, oltre a questo abbiamo anche difficolta nell’ottenere permessi per l’utilizzo della proprietà intellettuale non è i vicoli imposti dalla privaci. Per questo quando si crea un corpus si ricorre a metodi di raccoglimento dei dati che sembrerebbero mettere in discussione l’autenticità. Queste limitazioni non alterano la definizione del corpus come raccolta di dati autentici.
  2. Rappresentatività e campionamento  bisogna qui distinguere tra il corpus di una lingua viva e parlata che è infinita perché ogni giorno produciamo dati linguistici sia orali che scritti. Si potrebbe pensare di allestire un corpus che comprenda tutti i testi di una lingua morta come il latino, a meno che non si voglia includere interventi contemporanei che ci sono in lingua latina. La natura stessa di lingua viva fa si che i confini siano sfumati e non definibile. Il campionamento dei testi è quindi un’azione indispensabile, necessaria. Anche

la selezione del materiala da includere e da escludere dal campione nel progetto deve avvenire secondo dei criteri che siano adeguati alla popolazione che si intende studiare  deve rifletterne delle caratteristiche. Per comporre un corpus si pone anche la questione della quantità e della proporzione di testi (nella sua interezza o solo alcune proporzioni) da includere nella tipologia di testi scelti. Il campionamento  le porzioni o i testi da includere nel corpus possono essere effettuate anche casualmente. Quando si parla di ampiezza del corpus ci si riferisce alla lunghezza espressa in numeri di parole. Alla seconda dell’indagine il corpus andrà bilanciato. Un corpus è rappresentativo solo se è bilanciato e equilibrato nell’attingere le diverse tipologie di testo, poiché deve rappresentare nello stesso modo tutti i testi che abbiamo deciso di includere. Il campionamento non è un procedimento scientifico in senso stretto però deve poter rendere il corpus maneggiabile. Informatizzazione e la rappresentazione dei dati linguistici. La rappresentazione dei dati dei testi si presuppone avvenga in maniera digitale. La fase iniziale in cui si riflette su cosa e come è fondamentale. Interrogare un corpus non può essere un’azione passiva di digitare una sezione di parole, ma dev’essere un’operazione sapendo come quel corpus è stato allestito, quindi anche che cosa ci possiamo aspettare di trovare in quel corpus. Nell’allestire un corpus il primo problema che scontriamo è la codifica informatica dei corpus ruolo svolto da chi fa il corpus con il computer (il quale deve riconoscere i caratteri ad esempio gli accenti o l’uso delle maiuscole). Il software con il quale dobbiamo realizzare il corpus deve essere in grado di realizzare queste funzioni. Questi contenuti comprendono un’analisi interpretativa di tipo morfosintattico, fonetico ma anche semantico sulla lingua. È preferibile che la codifica sia standardizzata o universale per rendere il lavoro più facile. Chi costruisce un corpus è necessario che si ponga preliminarmente dei quesiti, per cui quel corpus viene allestito. (quali testi includere) dovremmo procurarci un testo filologicamente affidabile, eliminare i commenti, potremmo creare delle cartelle e all’interno possiamo un file TXT contente i diversi canti ad esempio. Un corpus non è semplicemente un insieme di testi, ma deve essere annotato (che contenga dei tag), che è stato lemmatizzato. Il livello di annotazione presuppone una riflessione grammaticale, sintattica, semantica sulle parole della lingua. Deve ritenere delle marcature informazioni aggiuntive che accompagnano le parole, le affermazioni e che servono da aggancio pe recuperare quel informazione grammaticale, sintattica o lessicale. Un semplice testo digitalizzato è un corpus grezzo che si oppone un corpus annotato.

  1. Dobbiamo dare un nome ai file per capire qual è il contenuto di esso.  prima rudimentale forma di annotazione L’annotazione è quell’attività preliminare che costituisce uno dei primi passi nell’allestimento di un corpus che consente di allestire i dati grezzi, cioè la successione di parole. Annotare il testo significa aggiungere al testo stesso dei metadati (informazioni in più di natura grammaticale, semantica e lessicale alle parole contenute nel file). Questi metadati dovrebbero essere forniti secondo uno standard, condivise da chi allestisce gli alti corpora per facilitare la portabilità.

La lemmatizzazione include un’analisi grammaticale che sarà tanto più rilevante quanto più morfologicamente complessa una lingua è. Un corpus più fittamente e più dettagliatamente annotato è quanto più utile quanto più è flessiva una lingua. L’operazione di arricchire i dati di metadati non avviene solo sul testo ma anche su ogni contenuto e oggetto digitale presente sulla rete. La lemmatizzazione può essere di tre tipi:  manuale interamente manuale il margine di errore si riduce ma non scompare, lo svantaggio è che richiede molte risorse (molte persone che lavorano per molto tempo)  automatica completamente affidata al computer (si inseriscono delle regole che poi il computer automaticamente esegue come il tag in questo caso il margine di errore è elevato.  semi-automatica  quella più diffusa e prevede una prima fase automatica e una seconda fase di correzione manuale dove l’operatore che ci lavora disambigua alcuni omografi in base al contesto. L’XML  eXtensible marcat Language  scelta molto diffusa nei corpora recenti e si utilizza per rappresentare l’insieme di regole del corpus (la grammatica). Queste regole prima che siano tradotte in linguaggio informatico come ad esempio l’XML sono regole grammaticali (frutto di un analisi approfondita degli scopi della ricerca, del perché si sta allestendo quel corpus). Sono frutto di un’analisi approfondita della lingua e dei suoi modi di rappresentarla ma anche del contesto in cui la lingua scritta si trova). È opportuno che il lavoro di progettazione avvenga a monte della notazione. Questo prevedere i lemmi si traduce ad esempio in un elenco preliminare dei tag che possono essere utilizzati. Il corpus deve essere organizzato e realizzato con caratteristiche specifiche che rispondono alle domande linguistiche che ci si pone. Terza lezione a distanza Corpora e variazione linguistica. Fondamentale nell’allestire un corpora è scegliere i testi che meritano di essere inclusi in base al motivo d’indagine. Possiamo fare un corpora in un asso di tempo breve diacronico oppure in un periodo più lungo  sincronico. Possiamo effettuare la ricerca su tutto l’archivio disponibile, e in quel caso vediamo la parola che ci interessa se nel tempo varia e venga risemantizzata e se il suo significato cambi  abbiamo una prospettiva diacronica. Quando invece selezioniamo un lasso di tempo breve, inferiore ai 3 anni  abbiamo una fotografia sincronica. Oltre al tipo di indagine che può diacronico o sincronica possiamo scegliere se includere nel corpus testi orali o scritti; di registro alto o meno alto. La selezione dovrà tenere conto lungo l’asse scritto/parlato quindi la variazione diamesica che riguarda il mezzo di comunicazione attraverso il quale si trasmette la lingua. Dovremmo tener conto anche della variazione sociale, quindi esplorare distopia e la variazione geografica (dimensione diatopica) e quella del registro (diafasica formale o informale). I corpora possono essere di 2 tipi in base alle tipologie di testo che includono al loro interno:

corpora generici di riferimento  trasversali a tutte le varietà linguistiche, perciò abbracciano tutte le varietà linguistiche. In esso dovremmo trovare rappresentate varietà diafasiche, diastratiche, diatopiche e diamesiche  che caratterizzano una lingua. Questo tipo di corpora deve altresì contenere testi sia scritti che orali, letterari, scientifici, informatici… questi corpora vengono utilizzati ad esempio negli studi di genere che si trovano a metà tra analisi socio-linguistica e analisi del discorso. (sia sociologia che di lingua). Cercano di rilevare la distribuzione di frequenza delle parole in base al sesso e all’età del parlante. Uno delle domande che spesso vengono poste è l’uso di epiceni (parole uguali in tutti i generi come ad esempio “coniuge”). Qui è l ’ampiezza (il numero di parole che riescono a contenere) insieme alla gamma di tipologie di testi che costituiscono il criterio dominante della selezione dei testi stessi, ovvero a dire che un corpus generico di riferimento sarà più affidabile quanto più è rappresentativo e per essere più rappresentativo un corpus deve abbracciare un numero alto di testi.  specialistici  sono circoscritti ad un singolo genere o ad un singolo dominio di conoscenza testuale, quindi un corpus specialistico conterrà un vocabolario medico. Essi servono per studiare gli usi linguistici in relazione ai contesti comunicativi. L’interrogazione di un corpus specialistico può essere volta a isolare strutture tipiche della comunicazione specialistica come per esempio un certo uso del passivo, dei tempi … da un corpus generico di riferimento è possibile estrarre dei sotto-campioni che abbiamo le stesse caratteristiche per ambito disciplinare, per genere testuale ecc.  il corpus specialistico può essere un sottoinsieme di un corpus generico di riferimento (poiché esso possiede al suo interno diversi generi). I corpora sono molto utilizzati anche nell’apprendimento di lingue straniere. Sono stati fatti degli studi su alcuni ragazzi italofoni che studiano inglese e si è cercato ad esempio di capire gli errori che sono più frequenti. Fu allestito un corpus nell’università di Torino. È stato messo in rilievo che ci sono alcune categorie di errori che sono più frequenti legati soprattutto all’uso di sinonimi o quasi sinonimi di una particolare area semantica. (work, job); oppure l’uso di connettivi con l’usanza molto frequente di “i think” “moreover”. Individuare gli errori più frequenti permette di individuare gli argomenti su cui soffermarci, permette di mettere a punto strumenti pedagogici e metodi di apprendimento. The snipped litercy La lettura selettiva si riconnette al fatto che la ricerca automatica (il ricercare tramite la digitalizzazione di parole) consente di interrogare piuttosto che leggere i testi. Questa possibilità riguarda sia lo specialista (anche noi) che riguarda una banca dati testuale (archivio di un giornale online) ma riguarda anche l’utente comune che naviga in rete. Navigando in Internet l’utente comune arriva ai contenuti attraverso i motori di ricerca. Lo snipped letteralmente significa ritaglio, ma è il risultato che compare in seguito alla ricerca ed è importante conoscere gli elementi che lo costituiscono. Lo snipped riporta:  una breve descrizione del sito ma nello specifico è composto da tre elementi: o tag title  su cui cliccare per aprire la pagina o url  uniform risorse locator  indirizzo della pagina o meta description  descrizione della pagina lo snipped che è il motore di ricerca pesca nei tag, nella parte nascosta dell’ipertesto è parte della serp (search ingine report page) la serp è l’intera pagina dei risultati di una ricerca, che sono generalmente 10. Gli sviluppatori dei siti che vogliono apparire nelle serp combattono delle vere e proprie guerre per pubblicizzare il sito del proprio pr in modo che possono conquistare le prime posizioni della pagina perché generalmente i ricercatori non scendono più di tanto.

Sono testi argomentativi  che hanno appositamente lo scopo di sostenere una tesi, un ragionamento.

  1. Per quanto riguarda l’asse diamesico siamo appiattiti sul polo dello scritto. Infatti, la tesi è bene che non contenga forme colloquiali del parlato. (non possiamo scrivere una tesi come scriviamo una chat).
  2. Per quanto riguarda l’asse diafasico ci collochiamo in una situazione di formalità
  3. Per quanto riguarda la variazione della lingua a seconda dell’area geografica di provenienza di chi scrive, dobbiamo cercare di evitare di collocarci in una posizione diatopicamente marcata, cioè il nostro italiano reginale non deve emergere. Importante è anche la questione del registro perché non solo dobbiamo mirare ad un italiano letterario ma dobbiamo usare le forme e i metodi che sono adeguati alla tesi di laurea. Le tesi di laurea nascono come oggetti digitali perché le scriviamo al computer e il loro successivo depositarsi su un supporto materiale è per la loro vita un fatto accidentale. Questo fa si che le tesi abbiano una posizione ancipite tra un testo digitale e testo tipografico (gutemberghiane). Questa condizione delle tesi di laurea fa sì che esse ereditano sia delle caratteristiche tipiche di uno dei due che dell’alto. Le tesi che scriviamo acquistano alcuni aspetti dell’impaginazione che sono propri della forma libro (stampato gutemberghiano). Per quanto riguarda il layout/l’impaginazione la tesi è più simile a un comune libro stampato che non ad un testo digitale (ipertesti), per una lettura continuata e non a salti. Per cogliere la connessione tra la testualità breve del testo videoscritto e la logica del database che sottostà ad essa partiamo dalla codifica stessa della scrittura a video. Per entrare nelle dimensioni del monitor la scrittura ha subito dei mutamenti funzionali sia per le sue dimensioni profonde che quelle di superfice.  il monitor ritaglia una porzione del testo quindi questi mutamenti funzionali trovano la massima espressione nel frammento  la scrittura è diventata qualcosa di discreto e non è più qualcosa di continuo. Si pensi all’aspetto tecnico, la traduzione cioè in codice binario.  forme brevi per eccellenza, esso fa si che la scrittura si possa scomporre e ricomporre quindi i dati sono organizzati in maniera discreta (separati l’uno dall’altro), sono in sequenza ma sono giustapposti, non collocati quindi in un continuum. Dall’altro lato la prima evidente forma di parcellizzazione è data dalla modalità analitica della tastiera, quindi dal fatto che ogni lettera ha bisogno di un tasto diverso dagli altri e ha bisogno anche che noi pigiamo i tasti. la tastiera quindi funziona tramite una modalità discreta/analitica. Per focalizzare meglio questo si pensi al suo opposto. In opposizioni analogiche del nostro computer si pensi alle tastiere Swype che sono quelle che ci permettono di scrivere senza sollevare il dito  cercano di imitare il tratto continuo del corsivo. È stato osservato che la suddivisione in blocchi del testo attenua la percezione del testo stesso come qualcosa di unitario. Noi vediamo continuamente lo snipped del testo all’interno del monitor, perdiamo la percezione di quel testo come parte di un ulteriore testo più grande e unitario. La suddivisione in blocchi dovuta alla lettura a video accentua la dimensione del testo. La videoscrittura offre la possibilità di sovrapporre i due momenti della stesura e della revisione, perché la videoscrittura ci permette di correggere il testo mentre lo scriviamo e di spostare le parti mentre si scrive. Questa sovrapposizione consente una migliore coerenza e coesione a livello locale (all’interno del ritaglio), quindi di frase di periodo e di capoverso. Di conto la concentrazione sulle porzioni di testo che rientrano sulle unità di misura date dal testo è spesso all’origine di una minore coesione del testo videoscritto nel suo insieme, oltre i confini del paragrafo. Quarta lezione a distanza LA STRUTTURA DEL TESTO ARGOMENTATIVO

I testi che si scrivono per l’università sono le tesi e le tesine, si tratta di testi saggistici (saggi brevi) che sviluppano un argomento in modo scientifico, rigoroso e condividono le caratteristiche del testo argomentativo. Le tesi e le tesine sono testi da questo punto di vista simili per i quali si possono individuare una serie di tecniche di scrittura omogenee/uguali, che sono validi per tutti i testi che rientrano nella scrittura saggistica di tipo argomentativo. La funzione primaria del testo argomentativo è quella di sostenere un’opinione e di convincere l’interlocutore a cui ci rivolgiamo della sua veridicità, fornendo una serie di ragionamenti/argomentazioni che devono essere documentati con esempi. Un elemento determinante del testo argomentativo è il contesto, cioè proprio la presenza di un interlocutore. L’interlocutore è chiunque legge la tesi, quindi un professore, un’amica, ascoltatore, pubblico ecc. Quello a cui dobbiamo pensare mentre scriviamo la tesi è la comunità scientifica a cui ci riferiamo (il gruppo di specialisti della materia di cui ci stiamo occupando). L’interlocutore è il destinatario del messaggio della tesi, il quale deve essere convinto della veridicità delle argomentazioni. Gli elementi dai quali si riconosce un testo argomentativo (ci sono alcuni elementi particolari che ci permettono di riconoscere un testo argomentativo):  la sua struttura  se un testo è bene strutturato ed è ben scritto, gli elementi della sua struttura sono ben visibili e permettono al lettore una rapida con la quale si riesce ad individuare gli elementi fondativi del testo. La struttura stessa che deve acchiappare il lettore, catturare la curiosità e l’interesse. Attraverso la struttura emergono degli elementi logici che cominciano a convincere il lettore.  se un testo argomentativo non è ben organizzato l’interlocutore sarà già a prescindere diffidente rispetto al contenuto. Il testo argomentativo si contraddistingue per la presenza di questi elementi:  titolo  spesso si può conoscere un testo argomentativo anche direttamente dal titolo, perché esso deve costituire una sintesi estrema del testo (deve riuscire a includere più cose possibili in esso), per interessare e incuriosire il lettore. Quindi non possiamo usare titoli poco chiari, pseudo- poetiche. Non dobbiamo essere reticenti. Il titolo può coincidere con l’argomento principale. Il titolo può essere riguardante un’azione compiuta, di tipo nominale oppure con un periodo costituito da un rapporto causa effetto (ad esempio sono state recentemente trovate delle antiche navi di epoca romana e se noi volessimo scrivere un saggio su questa cosa potremmo usare come titolo “le antiche navi di Pisa”).  la premessa  essa va all’inizio della tesi ma si scrive per ultima, spesso non si medias res, quindi non si inizia nel cuore dell’argomento ma è buona norma delimitare l’ambito di indagine, contestualizzare il proprio intervento, fare un quadro storico oppure trarre spunto da un avvenimento recente che permette di introdurre, che permette arrivare dal generale al particolare. Ci vuole un preambolo.  tesi centro propulsore e dinamico del testo argomentativo. In una recensione di qualsiasi cosa (libro, film…) la tesi coincide con il giudizio di valore dell’oggetto recensito. Lo scopo del testo è dimostrare la veridicità della tesi. La tesi si espone e poi deve essere supportata la sua veridicità da argomenti e prove.  gli argomenti sono i ragionamenti, i passaggi logici attraverso cui si dipana il testo argomentativo.  prove  supportano e garantiscono la veridicità di tutto il procedimento, delle argomentazioni a supporto della tesi. Le prove possono essere di due tipi: o prove di autorità  sono affidabili in base all’autorevolezza del loro autore.