






















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
I concetti di ipertestualità e testualità, partendo dalla concezione di testo sacro e arrivando ai testi digitali. Vengono distinte diverse tipologie di testi in base alla loro funzione, come descrittivi, narrativi, informativi e argomentativi. Viene inoltre introdotta la nozione di ipertesto, un insieme di materiali interconnessi in modo complesso, e vengono discusse le implicazioni della digitalizzazione dei testi. Infine, si parla della creazione di un corpus di testi e dell'annotazione del testo.
Tipologia: Appunti
Caricato il 07/05/2020
1 / 30
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!























Prima audio lezione a distanza INFORMATICA MODULO B. PERCHè UN LABORATORIO DI INFORMATICA? Perché è scritto nel decreto della classe delle lauree nelle scienze della mediazione linguistica. All’interno di questo documento sono elencati gli obbiettivi formativi qualificanti, quindi le competenze che devono avere i laureati in scienze della mediazione linguistica (competenze diverse da quelle degli studenti di altri corsi di laurea). Tra gli obbiettivi ci sono: Studio di 2 lingue + relative culture Competenze giuridiche, economiche, storiche, politiche, letterarie, socio-antropologiche
TIC le Tecnologie dell’Informazione e della Comunicazione, sono un insieme di competenze che l’UE ci dice che gli studenti di oggi devono acquisire. “informazione” fa riferimento all’informatica, la “comunicazione” richiama internet.
c. fornisce, utilizza e rende accessibili, sia pubblicamente che privatamente, servizi di alto livello che poggiano sui differenti strati di comunicazione e di infrastrutture a esse correlate. Seconda lezione in classe L’informatica oggi è una disciplina trasversale poiché abbraccia e tocca contenuti anche di altre materie. Il motivo legislativo per cui siamo tenuti a fare questo esame, detenuto dallo statuto della nostra università. Le Tic (tecnologia, informazione e comunicazione) CONDIVISIONE Condivisone passaggio da file a cloud (spazio digitale che ci serve per archiviare i documenti). Il computer fa la comparsa nelle nostre abitazioni in maniera massiccia tra gli anni ’90 e l’inizio del nuovo millennio, è possiamo dire che è un personal computer macchina personale ma è soprattutto uno spazio di archiviazione (magazzino dove conservare documenti e immagini, file musicali ecc.) quindi possiamo dire che il computer si diffonde alla fine degli anni ’90 come spazio di archiviazione. Questa concezione di personal computer sta scomparendo per lasciare spazio alla dimensione del WEB. Oggi i computer e i devices che abbiamo a portata di mano servono per lo più a fruire dei servizi in rete. I computer personal servivano per far girare dei software, dei programmi che oggi sono sostituiti dalle Webapp , le applicazioni del telefono. All’inizio del millennio gli utenti pensavano a come organizzare lo spazio digitale in cartelle e in file. Si cercava di capire come funzionava il file-sistem. Oggi siamo ignari di come funziona lo spazio di archiviazione dei nostri device, spesso sottoscriviamo contratti che non leggiamo nemmeno. Quando un servizio è completamente gratuito la merce siamo noi, i nostri dati e comportamenti. È cambiata la percezione per il quale si adoperava il computer anche offline, internet si fluiva in maniera parzializzata a causa della percezione di internet 56k. Internet illimitato è una cosa che non era assolutamente scontata fino ad una decina di anni fa. L’organizzazione del computer in cartelle, sottocartelle, directory e file rispecchiava l’idea di scrivania in ufficio. organizzazione in cartelle. Computer come nuova macchina d’ufficio. La trasposizione della disposizione di ufficio perde di significato. Su internet si parla piuttosto di servizi e funzionalità. Uno dei servizi più diffusi è quello del cloud (spazio di archiviazione al di fuori del dispositivo). Si potrebbe pensare che oggi, nella nostra città basata sul capitalismo (scambio della merce, dove ogni cosa ha un prezzo), siano scomparse le forme di condivisione gratuita basata sulla reciprocità. Ma possiamo vedere che ci sono diversi esempi in questo senso ci vengono proprio dalla rete: abbiamo fenomeni come il file celle, open-sorse, trasmissione di saperi pire to pire sono tutte evidenze della sopravvivenza di quello che Morse ha studiato in maniera sistematica per prima cioè il concetto antropologico di dono.
La trasmissione di saperi pire to pire è la trasmissione di conoscenze da pari a pari, ciò che avviene nelle chat, nei forum. Un altro esempio di condivisione gratuita che la rete ci offre è Wikipedia enciclopedia online all’interno della quale troviamo le informazioni più svariate online. Le voci di Wikipedia vengono scritte dagli utenti in maniera anonima. questo fatto è molto significativo da un lato, però nello stesso momento possiamo dire che è improponibile se si vuole usare questa come fonte autorevole. Parlando dell’evoluzione del ruolo del computer nella didattica abbiamo visto che la scuola e l’università sono cambiate nel corso del tempo. A cavallo delle due guerre la scuola e l’università erano depositare di un sapere, nozione che rimanevano oscure alla maggior parte della popolazione ci si istruiva per accedere a delle informazioni che altrimenti sarebbero rimaste precluse. Le accademie erano elitarie, riservate per pochi. Oggi il ruolo della scuola non è più questo, perché i contenuti e le informazioni sono alla portata di tutti e le conoscenze ci vengono dappertutto. Oggi abbiamo il problema opposto, siamo cioè circondati da troppi dati. Ha ancora senso istruirci perché dobbiamo imparare a discernere la bontà delle informazioni, studiamo per capire quali sono quelli validi e attendibili. L’autorevolezza e l’attendibilità delle fonti. Wikipedia è uno dei luoghi dove è bene diffidare delle informazioni che troviamo, perciò dobbiamo metterle in dubbio e verificarle. Il problema principale consiste nel fatto che non sono rintracciabili gli utenti che scrivono le voci. (di solito ci sono dei passaggi prima di pubblicare un libro, che devono dimostrare l’affidabilità delle informazioni da esso contenute, ad esempio se si tratta di un libro scientifico ecc.)tutto questo in rete non avviene per cui possiamo spesso trovare informazioni che non sono affidabili. (All’esame ci sarà sicuro un esame su Wikipedia, su chi la scrive, come si usa e se si può usare quando facciamo i riferimenti bibliografiche in ambito accademico) Se l’autore non fosse rintracciabile, la fonte non potrebbe essere attendibile perché nessuno si prende la responsabilità di quello che c’è scritto. (un articolo non firmato non lo possiamo citare). I fenomeni di sopravvivenza del dono in rete sovvertono i principi mercantili della proprietà intellettuale. La conservazione dei documenti del passato (libri manoscritti e la stampa, a partire da Gutenberg), dall’introduzione in Europa della stampa a caratteri mobili avvenuta alla metà del ’15 secolo (400). Si tratta di documenti che spesso vengono digitalizzati, essi si staccano dalla loro forma materiale questo scollamento prevede una perdita di informazioni storiche, perché i testi manoscritti tramandati a stampa potrebbero essere presi in considerazione indipendentemente dalla loro forma materiale. Chi volesse approfondire i libri antichi non deve basarsi solo sulle biblioteche digitali, ma deve risalire alla forma materiale del libro. I documenti antichi vengono spesso digitalizzati, messi a disposizione di tutti, spesso in maniera gratuita spesso la digitalizzazione non è un’operazione neutra perché non si può digitalizzare tutto indiscriminatamente ci sono state delle priorità ed è stata effettuata anche una selezione. Quello che abbiamo online è una selezione dei testi antichi che ci sono arrivati. Questa selezione indica il fatto che non tutto si conserverà.
momento storico o socioculturale). All’interno della dimensione sincronica la lingua si diversifica in base ad altri fattor: Luogo variazione diatopica la lingua varia in base al luogo di provenienza del parlante Livello sociale variazione diastratica o sociale livello sociale e di istruzione Contesto variazione diafasica Mezzo di trasmissione variazione diamesica la marco-distinzione è tra lingua scritta e lingua orale, poi esistono dei sott-gruppi si è parlato anche di lingua trasmessa dai media, dalla TV e dalla radio. Berruto partendo dalle variazioni linguistiche approda allo schema dell’architettura linguistica dell’italiano contemporaneo. Agli estremi opposti dei vari assi possiamo individuare dei poli (quindi si valuta un minimo e un massimo). È da intendere che non ci siano fratture all’interno dell’asse e che si passi lungo un continuum di dati da una caratteristica all’altra (quindi non c’è un italiano colto o incolto che ha solo elementi colti o incolti, nel mezzo c’è una variazione linguistica graduale.). Sull’asse della diastratia si va da un italiano colto e aulico ad un italiano incolto, mentre sull’asse della diamesia possiamo individuare il parlato e lo scritto ma ci sono delle fasi intermedie come le chat che conservano degli elementi dell’oralità. Sull’asse della diafasia andiamo da un italiano formale ad uno informale. Al centro dell’intersezione fra i vari asti troviamo l’italiano standard compreso da tutti e parlato dalla maggior parte delle persone. Sull’asse della diafasia, molto vicino all’italiano aulico possiamo notare l’italiano scientifico. La lingua burocratica o burocratese la lingua della pubblica amministrazione, questure, ambienti di polizia, uffici…
Lo standard letterario è l’italiano a cui dobbiamo puntare, italiano corretto senza troppi giri di parole. La prima regola è non scrivere buongiorno, buonasera perché una mail è asincrona quindi dobbiamo usare l’italiano letterario standard. Il parlato colloquiale che si colloca sull’asse della diamesia verso il polo del parlato. C’è un tipo di italiano che manca in questo schema che è l’italiano digitato o e-taliano. Terza lezione in classe La dimensione diacronica ci interessa in maniera minoritaria in questa materia, mentre quello che più ci interessa è fotografare la lingua in un determinato momento, all’interno della quale noi individuiamo le variazioni della lingua. Quando scriviamo dobbiamo pensare che il nostro interlocutore non sappia nulla di quello che noi stiamo trattando.
Che cos’è un testo? Il termine deriva dal latino texus dove l’accezione non era quella di testo in senso moderno ma ci si riferiva a qualcosa che fosse tessuto. La parola testo nel senso di successione di parole è tarda, la troviamo infatti a partire dall’età imperiale. La concezione di testo come qualcosa che viene fissato su carta in opposizione a una oralità che cambia continuamente. La nozione di testo viene riferita prima di tutto al testo per eccellenza (il testo sacro “La Bibbia” ). Inizialmente è il testo sacro. Successivamente, dopo la concezione di testo sacro abbiamo una nuova tipologia di testi che hanno necessità di essere fermata su un supporto materiale, in modo che sia certo e chi si abbia la certezza che non muti si tratta delle leggi, le norme, le regole ... La prima caratteristica intrinseca di un testo che è l’immutabilità, cioè non cambia e possiamo considerarla un’entità autonoma. La filologia è una disciplina che si preoccupa di rendere un testo fruibile, e per fare questo ne offre una versione certificata. I testi si tramandano da una pluralità di fonti che modifica il testo ad ogni passaggio. Tipicamente ad ogni passaggio di copia, quindi possiamo dire che un testo nonostante è fermato in una sua veste muta nell’atto di copia, perché il copista interviene volontariamente o involontariamente su ciò che sta scrivendo, ricopiando. La filologia nasce proprio dall’esigenza di un avere solo un testo che sia ritenuto valido a cui possiamo riferirci. lo scopo di costruire l’ultima volontà dell’autore (qualcuno che scrive qualcosa, la rielabora e infine sceglie la versione da rendere ufficiale). Il testo è immutabile nella sua forma stampata ed è pubblica (a causa dell’invenzione della stampa anni ‘60/’70). Testo sacro leggi testi letterari. I test indipendentemente dalla loro struttura possono essere trattati con strumenti informatici. Come facciamo a spiegare al computer che cos’è una parola?? il computer ha bisogno di indicazioni univoche, non interpretabili e quindi in linguistica computazionale (linguistica che si
Oggi ha senso distinguere testi: che esauriscono il proprio circuito di fruizione in rete come le chat, tweet testi che possono essere concepiti in digitale ma che possono percorrere un tratto di strada su carta come le tesi (vengono concepite e codificate in digitale e poi vengono stampate) Massimo Palermo ha parlato di gradiente di digitalità –> tasso di elementi digitali dei testi. È ciò che misura se un testo è nativo digitale o immigrato. Avremo testi con un gradiente di digitalità: nullo (testi nati prima del computer), medio (scritti con l’ausilio di un supporto digitale ma non dissimili dal testo tipografico lineare) le tesi Alto quelli concepiti per la rete e inconcepibili al di fuori della rete. Fra le caratteristiche che distinguono un testo digitale da un testo tipografico (libri gutemberghiani) è che quest’ultimo è un testo lineare, si sviluppa in una successione lineare di concetti. Anche nel testo tipografico sono presenti degli elementi che interrompono questa linearità ad esempio le note (non dobbiamo creare le note in mezzo alla frase ma alla fine di essa), gli schemi, immagini (tutti gli apparati para-testuali, tra cui troviamo anche gli indici, biografia dell’autore, sintesi ecc.) che interrompono la lettura lineare del testo. Scrivere testi al computer consente di sovrapporre il momento di stesura e il momento di revisione, rielaborazione e modifica. si perdono le tappe di stesura di un testo. I testi elaborati a computer e poi stampati hanno un grosso difetto che è quello di essere molto coerenti e chiare nei microcontesti (ad esempio nei paragrafi) ma sono carenti nella coesione e nella coerenza globale del lavoro (nella successione logica…) perché si da maggiore peso alle micro-parti.
I testi non sono entità divise dagli altri testi, tendenzialmente non vivono di vita propria come lo dimostra la presenza delle note (che sono un dialogo tra un testo all’altro). I testi sono continuamente in dialogo tra di loro. Il fenomeno non è nuovo ma è nuova la terminologia che usiamo per indicarci ad essa, cioè l’ipertestualità, introdotta solo nel ‘900. L ’ipertestualità è l’influenza continua e reciproca tra testi diversi. Una delle discipline che si servono di questa caratteristica è proprio la filologia.
unidirezionale tra testi più recenti e testi più antichi ma a essa affianca una concezione bidirezionale di influenza reciproca tra testi (non solo un testo scritto prima che influenza uno scritto dopo, ma anche quello scritto dopo influenza la nostra lettura di un testo più antico. L’aver letto l’Ulisse di Joice ci può far leggere con occhi diversi l’Ulisse omerico rispetto a come potevamo leggerlo una prima volta. L’ipertestualità diventa BIDIREZIONALE Ipertesti
Che cos’è un ipertesto? Daremo una definizione e poi un’altra contrastiva al testo, perché sappiamo che testo e ipertesto hanno caratteristiche contrastive e diametralmente opposte. La comunicazione prevede oltre ai soggetti che comunicano prevede una capacità di decodifica, questo implica che il ricevente svolga un ruolo attivo all’interno della comunicazione non semplicemente passivo di ricevente ma di decodifica. Lui infatti deve conoscere il codice. Nell’ipertesto il lettore è cooperativo, quindi se nel testo abbiamo solo un lettore (dove l’autore sancisce la versione del testo che ha scritto e redatto, e decide la versione che lui vuole venga pubblicata e in questo senso il lettore ha un ruolo passivo perché non può intervenire sul testo stesso, può farlo ma non ne modifica la versione pubblica), cosa che non succede nell’ipertesto dove il lettore coopera. Partiamo dalla parola hypertext che è stata introdotta da Ted Nelson (filosofo e sociologo) che in un congresso nella prima metà del ‘900 si trovò a comunicare agli altri che cos’è l’ipertesto. Questo termine era stato cognato da lui che in un primo momento si trovava in difficolta perché era una parola nuova e avendo difficoltà a definirla e disse che poteva definirla solo per difetto nel senso che poteva dire cosa non è l’ipertesto. Cit. “mi si è consentito di introdurvi la parola ipertesto per far riferimento ad un corpus di materiali scritti o iconografici, interconnessi in una maniera così complessa che non potrebbe essere adeguatamente presentata o rappresentata su carta” L’ipertesto è un corpus, un insieme composto da più parti e da più membri scritti o iconografici che sono interconnessi, le cui connessioni non sono soltanto unidirezionali ma possono essere bidirezionali e possono addirittura saltare da un’immagine ad un testo e ad un’altra immagine e poi tornare al testo precedente e da lì possono partire altre infinite connessioni. Il testo e le immagini sono connessi in maniera molto complicata e sono anche complessi per essere rappresentati su carta. L’ipertesto è il percorso che ognuno di noi fa quando passa da pagina all’altra, è un percorso individuale che non assumerà mai una forma pubblica come il libro stampato ma che invece ha tante forme private quanti siamo noi. Le tappe saranno diverse perché anche se le parole sono le stesse saranno diverse le sequenze. Noi che andiamo avanti e indietro su queste strade non siamo più soltanto lettori perché noi non leggiamo tutto quello che c’è scritto sul post ma ne leggiamo una porzione che costituiscono il nostro personale ipertesto. Si può leggere un video secondo diverse modalità, segnaliamo per ora solo 3: lo scimming la lettura veloce a video nella quale gli occhi afferrano solo mucchi di parole per arrivare alla conclusione, poi se le abbiamo considerate degne possiamo tornare e leggere dall’inizio. lo scipping lettura per salti che non prevede di non leggere frasi o paragrafi brausing scorrimento veloce e il mio occhio capta una parola che mi può interessare. in tutte e tre i casi parliamo di lettura che avviene a video e ciascuno di questo caso è un tipo di lettura non continuo perché non leggiamo in sequenza tutte le parole, ma sono letture che si interrompono. Queste 3 letture non continue comportano:
Si possono effettuare diversi tipi di indagine automatica su un testo che è già in un formato digitale. I tipi di indagine che è possibile condurre su un testo informatizzato dipendono essenzialmente da due fattori: la potenza della macchina fattore puramente fisico. In particolar modo la RAM (?) la mente umana dipende dalla preparazione, dalle competenze e dagli scopi di chi effettua la ricerca. Il computer ci può aiutare tanto se usato con consapevolezza e con le antenne ritte. Il computer ci permette di svolgere delle indagini in maniera molto più rapida e molto più flessibile perché consente dei ripensamenti. Rischiamo però di perdere tempo se non razionalizziamo a priori la ricerca.
rappresentativo dello stato di una lingua o di una varietà di essa, al fine di ottenerne una descrizione complessiva. (rappresentatività- varietà) Un corpus è quindi un campione estratto da una popolazione più ampia. Questo significa che nella linguistica dei corpora alla popolazione (insieme di tutte le possibili osservazioni) il campione (una parte, una selezione). L’intera popolazione è nella linguistica dei corpora l’insieme di tutte le manifestazioni possibili e reali di una determinata tipologia testuale. Il corpus naturalmente non può ambire a raccogliere l’intera popolazione ma deve limitarsi ad una parte, ritaglio. Questa selezione avviene al fine di poter condurre sul campione una determinata indagine linguistica, analisi i cui esiti devono poter essere generalizzati quindi estesi anche alla parte che resta esclusa dal campione -> all’intera popolazione. La definizione di Freddy la possiamo raffinare dicendo che i corpus è un campione di testi e quindi lo si considera rappresentativo. Un insieme di testi che non è possibile considerarlo rappresentativo non è un corpus. Modernamente il corpus si intende sempre informatizzato i testi siano in formato digitale, in file TXT stoccati in cartelle e sottocartelle. è quindi accessibile elettronicamente e accessibile via computer. La linguistica dei corpora: problemi, questioni e metodi Caratteristiche essenziali del corpus, indispensabili che se ne viene a mancare anche solo uno non possiamo parlare di corpus (esempio un insieme di testi non rappresentativo non è un corpus) e sono:
la selezione del materiala da includere e da escludere dal campione nel progetto deve avvenire secondo dei criteri che siano adeguati alla popolazione che si intende studiare deve rifletterne delle caratteristiche. Per comporre un corpus si pone anche la questione della quantità e della proporzione di testi (nella sua interezza o solo alcune proporzioni) da includere nella tipologia di testi scelti. Il campionamento le porzioni o i testi da includere nel corpus possono essere effettuate anche casualmente. Quando si parla di ampiezza del corpus ci si riferisce alla lunghezza espressa in numeri di parole. Alla seconda dell’indagine il corpus andrà bilanciato. Un corpus è rappresentativo solo se è bilanciato e equilibrato nell’attingere le diverse tipologie di testo, poiché deve rappresentare nello stesso modo tutti i testi che abbiamo deciso di includere. Il campionamento non è un procedimento scientifico in senso stretto però deve poter rendere il corpus maneggiabile. Informatizzazione e la rappresentazione dei dati linguistici. La rappresentazione dei dati dei testi si presuppone avvenga in maniera digitale. La fase iniziale in cui si riflette su cosa e come è fondamentale. Interrogare un corpus non può essere un’azione passiva di digitare una sezione di parole, ma dev’essere un’operazione sapendo come quel corpus è stato allestito, quindi anche che cosa ci possiamo aspettare di trovare in quel corpus. Nell’allestire un corpus il primo problema che scontriamo è la codifica informatica dei corpus ruolo svolto da chi fa il corpus con il computer (il quale deve riconoscere i caratteri ad esempio gli accenti o l’uso delle maiuscole). Il software con il quale dobbiamo realizzare il corpus deve essere in grado di realizzare queste funzioni. Questi contenuti comprendono un’analisi interpretativa di tipo morfosintattico, fonetico ma anche semantico sulla lingua. È preferibile che la codifica sia standardizzata o universale per rendere il lavoro più facile. Chi costruisce un corpus è necessario che si ponga preliminarmente dei quesiti, per cui quel corpus viene allestito. (quali testi includere) dovremmo procurarci un testo filologicamente affidabile, eliminare i commenti, potremmo creare delle cartelle e all’interno possiamo un file TXT contente i diversi canti ad esempio. Un corpus non è semplicemente un insieme di testi, ma deve essere annotato (che contenga dei tag), che è stato lemmatizzato. Il livello di annotazione presuppone una riflessione grammaticale, sintattica, semantica sulle parole della lingua. Deve ritenere delle marcature informazioni aggiuntive che accompagnano le parole, le affermazioni e che servono da aggancio pe recuperare quel informazione grammaticale, sintattica o lessicale. Un semplice testo digitalizzato è un corpus grezzo che si oppone un corpus annotato.
La lemmatizzazione include un’analisi grammaticale che sarà tanto più rilevante quanto più morfologicamente complessa una lingua è. Un corpus più fittamente e più dettagliatamente annotato è quanto più utile quanto più è flessiva una lingua. L’operazione di arricchire i dati di metadati non avviene solo sul testo ma anche su ogni contenuto e oggetto digitale presente sulla rete. La lemmatizzazione può essere di tre tipi: manuale interamente manuale il margine di errore si riduce ma non scompare, lo svantaggio è che richiede molte risorse (molte persone che lavorano per molto tempo) automatica completamente affidata al computer (si inseriscono delle regole che poi il computer automaticamente esegue come il tag in questo caso il margine di errore è elevato. semi-automatica quella più diffusa e prevede una prima fase automatica e una seconda fase di correzione manuale dove l’operatore che ci lavora disambigua alcuni omografi in base al contesto. L’XML eXtensible marcat Language scelta molto diffusa nei corpora recenti e si utilizza per rappresentare l’insieme di regole del corpus (la grammatica). Queste regole prima che siano tradotte in linguaggio informatico come ad esempio l’XML sono regole grammaticali (frutto di un analisi approfondita degli scopi della ricerca, del perché si sta allestendo quel corpus). Sono frutto di un’analisi approfondita della lingua e dei suoi modi di rappresentarla ma anche del contesto in cui la lingua scritta si trova). È opportuno che il lavoro di progettazione avvenga a monte della notazione. Questo prevedere i lemmi si traduce ad esempio in un elenco preliminare dei tag che possono essere utilizzati. Il corpus deve essere organizzato e realizzato con caratteristiche specifiche che rispondono alle domande linguistiche che ci si pone. Terza lezione a distanza Corpora e variazione linguistica. Fondamentale nell’allestire un corpora è scegliere i testi che meritano di essere inclusi in base al motivo d’indagine. Possiamo fare un corpora in un asso di tempo breve diacronico oppure in un periodo più lungo sincronico. Possiamo effettuare la ricerca su tutto l’archivio disponibile, e in quel caso vediamo la parola che ci interessa se nel tempo varia e venga risemantizzata e se il suo significato cambi abbiamo una prospettiva diacronica. Quando invece selezioniamo un lasso di tempo breve, inferiore ai 3 anni abbiamo una fotografia sincronica. Oltre al tipo di indagine che può diacronico o sincronica possiamo scegliere se includere nel corpus testi orali o scritti; di registro alto o meno alto. La selezione dovrà tenere conto lungo l’asse scritto/parlato quindi la variazione diamesica che riguarda il mezzo di comunicazione attraverso il quale si trasmette la lingua. Dovremmo tener conto anche della variazione sociale, quindi esplorare distopia e la variazione geografica (dimensione diatopica) e quella del registro (diafasica formale o informale). I corpora possono essere di 2 tipi in base alle tipologie di testo che includono al loro interno:
corpora generici di riferimento trasversali a tutte le varietà linguistiche, perciò abbracciano tutte le varietà linguistiche. In esso dovremmo trovare rappresentate varietà diafasiche, diastratiche, diatopiche e diamesiche che caratterizzano una lingua. Questo tipo di corpora deve altresì contenere testi sia scritti che orali, letterari, scientifici, informatici… questi corpora vengono utilizzati ad esempio negli studi di genere che si trovano a metà tra analisi socio-linguistica e analisi del discorso. (sia sociologia che di lingua). Cercano di rilevare la distribuzione di frequenza delle parole in base al sesso e all’età del parlante. Uno delle domande che spesso vengono poste è l’uso di epiceni (parole uguali in tutti i generi come ad esempio “coniuge”). Qui è l ’ampiezza (il numero di parole che riescono a contenere) insieme alla gamma di tipologie di testi che costituiscono il criterio dominante della selezione dei testi stessi, ovvero a dire che un corpus generico di riferimento sarà più affidabile quanto più è rappresentativo e per essere più rappresentativo un corpus deve abbracciare un numero alto di testi. specialistici sono circoscritti ad un singolo genere o ad un singolo dominio di conoscenza testuale, quindi un corpus specialistico conterrà un vocabolario medico. Essi servono per studiare gli usi linguistici in relazione ai contesti comunicativi. L’interrogazione di un corpus specialistico può essere volta a isolare strutture tipiche della comunicazione specialistica come per esempio un certo uso del passivo, dei tempi … da un corpus generico di riferimento è possibile estrarre dei sotto-campioni che abbiamo le stesse caratteristiche per ambito disciplinare, per genere testuale ecc. il corpus specialistico può essere un sottoinsieme di un corpus generico di riferimento (poiché esso possiede al suo interno diversi generi). I corpora sono molto utilizzati anche nell’apprendimento di lingue straniere. Sono stati fatti degli studi su alcuni ragazzi italofoni che studiano inglese e si è cercato ad esempio di capire gli errori che sono più frequenti. Fu allestito un corpus nell’università di Torino. È stato messo in rilievo che ci sono alcune categorie di errori che sono più frequenti legati soprattutto all’uso di sinonimi o quasi sinonimi di una particolare area semantica. (work, job); oppure l’uso di connettivi con l’usanza molto frequente di “i think” “moreover”. Individuare gli errori più frequenti permette di individuare gli argomenti su cui soffermarci, permette di mettere a punto strumenti pedagogici e metodi di apprendimento. The snipped litercy La lettura selettiva si riconnette al fatto che la ricerca automatica (il ricercare tramite la digitalizzazione di parole) consente di interrogare piuttosto che leggere i testi. Questa possibilità riguarda sia lo specialista (anche noi) che riguarda una banca dati testuale (archivio di un giornale online) ma riguarda anche l’utente comune che naviga in rete. Navigando in Internet l’utente comune arriva ai contenuti attraverso i motori di ricerca. Lo snipped letteralmente significa ritaglio, ma è il risultato che compare in seguito alla ricerca ed è importante conoscere gli elementi che lo costituiscono. Lo snipped riporta: una breve descrizione del sito ma nello specifico è composto da tre elementi: o tag title su cui cliccare per aprire la pagina o url uniform risorse locator indirizzo della pagina o meta description descrizione della pagina lo snipped che è il motore di ricerca pesca nei tag, nella parte nascosta dell’ipertesto è parte della serp (search ingine report page) la serp è l’intera pagina dei risultati di una ricerca, che sono generalmente 10. Gli sviluppatori dei siti che vogliono apparire nelle serp combattono delle vere e proprie guerre per pubblicizzare il sito del proprio pr in modo che possono conquistare le prime posizioni della pagina perché generalmente i ricercatori non scendono più di tanto.
Sono testi argomentativi che hanno appositamente lo scopo di sostenere una tesi, un ragionamento.
I testi che si scrivono per l’università sono le tesi e le tesine, si tratta di testi saggistici (saggi brevi) che sviluppano un argomento in modo scientifico, rigoroso e condividono le caratteristiche del testo argomentativo. Le tesi e le tesine sono testi da questo punto di vista simili per i quali si possono individuare una serie di tecniche di scrittura omogenee/uguali, che sono validi per tutti i testi che rientrano nella scrittura saggistica di tipo argomentativo. La funzione primaria del testo argomentativo è quella di sostenere un’opinione e di convincere l’interlocutore a cui ci rivolgiamo della sua veridicità, fornendo una serie di ragionamenti/argomentazioni che devono essere documentati con esempi. Un elemento determinante del testo argomentativo è il contesto, cioè proprio la presenza di un interlocutore. L’interlocutore è chiunque legge la tesi, quindi un professore, un’amica, ascoltatore, pubblico ecc. Quello a cui dobbiamo pensare mentre scriviamo la tesi è la comunità scientifica a cui ci riferiamo (il gruppo di specialisti della materia di cui ci stiamo occupando). L’interlocutore è il destinatario del messaggio della tesi, il quale deve essere convinto della veridicità delle argomentazioni. Gli elementi dai quali si riconosce un testo argomentativo (ci sono alcuni elementi particolari che ci permettono di riconoscere un testo argomentativo): la sua struttura se un testo è bene strutturato ed è ben scritto, gli elementi della sua struttura sono ben visibili e permettono al lettore una rapida con la quale si riesce ad individuare gli elementi fondativi del testo. La struttura stessa che deve acchiappare il lettore, catturare la curiosità e l’interesse. Attraverso la struttura emergono degli elementi logici che cominciano a convincere il lettore. se un testo argomentativo non è ben organizzato l’interlocutore sarà già a prescindere diffidente rispetto al contenuto. Il testo argomentativo si contraddistingue per la presenza di questi elementi: titolo spesso si può conoscere un testo argomentativo anche direttamente dal titolo, perché esso deve costituire una sintesi estrema del testo (deve riuscire a includere più cose possibili in esso), per interessare e incuriosire il lettore. Quindi non possiamo usare titoli poco chiari, pseudo- poetiche. Non dobbiamo essere reticenti. Il titolo può coincidere con l’argomento principale. Il titolo può essere riguardante un’azione compiuta, di tipo nominale oppure con un periodo costituito da un rapporto causa effetto (ad esempio sono state recentemente trovate delle antiche navi di epoca romana e se noi volessimo scrivere un saggio su questa cosa potremmo usare come titolo “le antiche navi di Pisa”). la premessa essa va all’inizio della tesi ma si scrive per ultima, spesso non si medias res, quindi non si inizia nel cuore dell’argomento ma è buona norma delimitare l’ambito di indagine, contestualizzare il proprio intervento, fare un quadro storico oppure trarre spunto da un avvenimento recente che permette di introdurre, che permette arrivare dal generale al particolare. Ci vuole un preambolo. tesi centro propulsore e dinamico del testo argomentativo. In una recensione di qualsiasi cosa (libro, film…) la tesi coincide con il giudizio di valore dell’oggetto recensito. Lo scopo del testo è dimostrare la veridicità della tesi. La tesi si espone e poi deve essere supportata la sua veridicità da argomenti e prove. gli argomenti sono i ragionamenti, i passaggi logici attraverso cui si dipana il testo argomentativo. prove supportano e garantiscono la veridicità di tutto il procedimento, delle argomentazioni a supporto della tesi. Le prove possono essere di due tipi: o prove di autorità sono affidabili in base all’autorevolezza del loro autore.