Linguistica-Webinar-260320

Lingua italiana e didattica digitale: consigli, suggerimenti e buone pratiche

Slide del webinar

Link diretto alle slide

1. Linguistica: che cos’è? Che cosa ci insegna? Come può essere utilizzata per favorire l’apprendimento? Una chiacchierata con i linguisti

Introduzione

In questa prima parte affronteremo due argomenti:

2. Annotazione linguistica in classe: esercizi di comprensione del testo

Tra le nostre attività (disponibili qui), vi proponiamo un approccio inedito alla comprensione del testo per riflettere sull’evidenzialità, ovvero le modalità con cui le informazioni vengono riportate all’interno di un testo e che determinano l’attendibilità di una fonte, e le metafore concettuali, ovvero l’uso di espressioni linguistiche metaforiche per la rappresentazione di un dato argomento. Abbiamo scelto di portare in classe un’operazione fondamentale in linguistica computazionale, l’annotazione del testo, tramite Doccano, uno strumento open-source per la classificazione e l’annotazione di testi di qualunque tipo. Vediamo adesso gli step da seguire per utilizzarlo al meglio.

Video-tutorial all’uso della piattaforma

Ora vi guideremo passo passo nello svolgimento dell’attività Comprensione del testo; la procedura è illustrata nelle slide dalla n.14 alla n.25. Di seguito, un video-tutorial sull’uso della piattaforma di annotazione (doccano)

Step 1: Accedere alla piattaforma

  1. Collegarsi al sito seguendo questo link
  2. Fare il login. Se si accede per la prima volta, si può

La piattaforma vi reindizzerà alla pagina Projects, contenente i dataset per le diverse attività.

Step 2: Iniziare l’attività

Dopo aver selezionato il progetto Comprensione del Testo | Climate Change (nella pagina Projects) sarà possibile iniziare l’attività. Le componenti fondamentali sono

Step 3: Svolgere l’attività su doccano

Si richiede di annotare la parte di testo che manifesta una delle caratteristiche espresse dalle etichette. Si lavora su due livelli

3. Esempi pratici e strumenti digitali per attività didattiche

In questa sezione vi parleremo di due case studies provenienti dal mondo dell’ingegneria civile e della medicina, in cui la linguistica è stata fondamentale per rispondere a problemi ed esigenze reali degli studenti. Infine vi presenteremo Voyant Tools con alcuni esempi di applicazione, sperando che possa essere d’ispirazione per le vostre attività future.

Linguistica per i linguaggi tecnici e specialistici: il caso dell’Ingegneria Civile

Il progetto Civil Engineering Writing Project esemplifica bene l’applicazione di metodi e strumenti linguistici al servizio del linguaggio specialistico/tecnico. Lo scopo del progetto, condotto dalla professoressa Susan Conrad (Portland State University), è quello di affrontare “il divario tra le competenze di scrittura degli studenti, e le competenze richieste sul (futuro) luogo di lavoro” (v. homepage del progetto).

Linguistica per la Medicina

Diversi ambiti della linguistica, tra cui l’analisi del discorso e delle metafore concettuali, sono stati applicati allo studio della comunicazione medica, evidenziando alcune tra le caratteristiche linguistiche tipiche dell’interazione tra medico e paziente. In medicina, più che in altri contesti specialistici, la lingua si è rivelata efficace non solo come strumento indispensabile al paziente per esprimersi e comunicare sensazioni corporee e sintomi, ma anche e soprattutto come risorsa che, se ben sfruttata, è in grado di modificare la percezione stessa del paziente e la sua esperienza con la malattia. Nel progetto Metaphor in the end-of-life care Elena Semino, docente di linguistica dell’università di Lancaster, analizza come il linguaggio metaforico sia stato utilizzato da pazienti in fasi terminali della malattia, dai loro famigliari, che spesso ricoprono il ruolo di caregivers, e dal personale medico sanitario. L’analisi è stata effettuata su un corpus di 1,5 milioni di parole creato a partire da interviste medico-paziente e da dati raccolti su forum online. I dati sono stati analizzati utilizzando W-Matrix, un software per l’analisi linguistica quantitativa, che permette di annotare i domini semantici della metafora. Tra i risultati più interessanti, Semino evidenzia la presenza ricorrente di due categorie di metafore concettuali: le cosiddette metafore “di violenza”, in prevalenza metafore belliche, in cui la malattia viene concettualizzata come guerra, e le metafore “del viaggio”, considerate sotto certi aspetti più positive rispetto alle prime. Lo studio mette in luce come la percezione dei pazienti cambi in relazione al tipo di metafora scelta per descrivere la malattia: le metafore belliche possono offrire al paziente uno stimolo a reagire, ed essere dunque di supporto motivazionale oppure, al contrario, generare frustrazione e un senso di impotenza derivante dalla sconfitta.

Lo strumento Voyant | close e distant reading di testi

Creato da Stéfan Sinclair (McGill University) e Geoffrey Rockwell (University of Alberta), a partire dalla teoria del Distant Reading sviluppata da Franco Moretti per l’esplorazione quantitativa e “distante” (ovvero, senza leggere i testi) della letteratura. Alla base del Distant Reading c’è l’idea (provocatoria) di studiare la letteratura senza leggere libri. L’approccio quantitativo proposto da Moretti (e realizzabile attraverso Voyant) si basa sull’analisi di aspetti (frequenza delle parole, rappresentazioni grafiche delle relazioni tra personaggi, etc…) che solo una visione digitale d’insieme può fornire. Questi dettagli, strutturati in reti e grafi, permettono di scoprire dettagli non altrimenti identificabili attraverso una lettura “tradizionale”. Lo Stanford Literary Lab prosegue il lavoro sulla teoria e la metodologia del distant reading anche attraverso la pubblicazione di brevi pamphlet che raccontano - in maniera divulgativa - i risultati delle ricerche condotte. Una breve descrizione (in Inglese) dell’approccio Distant Reading è stata pubblicata dal New York Times; un articolo di approfondimento è invece disponibile a questo link.

A questo link è possibile accedere alla versione web dello strumento, che supporta anche l’accesso da smartphone. In alternativa è possibile scaricare una versione da eseguire sul proprio computer (Windows, MacOS, Linux) da questa pagina; selezionare l’ultima versione in formato zip. L’attuale versione (consultata il 25/03/2020) si chiama VoyantServer2_4-M36.ziped è disponibile da questo link diretto.

Step 1: Caricare uno o più testi

È possibile caricare testi attraverso un link diretto ad un file di testo, rendendo lo strumento facilmente integrabile con testi presi dal sito Project Gutenberg (o altri siti che offrono opere letterarie in formato txt). Se si desidera caricare un testo da Project Gutenberg è necessario fornire a Voyant il link diretto al formato denominato Plain Text UTF-8.
Tutte le analisi e le relative visualizzazioni possono essere facilmente esportate in formato immagine, o è possibile generare un link per accedere direttamente alla visualizzazione scelta, rendendo la condivisione all’interno e all’esterno della classe molto semplice.

Step 2: Gli strumenti nella home

Nella home ci sono 5 box principali con le seguenti funzioni:

Cirrus

Crea un word cloud, cioè una rappresentazione grafica in cui le parole più frequenti in un corpus o documento sono al centro e più grandi.

Di seguito un esempio usando il dataset sul Climate Change di doccano (qui la versione fullscreen)

Termini

Fornisce la lista delle parole con conteggio di frequenza. Possibili attività: dato un word cloud, riconoscere il testo e l’autore. Oppure confrontare due passaggi di un testo per ragionare sui collegamenti (similitudini e differenze) tra le due visualizzazioni (es. descrizioni di personaggi e luoghi)

Link

Grafo delle collocazioni a rete che mostra le parole con frequenza maggiore che appaiono vicino alla parola data. Possibili attività: far indovinare una poesia a partire dal grafo, come negli esempi seguenti con poesie di Leopardi; qui la versione fullscreen del primo esempio; qui la versione fullscreen del secondo esempio

Lettore

Permette di consultare i testi presenti nel corpus, graficamente rappresentati con barre in fondo al box. Cliccando su una parola vengono fornite informazioni sulla frequenza e la loro distribuzione all’interno del testo (linea in fondo al box).

TermsBerry

È come Cirrus ma più preciso perchè oltre alla frequenza considera i collocati (parole che occorrono nel contesto). Possibili attività: scomporre un’opera in capitoli, osservare come cambia il contesto di alcune parole nello svolgersi della trama.

Andamenti

Presenta un grafico dell’andamento della frequenza relativa delle parole nel documento.

Possibili attività: confrontare concetti (es. matrimonio, soldi) per scoprire che relazione c’è e come si caratterizza. Il trend è come ci si aspettava? C’è un motivo perché devia? A seguire una proposta di analisi della parola “occhi” nella Divina Commedia qui la versione fullscreen

Contesti

Mostra ciascuna occorrenza di una parola chiave con una porzione di testo che lo circonda (contesto). Di seguito due esempi con il dataset Coronavirus presente su doccano. Il primo mostra come si parlava della Cina durante lo scoppio dell’epidemia attraverso le occorrenze della parola Cina (qui la versione fullscreen)

Nel secondo si può osservare come si parla della Cina dopo lo scoppio dell’epidemia in Europa (qui la versione fullscreen)

Bubblelines

Visualizza ogni termine come una bolla, la cui dimensione indica la frequenza del termine.

Step 3: Altri strumenti

RezoViz

Permette di rappresentare graficamente i collegamenti tra persone, organizzazioni e luoghi (sotto forma di nodi in un network graph) che vengono menzionati in documenti diversi. Possibili attività: creare collegamenti all’interno di opere di uno stesso autore allo scopo di verificare eventuali luoghi o personaggi che compaiono in modo ricorrente.

Mandala

È un tool di visualizzazione che permette, a partire da un termine chiave o magnete (scelto dall’utente) di attrarre a sé tutti i documenti che contengono quel termine in base alla sua frequenza relativa. A seguire due esempi:

Jane Austen (qui la versione fullscreen)

Dataset Brexit (qui la versione fullscreen)

Topics

Questo tool utilizza un algoritmo di topic modelling per creare dei cluster di parole (dei topic, temi) presenti nei testi. Gli esiti usando testi di fiction sono complessi da analizzare, e in generale il suo utilizzo è più apprezzato con non-fiction. Possibili attività: cercare di ricondurre i topics trovati dal tool a temi presenti nel romanzo secondo l’antologia. Oppure analizzare articoli di cronaca, come nell’esempio seguente sul Covid-19 (qui la versione fullscreen)

Dreamscape - Visualizzare i luoghi menzionati nei testi per un viaggio virtuale

Questo strumento identifica i luoghi menzionati nel testo e suggerisce delle connessioni tra essi basandosi sulla sequenza con cui vengono menzionati nel testo. Data la semplicità dell’algoritmo, non è detto che ogni sequenza di luoghi sia significativa: perciò sarà ancora più interessante indagare se il collegamento creato dal tool identifichi un effettivo spostamento di persone, beni, idee, o altro e sia rilevante per l’analisi. Sarà anche possibile trovare errori (falsi positivi e negativi), quindi l’importante è non fidarsi al 100% dei dati ma far seguire sempre un’analisi critica. Possibili attività: studi interdisciplinari tra storia e letteratura.

Il seguente esempio mostra i luoghi menzionati nell’opera Olanda di Edmondo De Amicis, disponibile gratuitamente dall’apposita pagina su Project Gutenberg; (qui la versione fullscreen)

Possibile attività - extra

Voyant Tools si presta bene anche all’analisi dei propri testi. Si può proporre alla classe di creare un corpus con i testi di tutti gli studenti e poi analizzarli, per scoprire trend e difficoltà e promuovere autocorrezione e riflessione sui propri elaborati.