Academia.eduAcademia.edu

I dati linguistici

2024, I dati linguistici. Metodologie e strumenti della ricerca

https://doi.org/10.35948/DILEF/978-88-6032-750-5

Come raccogliere, interpretare, trattare e condividere i dati linguistici: queste le principali linee di indagine del volume, che ospita i contributi di dottorandi e studiosi di Linguistica e Umanistica digitale. Dal mutamento alla variazione, dalla fraseologia al lessico specialistico, dalla lessicografia alla semantica, fino all’utilizzo di linguaggi di mark-up e di corpora, l’attenzione si sofferma su approcci e metodologie di lavoro differenti, con lo scopo di condividere pratiche di studio e di ricerca – sia in campo teorico sia in campo applicativo – sul dato linguistico, oggetto esplorabile secondo molteplici sfaccettature e sistemi d’indagine.

STUDI E RICERCHE DEL DIPARTIMENTO DI LETTERE E FILOSOFIA I dati linguistici Metodologie e strumenti della ricerca a cura di Caterina Cacioli, Serena Carlamaria Crespi, Stefano Miani, Barbara Patella, Ersilia Russo, Carmelina Toscano LINGUISTICA Studi e ricerche del Dipartimento di Lettere e Filosofia direttore responsabile Simone Magherini direttore Marco Biffi Linguistica / 2 La collana «Studi e ricerche del Dipartimento di Lettere e Filosofia» dell’Università degli Studi di Firenze nasce, insieme a «DILEF. Rivista digitale del Dipartimento di Lettere e Filosofia», nel quadro delle attività condotte come Dipartimento di Eccellenza 2018-2022 sul Fondo assegnato dal Ministero dell’Istruzione, dell’Università e della Ricerca. La collana si articola in quattro sezioni, che rispecchiano gli interessi e gli ambiti di studio delle rispettive sezioni dipartimentali: Antichità e Filologia, Filosofia, Letteratura italiana e Romanistica, Linguistica. La pubblicazione in rete, in formato PDF, è ad accesso aperto; l’edizione a stampa è disponibile a pagamento. Comitato direttivo Benedetta Baldi, Giovanni Alberto Cecconi, Simone Magherini, Mariagrazia Portera, Anna Rodolfi, Salomé Vuelta García, Giovanni Zago Comitato scientifico Valentina Arena (University College, London) Barbara Carnevali (École des Hautes Études en Sciences Sociales, Paris) Mario Citroni (Scuola Normale Superiore di Pisa) Matthias Heinz (Paris Lodron Universität Salzburg) Susan Kozel (Università di Malmö) Adam Ledgeway (University of Cambridge) José María Micó (Università Pompeu Fabra, Barcellona) Marco Petoletti (Università Cattolica di Milano) Alessandro Polcri (Fordham University, NY) Tommaso Raso (Universidade Federal del Minas Gerais) Carole Talon-Hugon (Université de Nice-Sophia Antipolis) Fabio Zinelli (École Pratique des Hautes Études, Paris) I dati linguistici Metodologie e strumenti della ricerca a cura di Caterina Cacioli, Serena Carlamaria Crespi, Stefano Miani, Barbara Patella, Ersilia Russo, Carmelina Toscano © 2024 Società Editrice Fiorentina, per la presente edizione © 2024 The Authors, per i testi via Aretina, 298 - 50136 Firenze tel. 055 5532924 [email protected] edu.sefeditrice.it e-issn isbn e-isbn doi 2974-6876 978-88-6032-751-2 978-88-6032-750-5 10.35948/diLeF/978-88-6032-750-5 La Collana è pubblicata ad Accesso Aperto con licenza Creative Commons Licence CC-BY-NC-ND 4.0 https://creativecommons.org/licenses/by-nc-nd/4.0/deed.it Crediti fotografici © 2024 crediti dichiarati in didascalia. Riproduzione in qualsiasi forma, intera o parziale, vietata Progetto grafico e impaginazione Francesco Sensoli Copertina Studio Grafico Norfini Font Alegreya ht e Alegreya Sans ht (Juan Pablo del Peral, Huerta Tipográfica) Indice vii Introduzione dei curatori I dati linguistici. Metodologie e strumenti della ricerca 3 La Marcatura Differenziale dell’Oggetto in Calabria: l’Area Lausberg Giusy Truncellito 21 Sistemi di subordinazione nella Calabria meridionale: il caso del verbo ‘andare’ Carmelina Toscano 45 Fenomeni di contatto nel parlato di giovani abruzzesi. Uno sguardo al corpus Nec Sine Valeria Garozzo, Enzo Santilli 71 Manzoni postillatore della Crusca veronese: le unità fraseologiche Ersilia Russo 91 Percorsi correttòri dal Fermo e Lucia alla Quarantana: l’esempio dei proverbi glossati Irene Rumine 113 Phraseological Research of the 16th-Century Slovenian Literary Language Eva Trivunović 131 La “lingua delle donne” nella coscienza linguistico-letteraria di Sibilla Aleramo: realtà o costruzione sociale? Alessandra Rea 151 Il lessico della psicanalisi in Italia nel primo Novecento: tra rimozioni, lacune lessicografiche e possibili sviluppi digitali Stefano Miani 171 Esempi di interferenza tra lingua comune e lingua specialistica: note su alcuni termini artistico-architettonici e meccanici Matteo Mazzone 193 Il “dato silente” in un corpus di parlato schizofrenico Simona Trillocco 215 La raccolta e l’analisi dei dati linguistici in un’indagine su parlanti bilingui Yasmina Moussaid 229 Tra lingue e risorse linguistiche: metodi di analisi contrastiva della semantica di verbi di azione Caterina Cacioli 251 Cov-I-Cor: un corpus di italiano istituzionale relativo alla gestione dell’emergenza sanitaria Laura Occhipinti 269 CORMIP (Corpus Multimodale dell’Italiano Parlato): questioni intorno al trattamento del dato linguistico multimodale Luca Lo Re 289 Il dato del Paesaggio Linguistico: una proposta di classificazione con alcuni esempi dal mercato di S. Lorenzo (FI) Lorenzo Cambi 321 Codifica xml-tei: proposta di mark-up per i dizionari metodici Barbara Patella 339 Indice dei nomi Introduzione dei curatori Il presente volume raccoglie gli Atti del “Convegno dottorale internazionale LinUD”, un evento organizzato dai dottorandi dei cicli xxxv e xxxvi dei curricula di Linguistica e Umanistica Digitale, tenutosi a Firenze nei giorni 27, 28 e 29 giugno 2022 presso il Dipartimento di Lettere e Filosofia (DILEF) dell’Università degli Studi di Firenze. LinUD è nato dall’idea di realizzare non solo un convegno accademico, ma anche e soprattutto un luogo di incontro interdisciplinare e di scambio scientifico, finalizzato a condividere le novità e i progetti che circolano nel campo della Linguistica e delle Digital Humanities, favorendo così un dialogo tra i partecipanti, sia dottorandi che giovani ricercatori. Dopo esserci interrogati a lungo sul tema del convegno, la scelta conclusiva è ricaduta sui dati linguistici, poiché costituiscono un comune denominatore per le discipline umanistiche in questione e un oggetto esplorabile secondo molteplici sfaccettature, parametri e sistemi d’indagine: si pensi, ad esempio, alla raccolta dei dati, alla definizione di rappresentatività del campione oppure agli strumenti usati per l’estrapolazione e l’analisi dei dati; accanto a ciò – in un’ottica più squisitamente teorica – non sono da trascurare i criteri e le metodologie con cui essi vengono esaminati o ancora le modalità con cui possono essere condivisi e diventare fruibili (specie alla luce delle nuove tecnologie che consentono di accelerare i processi e le fasi di trattamento dei dati, nonché di renderli disponibili in formato digitale). In altre parole, si è lasciato spazio al dato linguistico sotto larghi punti di vista, nella I dati linguistici. Metodologie e strumenti della ricerca fattispecie ai modi in cui questo può essere elicitato, trattato e condiviso – a tal proposito, la diversità degli approcci riflette la vastità e la complessità degli studi linguistici e dimostra come metodi e modalità di indagine varino con il variare delle scelte e degli obiettivi di ogni singola ricerca. A una molteplicità di analisi e di risorse corrispondono, dunque, molteplici prospettive di ricerca, in grado di stimolare nuove idee e produrre continui interrogativi. Ed è proprio in questo contesto che si inserisce LinUD, nato come occasione per caldeggiare la condivisione di pratiche, metodologie e modelli di ricerca – sia nel solco di tradizioni già consolidate sia nel panorama di frontiere sperimentali –, al fine di promuovere un’interazione proficua tra le diverse aree di ricerca. Crediamo, infatti, che idee innovative e stimolanti possano sgorgare anche dall’avvicinamento di ambiti di ricerca che di solito restano lontani fra loro, con l’auspicio di contrastare quell’isolamento che talvolta caratterizza il percorso delle singole ricerche col rischio di renderle aride: tutto ciò nell’ottica di far arricchire vicendevolmente le branche di un ventaglio composito come quello della Linguistica e dell’Umanistica digitale. Con questa raccolta si intende offrire il contributo dei relatori che hanno preso parte alle giornate del convegno e che hanno permesso di toccare una vasta gamma di argomenti riguardanti i dati linguistici. Come anticipato, gli articoli proposti si muovono in ambiti eterogenei: si passa dal mutamento e dalla variazione nelle lingue a questioni di semantica, dai linguaggi specialistici alla fraseologia e alla lessicografia, fino ad arrivare all’analisi testuale, all’utilizzo dei corpora e ai linguaggi di mark-up. A occuparsi di morfo-sintassi dialettale Giusy Truncellito, che indaga la MDO (“Marca Differenziale dell’Oggetto”) nei dialetti calabresi settentrionali dell’area Lausberg, conducendo un’analisi micro-variazionista che tiene conto dei diversi parametri semantici, quali l’animatezza, la definitezza e la specificità dell’oggetto, col fine ultimo di chiarire quali siano i contesti in cui, nelle diverse varietà, è ammessa oppure esclusa la MDO; appartiene allo stesso filone di ricerca l’articolo di Carmelina Toscano, che indaga il fenomeno della pseudo-co- viii Introduzione dei curatori ordinazione (PseCo) nella Calabria meridionale attraverso un’analisi micro-variazionista, esaminando i contesti semantico-sintattici in cui la codifica della PseCo è esclusiva e in quali altri invece co-esiste con altre strutture di modo finito diffuse in questi stessi territori; l’obiettivo del lavoro è quello di individuare i contesti prototipici di codifica della PseCo e i fattori che governano la co-ricorrenza o l’alternanza tra questa e le altre costruzioni diffuse nella stessa area. Spostandoci sul versante del rapporto tra lingua e dialetto, troviamo lo studio di Valeria Garozzo ed Enzo Santilli, il cui obiettivo consiste nell’individuare, categorizzare e analizzare i fenomeni di contatto italiano-dialetto: il lavoro dei due studiosi prende le mosse da un’analisi delle produzioni orali di parlanti bilingui che si avvicinano il più possibile al parlato spontaneo prototipico. Alla fraseologia manzoniana sono dedicati due contributi: quello di Ersilia Russo, che ricostruisce il ruolo rivestito dalla cosiddetta “Crusca veronese” nella formazione della fraseologia dei Promessi sposi (nella fattispecie, le postille apportate sul vocabolario testimoniano l’attenzione che Alessandro Manzoni ha riservato alle unità fraseologiche, in quanto tessere particolarmente rilevanti per la restituzione di una lingua “viva e vera”) e quello di Irene Rumine, in cui si approfondisce l’aspetto paremiologico del romanzo manzoniano (in continuità con il clima romantico, i proverbi sono visti come un serbatoio di cultura popolare, in grado di conferire una molteplicità di toni e di registri al testo; in particolare, vengono messe in evidenza quelle paremie che, dal Fermo e Lucia alla Quarantana, sono segnalate da glosse metalinguistiche che ne attestano un uso consapevole da parte dell’autore). Sempre incentrato sulla fraseologia, ma in relazione alla lingua slovena, l’articolo di Eva Trivunovic, che presenta le problematicità dello studio diacronico della fraseologia, occupandosi nello specifico del materiale ricavato dal Dizionario della lingua letteraria slovena del XVI secolo: dall’analisi delle fonti del dizionario (53 testi di natura prettamente religiosa) si evincono due caratteristiche proprie delle unità fraseologiche, ossia la stabilità e l’espressività. Focalizzato sulla lingua delle donne il contributo di Alessandra Rea, che indaga il rapporto che intercorre tra le scrittrici e la lingua, ix I dati linguistici. Metodologie e strumenti della ricerca intesa come costruzione sociale, studiando la percezione di Sibilla Aleramo riguardo a una presunta lingua delle donne; l’attenzione dell’autrice si concentra sull’analisi di più variabili, come la variazione diastratica, diafasica e di genere. L’analisi si sviluppa attraverso una griglia di riferimento contenente, da un lato, i tratti ritenuti caratterizzanti, dall’altro alcuni fenomeni linguistici attraverso cui è misurata la presenza di quei tratti. Di linguaggi specialistici si è occupato Stefano Miani, in particolare della formazione del lessico italiano della psicanalisi nella prima metà del XX secolo; lo studio presenta il corpus di testi su cui sono stati condotti gli spogli lessicali, i criteri di digitalizzazione del materiale raccolto e alcuni dei dati quantitativi ricavati grazie all’utilizzo delle piattaforme Sketch Engine e Nodegoat. Sull’interferenza tra lingua comune e lingua specialistica si concentra il saggio di Matteo Mazzone, in particolar modo sulla rideterminazione semantica in chiave tecnica di voci d’uso quotidiano, mediante l’analisi semantica di alcuni lemmi tratti dallo spoglio lessicale effettuato su quella che è oggi considerata come la seconda traduzione cinquecentesca del De architectura di Vitruvio, databile tra il 1504 e il 1511, e contenuta nel manoscritto Ottoboniano latino 1653 della Biblioteca Apostolica Vaticana. Diverse ricerche ruotano, invece, intorno alla linguistica dei corpora, strumenti declinati in base alle diverse modalità di indagine, a partire da quella di Simona Trillocco, che analizza e indaga il ruolo delle pause nel parlato schizofrenico, mediante l’analisi del Corpus Italiano di Parlato Patologico Schizofrenico (CIPPS) nel quadro teorico della “Teoria della Lingua in Atto”, mostrando, mediante un confronto con i dati relativi al parlato normofasico, i primi risultati ottenuti. Yasmina Moussaid analizza il bilinguismo di parlanti italo-arabofoni, mediante una ricerca che combina l’analisi delle informazioni ricavate da interviste semi-strutturate – rivolte a parlanti bilingui – con l’analisi di corpora bilingui, con l’intento di indagare alcune caratteristiche, come ad esempio le scelte linguistiche dei parlanti coinvolti, i fenomeni di contatto e ulteriori questioni di tipo sociolinguistico e socioculturale. x Introduzione dei curatori Nel suo saggio Caterina Cacioli propone una discussione dei metodi di analisi dei dati linguistici in ottica contrastiva e nel campo della semantica, focalizzandosi sull’uso di diverse fonti di dati – corpora e video-risorse linguistiche –; con un caso di studio sui verbi di azione in inglese, svedese e italiano si propone l’uso combinato di dati linguistici, mostrando i vantaggi dell’unione della componente visiva e d’uso nello studio dei verbi e delle azioni. Laura Occhipinti si occupa di esplorare l’importanza della comunicazione istituzionale durante la pandemia da Covid-19, evidenziando la necessità di chiarezza nei messaggi ufficiali e introducendo, in relazione al soggetto trattato, il corpus Cov-I-Cor, appositamente creato per raccogliere i testi istituzionali prodotti in periodo di crisi e analizzare l’uso del linguaggio istituzionale durante l’emergenza sanitaria. Ancora in relazione ai corpora il contributo di Luca Lo Re, il quale propone un metodo per sviluppare un corpus multimodale dell’italiano parlato, seguendo la tradizione dei corpora compilati dal gruppo di ricerca LABLITA dell’Università di Firenze e proponendo la creazione di un corpus pilota, CORMIP (acronimo di Corpus Multimodale dell’Italiano Parlato), attraverso cui testare un nuovo tipo di approccio ai dati e preparare il terreno per ricerche future e comprendere la lingua come un sistema complesso, multimodale, che utilizza gesti e linguaggio parlato per esprimere significati. Di paesaggio linguistico parla Lorenzo Cambi, che presenta una classificazione del Paesaggio Linguistico (PL) basata sull’analisi di dati ed esempi provenienti dal mercato di San Lorenzo a Firenze; la proposta si distingue per un approccio sperimentale che integra metodologie quantitative e qualitative, enfatizzando l’importanza di coinvolgere attivamente gli attori e gli osservatori del PL, ed esaminando, al contempo, l’impatto delle politiche linguistiche e il ruolo sempre più rilevante del Paesaggio Linguistico Virtuale e dei legami tra spazio fisico e virtuale nell’ambito della società contemporanea. A chiudere la raccolta il contributo di Barbara Patella, nel quale si delineano – e si illustrano con una serie di esempi – i principali criteri adottati per marcare in xml-tei i maggiori dizionari metodici xi I dati linguistici. Metodologie e strumenti della ricerca ottocenteschi della lingua italiana, al fine di mostrare le modalità con cui tali strumenti lessicografici (particolarmente rilevanti per la storia della lingua italiana e della lessicografia), da prodotti cartacei “statici”, siano stati trasformati in repertori digitali “dinamici” grazie a un lavoro di informatizzazione per renderli interrogabili (in funzione di una piattaforma online predisposta per consultare questo tipo di dati). Chiudiamo la nostra premessa con l’augurio che questo volume possa essere una risorsa utile per gli studiosi, costituendo un pungolo per nuove riflessioni e nuovi spazi di ricerca. Intendiamo rivolgere i nostri ringraziamenti a tutti i relatori che hanno partecipato con grande entusiasmo alle giornate del Convegno con i loro interventi, condividendo le loro ricerche e affidandone una parte a questo volume. Un sincero ringraziamento va poi ai relatori invitati che, con i loro contenuti, hanno impreziosito l’occasione di scambio accademico: il professor Alessandro Lenci e il professor Franco Fanciullo. Un doveroso grazie al Dipartimento di Lettere e Filosofia dell’Università degli Studi di Firenze (DILEF), in particolare al professor Pierluigi Minari e alla professoressa Paola Manni che, nel 2022 – rispettivamente in qualità di direttore del Dipartimento e di coordinatrice del Dottorato di ricerca in “Filologia, Letteratura italiana, Linguistica” –, hanno reso possibile l’organizzazione del Convegno LinUD. Concludiamo ringraziando i membri del Comitato scientifico, specialmente il professor Marco Biffi (referente del curriculum di Umanistica digitale) e la professoressa Monica Ballerini (referente del curriculum internazionale di Linguistica) per averci guidato e coordinato nella progettazione del Convegno, nonché durante le fasi organizzative, e infine per averci sostenuto nella realizzazione degli Atti raccolti in questo volume. xii Studi e ricerche del Dipartimento di Lettere e Filosofia Antichità e Filologia 1. Francesco Cannizzaro, Sulle orme dell’Iliade. Riflessi dell’eroismo omerico nell’epica d’età flavia, 2023. 2. Noster delectat error. L’errore tra filologia e letteratura, a cura di Elisa Migliore, Matilde Oliva, Claudio Vergara, 2024. Letteratura italiana e Romanistica 1. L’illustre volgare. Riletture, riscritture e traduzioni dantesche nelle lingue romanze, a cura di Michela Graziani, Michela Landi e Salomé Vuelta García, 2023. 2. «La sintassi del mondo». La mappa e il testo, a cura di Laura Bardelli, Elisa Caporiccio, Ugo Conti, Antonio D’Ambrosio, Carlo Facchin, Martina Romanelli, 2023. 3. La violenza nella letteratura italiana. Forme, linguaggi e rappresentazioni, a cura di Rebecca Bardi, Camilla Bencini, Chiara Canali, Andrea Carnevali, Alice Petrocchi, Alessandro Privitera, Andrea Talarico, 2023. Linguistica 1. «La sua chiarezza séguita l’ardore». Studi di linguistica e filologia offerti a Paola Manni, a cura di Barbara Fanini, 2023. 2. I dati linguistici. Metodologie e strumenti della ricerca, a cura di Caterina Cacioli, Serena Carlamaria Crespi, Stefano Miani, Barbara Patella, Ersilia Russo, Carmelina Toscano, 2024. Finito di stampare nel mese di luglio 2024 da Rotomail Italia S.p.A. Volume stampato con tecnologia print on demand STUDI E RICERCHE DEL DIPARTIMENTO DI LETTERE E FILOSOFIA Come raccogliere, interpretare, trattare e condividere i dati linguistici: queste le principali linee di indagine del volume, che ospita i contributi di dottorandi e studiosi di Linguistica e Umanistica digitale. Dal mutamento alla variazione, dalla fraseologia al lessico specialistico, dalla lessicografia alla semantica, fino all’utilizzo di linguaggi di mark-up e di corpora, l’attenzione si sofferma su approcci e metodologie di lavoro differenti, con lo scopo di condividere pratiche di studio e di ricerca – sia in campo teorico sia in campo applicativo – sul dato linguistico, oggetto Caterina Cacioli è dottoranda in Umanistica esplorabile secondo Digitale presso l’Università degli Studi di molteplici sfaccettature e Firenze. Si occupa di semantica e metodi sperimentali per lo studio del significato in sistemi d’indagine. linguistica cognitiva. Serena Carlamaria Crespi si è addottorata presso l’Università degli Studi di Firenze. È ingénieur d’étude nell’ambito dell’umanistica digitale e della filologia moderna presso l’Université Grenoble Alpes. Stefano Miani è assegnista di ricerca presso l’Università degli Studi di Firenze. Si occupa di linguaggi e terminologie specialistiche e di lingua e discriminazione. Barbara Patella è assegnista di ricerca e docente a contratto presso l’Università degli Studi di Firenze. Si occupa di lessicografia informatica e di vocabolari metodici. Ersilia Russo è assegnista di ricerca presso l’Università degli Studi di Firenze. Si occupa della fraseologia dei Promessi sposi e del Vocabolario del fiorentino contemporaneo. Carmelina Toscano si è addottorata presso l’Università degli Studi di Firenze. Si occupa di contatto linguistico tra greco e romanzo e di dialettologia storica. edu.sefeditrice.it