Capitolo 3. La storia di fronte al digital turn
NOTA. Il capitolo è stato estrapolato dalla tesi di laurea magistrale: "Fare storia nella società dell'informazione. Teorie, modelli pratiche", relatore prof. Maurizio Vivarelli, Università di Torino, a.a. 2015-2016
Per ulteriori informaizoni o approfondimenti si prega di contattare l'autore all'indirizzo di posta elettronica
[email protected]
3.1. Il contesto delle Digital Humanitie
Il progetto del Web Semantico, come si è visto, tenta di dare una risposta al problema
dello squilibrio tra produzione e capacità di gestione di dati e di documenti; le discipline
umanistiche hanno da sempre affrontato queste questioni tramite i sistemi di
organizzazione della conoscenza (KOS)1 e attraverso gli strumenti di curatela, la cui
essenza risiede nell’«amministrare in modo intelligente enormi quantità di dati […]
filtra[ndo], organizza[ndo], lavora[ndo], e, in ultima analisi, "prende[ndosi] cura di" una
storia creata a partire da un’infinita gamma di possibili racconti, reperti, e voci» 2. Alla
luce di questa esplosione informativa e, più in generale, in ragione dei cambiamenti
tecnologici e sociali, che in questa sede si è cercato di delineare introducendo il concetto
di società dell’informazione, risulta oggi necessario un approccio disciplinare che recuperi
il ruolo delle scienze umanistiche coniugandole con l’informatica, le tecnologie
dell’informazione (IT) e, in senso più ampio, col digitale, se, come è stato scritto, «la
tecnologia amplia la prerogativa umana di costruire significati» 3. É la grande famiglia
delle Digital Humanities4.
1
2
3
4
Per un classico della storia degli ordinamenti bibliografici si veda A. SERRAI, Le classificazioni. Idee e
materiali per una teoria e per una storia, Olschki, Firenze 1977.
A.
BURDICK
et.
al.,
Umanistica_Digitale,
Milano
2014
(ed.
or.
2012),
<https://mitpress.mit.edu/sites/default/files/titles/content/9780262018470_Open_Access_Edition.pdf>,
p. 57.
D. M. BARRY, The Computational Turn.Thinking about Digital Humanities, in «Culture Machine»,
12 (2011), <http://culturemachine.net/index.php/cm/issue/view/23>; pubblicato come Introduction al
volume Understanding Digital Humanities, edited by ID., Palgrave Macmillan, Basingstoke 2012., p. 11.
In italiano il termine è tradotto con "umanistica digitale", ma questa trasposizione non rende al
meglio l’intento di includere in questo campo di studi il più ampio numero di approcci possibili, come
è invece intrinseco nel plurale humanities; pertanto, in questa sede, si userà l’espressione inglese, che
viene spesso abbreviata con DH. Per quanto riguarda il panorama italiano esiste un’associazione,
l’AIUCD (Associazione per l’Informatica Umanistica e la Cultura Digitale, <http://www.aiucd.it>) che
raccoglie gli studiosi e gli interessati alle tematiche dell’umanistica digitale. Il nostro paese annovera
una lunga tradizione di studi interessati ai rapporti tra scienze umane discipline informatiche; tra i
molti studi si segnalano: T. ORLANDI, Informatica umanistica, NIS, Roma, 1990; M. RICCIARDI,
73
3.1.1. Un profilo storico
I primi esperimenti di applicazione delle nascenti tecnologie informatiche alle ricerche
in ambito umanistico risalgono all’apparizione dei primi calcolatori negli anni
Quaranta; è probabile tuttavia che, come evidenzia Edward Vanhoutte, l’idea di applicare
primitivi metodi computazionali alle arti si trovi per la prima volta nella traduzione delle
Notions sur la machine analytiquede Charles Babbage, fatta dalla matematica inglese Ada
Lovelace nel 1843 a partire dal testo di Luigi Federico Menabrea 5. All’indomani della
presentazione dell’ENIAC il sociologo americano Warren Weaver e uno dei suoi allievi, il
matematico inglese Andrew D. Booth, ebbero l’intuizione che il computer potesse essere
usato non solo per i calcoli balistici, ma anche in ambito umanistico, quello della
traduzione automatica (Machine Translation, MT). Presso il centro di ricerca della
Fondazione Rockfeller a Princeton Booth elaborò un sistema per immagazzinare un
dizionario in codice binario all’interno di un computer, rendendo così possibile la
Studi umanistici e nuove tecnologie, Università degli studi di Torino, Torino 1991; G. ADAMO,
Bibliografia di informatica umanistica, Bulzoni, Roma 1994. Tra i contributi più recenti: D.
FIORMONTE, Scrittura e filologia nell'era digitale, Bollati Boringhieri, Torino 2003; G. GIGLIOZZI,
Saggi di informatica umanistica, Unicopli, Milano 2008; F. BRIVIO, L'umanista informatico. XML,
HTML, CSS, SQL, Web, internet, database, programmazione e Google per le scienze umane , Apogeo,
Milano 2009; F. TOMASI, Metodologie informatiche e discipline umanistiche, Carocci, Roma 2009; D.
FIORMONTE – T. NUMERICO – F. TOMASI, L' umanista digitale, Il Mulino, Bologna 2010; M.
5
LAZZARI, Informatica umanistica, McGraw Hill, Milano 2014; L. SPINAZZÉ, Filologia digitale.
Dalla ricerca alla didattica. L'informatica umanistica al servizio delle scienze dell'antichità, Tangram
edizioni scientifiche, Trento 2015.
Il meccanismo operativo della macchina analitica, scriveva Lovelace, «potrebbe agire su altre cose oltre
ai numeri […]. Supponiamo, per esempio, che le fondamentali relazioni dei suoni nella scienza
dell'armonia e della composizione musicale fossero suscettibili di una tale espressione, il motore
potrebbe comporre ed elaborare brani musicali scientifici con qualunque grado di complessità ed
estensione». A. A. LOVELACE, Notes by the Translator, in Scientific Memoirs. Selections from The
Transactions of Foreign Academies and Learned Societies and from Foreign Journals, ed. by R.
TAYLOR, London 1843, pp. 245-95, citato in E. VANHOUTTE, The Gates of Hell. History and
Definition of Digital Humanites Computing, in Defining Digital Humanities. A Reader, ed. by M.
TERRAS, J. NYAM and E. VANHOUTTE Ashgate, Farnham 2013, p. 121.
Per un’altra introduzione storica si veda anche S. HOCKEY, The History of Humanities Computing, in
A Companion to Digital Humanities, ed. by S. SCHREIBMAN, R. SIEMENS and J. UNSWORTH,
Blackwell, Oxford 2004, <http://www.digitalhumanities.org/companion>, pp. 3-20. Per uno sguardo
sul dibattito accademico francese si faccia riferimento a M. DACOS – P. MOUNIER, Humanités
numériques. État des lieux et positionnement de la recherche française dans le contexte international ,
Institut Français, Paris 2014, <http://www.enssib.fr/bibliotheque-numerique/notices/65358-humanitesnumeriques-etat-des-lieux-et-positionnement-de-la-recherche-francaise-dans-le-contexteinternational>.
74
traduzione parola per parola; i risultati vennero raccolti nel in un memorandum nel 1949
cui seguirono la nascita di altri progetti e discussioni metodologiche in merito ai
problemi di ambiguità e funzione sintattica dei termini. Negli anni 1952-54 si svolsero
alcune prime conferenze, venne avviata la pubblicazione del «Journal of Machine
Translation», uscì il primo manuale dedicato a questi temi 6, ed infine venne realizzata
presso l’IBM la prima dimostrazione pubblica di traduzione automatica dal russo
all’inglese7. Nello stesso periodo le tecnologie nate per i lavori di traduzione vennero usate
dai filologi nell’elaborazione elettronica di concordanze lessicali; il gesuita Roberto Busa,
dopo aver discusso la sua tesi di dottorato nel 1946, avviò un progetto di lemmatizzazione
dell’opera omnia di San Tommaso, l’Index Thomisticu. Inizialmente l’Index non usava
le tecnologie informatiche, ma resosi conto della mole del materiale, Busa pensò di
rivolgersi all’IBM che, dopo tre anni, mise a disposizione le proprie macchine per
analizzare la grande massa di dati. Come raccontava egli stesso, il suo lavoro attraversò
tre fasi:
La prima durò meno di dieci anni. Cominciai nel 1949, con solo macchine a schede
perforate. Il mio obiettivo era avere uno schedario di 13 milioni di schede, una per ogni
parola, con un commento di dodici righe stampato sul retro. Lo schedario sarebbe stato
lungo 90 metri, alto 1,20 di altezza e profondo uno, con un peso di circa 500 tonnellate.
Nella Sua grazia, all’incirca nel 1955, Dio guidò gli uomini nell’invenzione dei nastri
magnetici. […]. Fino al 1980 lavorai su 1.800 nastri, lunghi ciascuno circa 2.400 piedi,
nell’insieme, 1500 chilometri, la distanza tra Parigi e Lisbona o tra Milano e Palermo. Usai
tutte le generazioni di computer-dinosauri dell’IBM. Terminai nel 1980, prima
dell’avvento dei personal computer, con 20 nastri, e preparai per la stampa, con l’aiuto della
fotocomposizione, le 20 milioni di righe che riempivano le 65.000 pagine dei 56 volumi
che racchiusero su carta l’Index Thomisticu.
La terza fase cominciò nel 1987 con la preparazione per trasferire i dati su CD-ROM. La
prima edizione uscì nel 1992 […]. Il lavoro occupa oggi 1,36 Gb di dati, compressi in un
singolo disco8.
Il valore innovativo profondo di questo primo grande esempio di applicazione delle
tecnologie informatiche alle scienze umanistiche risiede nella costruzione dei rimandi
interni fra le parole e le schede che, come è stato osservato, costituiscono un «ipertesto
6
7
Cfr. A. D. BOOTH – K. H. V. BOOTH, Automatic Digital Calculators, Butterworths, London 1953.
Cfr. J. HUTCHINS, The First Public Demonstration of Machine Translation. The Georgetown-IBM
System, 7th January 1954, 2005, <http://www.hutchinsweb.me.uk/GUIBM-2005.Pdf>.
8
R. BUSA, Foreword. Perspectives on the Digital Humanities, in A Companion to Digital Humanities,
cit., p. xvi.
75
interno»9, ovvero un'anticipazione quell’insieme di «nodi, collegamenti e sentieri
biforcanti»10 che, più o meno negli stessi anni, Vannevar Bush aveva cominciato ad
immaginare. La machine translation, da un lato, e la lexical text analysi, costituivano il
nucleo centrale del campo di studi che andò formulandosi col nome di Humanities
Computing, in italiano informatica umanistica.
Dopo un periodo di grande interesse e strutturazione accademica 11, tra la metà degli anni
Cinquanta e la metà dei Sessanta, si assistette al declino della traduzione automatica, in
favore di un aggiornamento degli studi linguistici: «il problema non [era]
l'inadeguatezza delle macchine, ma la scarsa comprensione dell’uomo del linguaggio
umano»12. Contemporaneamente, prese avvio quella che Tito Orlandi definisce come
«fase pionieristica» degli studi filologici che sperimentavano metodi computazionali 13,
caratterizzata dalla progressiva istituzionalizzazione della disciplina: nel 1965 uscì il
volume Computers for the Humanities? risultato di una conferenza sponsorizzata
dall’IBM l’anno precedente14; nel 1966 iniziò la pubblicazione del periodico Computer
and the Humanities (CHum), nel cui secondo numero fece per la prima volta apparizione
l’espressione Humanities Computing, in un articolo dedicato al linguaggio di
programmazione PL/1 per la ricerca umanistica15. Nel corso degli anni Settanta, fase di
consolidamento degli studi, nacquero le prime associazioni internazionali, l’Association
of Literary and Linguistic Computing (ALLC, 1973) e l’Association for Computers and
Humanities (ACH, 1978) e, contestualmente, vennero organizzate le prime conferenze
internazionali16.
9 E. VANHOUTTE, The Gates of Hell, cit., p. 127.
10 A. BURDICK et al.,Umanistica_Digitale, cit., p. 59.
11 Nel 1962 venne fondata l'AMTCL, Association of Machine Translation and Computational Linguistic,
sostenuta economicamente dal governo statunitense.
12 E. VANHOUTTE, The Gates of Hell, cit., 125.
13 Orlandi ricordava gli studi di Roy A. Wibsey sui testi antichi alto-tedeschi, di Félicien de Tolleanare
sulla Bibbia Gotica e poi sulla lessicografia olandese, di Bernard Quemada sulla lessicografia francese, di
Alvar Ellegård sull’inglese del Settecento e di Andrew Morran sul testo greco dell’Antico Testamento.
Cfr. T. ORLANDI, Informatica Umanistica. Realizzazioni e prospettive, in G. ADAMO et al.,
Calcolatori e Scienze Umane. Archeologia e Arte, Storia e Scienze Giuridiche e Sociali, Linguistica,
Letteratura, ETAS Libri, Milano 1992, <http://www.cmcl.it/~orlandi/pubbli/info068.pdf>, pp. 1-22.
14 Cfr. Computers for the Humanities?, ed. by G. W. PIERSON, Yale University Press, New Haven 1965
[Record della conferenza organizzata dalla Yale University, 22-23 gennaio].
15 Cfr. J. HELLER – G. W. LOGEMANN, PL/1. A Programming Language for HumanitiesResearch, in
«Computers and the Humanities», 1 (1966), n. 2, <http://www.jstor.org/stable/30199201>, pp. 19–27.
16 Verso l’inizio degli anni Sessanta non fu solo la linguistica a cercare di costruire ponti fra scienze
umane e informatica; come ricorda Gerben Zaagsma, nel 1962 venne organizzata, a Burg Wartenstein
in Austria, la conferenza The Use of Computer in Anthropology che spesso viene identificata come il
primo momento in cui si discusse di informatica umanistica. Cfr. G. ZAAGSMA, On Digital History,
76
In ambito statunitense le ricerche erano maggiormente orientate verso gli studi
computazionali (le prime monografie su queste tematiche furono realizzate dall’industria
informatica)17 mentre in Europa ci si concentrava maggiormente più sugli aspetti
strettamente filologici. A partire dal 1967, nell’ottica di standardizzare linguaggi usati per
l’edizione dei testi, vennero avviati dall’università di Oxford i progetti COCOA e TACT
(Textual Analysi Computing Tools); dopo un ventennio di ricerche su questi temi, in una
conferenza svoltasi a New York nel 1987, si cominciò a porre l’attenzione sulla possibilità
di rendere machine readable i testi digitali. Dagli atti di quella conferenza, i Poughkeepsie
Principles, grazie al cordinamento dell’ALLC nacque la Text Encoding Initiative (TEI) la
cui missione era quella di sviluppare linee guida per la codifica dei testi in ambito
umanistico; la prima versione TEI P1 (proposal 1), presentata nel 1990, usava il linguaggio
di marcatura SGML, cui fece progressivamente seguito XML (pienamente formulato
nell’ultima versione, TEI P5, 2007)18. Gli anni Ottanta, con la diffusione dei personal
computer con approccio WYSIWYG e degli accessi alla rete, moltiplicarono le possibilità
di ricerca, in particolare sugli ipertesti, e di comunicazione, grazie alle mail list – la prima
Humanist venne avviata nel 1987. Verso la fine del decennio le Humanities Computing
cominciavano ad apparire nella denominazione di corsi universitari, dipartimenti e
centri di ricerca; a ridosso degli anni Novanta il campo di studi venne ufficialmente
formalizzato con la pubblicazione dell’Humanities Computing Yearbook (1988-1990)19,
volume nel quale veniva offerta una ricognizione bibliografica e dato conto di tutti
progetti di ricerca avviati a livello globale: con l’apertura verso i media studies e con
l’avvento del Web, l’informatica umanistica, cominciava a configurarsi come un dominio
di ricerca interdisciplinare.
L’evoluzione degli studi nelle Humanities Computing dal 1990 ad oggi è stata divisa dallo
studioso David Barry in due fasi. Secondo questa lettura in una prima ondata, che arriva
fino agli inizi degli anni Duemila, caratterizzata da digitalizzazioni su larga scala, gli
strumenti digitali venivano interpretati come infrastrutture grazie alle quali, ad esempio,
compiere analisi di grandi quantità di dati che suffragassero le tesi sostenute nelle ricerche
umanistiche tradizionali (approccio quantitativo). In una seconda ondata, pressappoco
coincidente con la comparsa delle prime tecnologie 2.0 (2000-2005), l’attenzione si
in «BMGN - Low Countries Historical Review», 128 (2013), n. 4 doi:10.18352/bmgn-lchr.9344, p. 7.
17 «Nel 1971 l’IBM pubblicò una serie di manuali: Introduction to Computers in the Humanities; Literary
Data Processing; Computers in Anthropology and Archaeology». E. VANHOUTTE, The Gates of Hell,
cit., p. 130.
18 Cfr. The Humanities Computing Yearbook, ed. by I. LANCASHIRE and W. McCARTY, Clarendon
Press, Oxford 1988.
19 Cfr. Tei – History, <http://www.tei-c.org/About/history.xml>.
77
spostava verso l’uso di metodologie ibride, espandendo così la nozione di disciplina
umanistica, privilegiando un approccio qualitativo e interpretativo riguardo la
complessità dei temi di studio. Tra le due fasi Barry colloca il computational turn, un
momento di cambiamento epistemologico nelle Humanities Computing, di allargamento
dell’orizzonte di ricerca favorito dalle nuove possibilità tecnologiche, e di modifica delle
metodologie di ricerca che venivano ricombinate nel nuovo contesto, portando alla
ridefinizione dell’intera disciplina20. Questa fase transitoria si fondava su un presupposto
ermeneutico: ci si avvaleva «di strumenti computazionali in grado di trasformare il
contenuto, la portata, la metodologia e il pubblico dell’indagine umanistica tout-court»21
e di nuovi modelli di ricerca per produrre cultura in un mondo post-stampa. Preso atto di
questo cambiamento, alcuni studiosi, guidati da John Unsworth, valutarono la necessità
di proporre una nuova denominazione del campo di studi, proponendo quella più
inclusiva di Digital Humanities, che venne adottata nella pubblicazione del Blackwell
Companion (2004)22. Nei successivi cinque anni il termine ha perso il suo carattere
informale, istituzionalizzandosi a livello globale, sostituendo la definizione più precisa,
ma più ristretta, di Humanities Computing: nel 2005 venne costituita l’ADHO (Alliance
of Digital HumanitiesOrganizations), nata dalla fusione di ALLC e ACH23; nel 2006
venne fondato negli Stati Uniti l’Office for Digital Humanities24 e, nello stesso anno, la
conferenza congiunta ALLC/ACH venne rinominata in Digital Humanities25; nel 2007,
infine, iniziò la pubblicazione del Digital Humanities Quartely, uno dei tre periodici di
riferimento dell’ADHO26.
Cfr. Understanding Digital Humanities, cit., pp. 1-21.
A. BURDICK et al.,Umanistica_Digitale, cit., p. 199.
Cfr. A Companion to Digital Humanities, cit.
Ad oggi l’ADHO raccoglie le più importanti associazioni a livello globale: l’ACH (1978); la Canadian
Society for Digital Humanities / Société canadienne des humanités numériques (CSDH/SCHN);
l’Australasian Association for Digital Humanities Inc (aaDH, 2011); la Japanese Association for Digital
Humanites (JADH, 2012); Humanistica, L'association francophone des humanités numériques digitales
(Humanistica, 2010); l’EuropeanAssociation for Digital Humanities (EADH), nuovo nome assunto
dall’ALLC nel 2013. A sua volta l’EADH include la Dhd - Digital Humanities im deutsch sprachigen
Raum, la DHN - Digital humaniora i Norden e l’AIUCD. Cfr. <http://adho.org>,
<https://eadh.org/about>.
24 L’ufficio è inserito all’interno della NEH (National Endowment for Humanities), un importante
organismo federale che, dal 1965, si occupa di finanziare la ricerca umanistica; cfr. Neh,
<https://www.neh.gov/about>.
25 Le conferenze annuali congiunte iniziarono nel 1990 a Toronto, e cambiarono nome sedici anni dopo
a quella di Parigi, DH06; cfr. <http://adho.org/conference>.
26 Gli altri due sono l’oxoniense «Digital Scholarship in the Humanities» (DSH, 2015), nuova
denominazione del periodico «Literary and Linguistic Computing» (LLC, attivo dal 1986), e il
canadese «Digital Studies / Le champ numérique» (2009).
20
21
22
23
78
3.1.2. Alcune riflessioni epistemologiche
Dare una definizione univoca e definitiva di cosa siano le Digital Humanities è
impossibile, oltre che, secondo alcuni studiosi, sostanzialmente inutile27; come sottolinea
Rafael Alvarado, è quindi più opportuno pensare a una categoria sociale piuttosto che
ontologica, a una famiglia, a «una genealogia, una rete di somiglianze tra varie scuole di
pensiero, interessi metodologici, strumenti, [a] una storia di persone che hanno deciso di
chiamarsi umanisti digitali cercando di autodefinirsi» 28.
Anche nell’ambito più circoscritto delle Humanities Computing era difficile trovare una
definizione formale e, per questo motivo, si cercò di enumerare i campi applicativi della
disciplina, senza riflettere troppo sulle implicazioni epistemologiche. Partendo dunque
dal presupposto che l’informatica, attraverso la rappresentazione di oggetti culturali in
codice binario, aveva favorito lo sviluppo di metodi formali nella ricerca umanistica, si
prediligeva un approccio pratico: «se si vogliono comparare due testi lo si può fare con
carta e penna; ma se si vogliono comparare cinquanta testi l'uno con l'altro, è necessario
l’uso di qualche metodo computazionale»29. Questo tipo di riflessione poteva essere
funzionale fintanto che la gran parte degli ambiti di studio erano occupati dall’analisi
testuale, ma, nel momento in cui avveniva il computational turn, gli studiosi
cominciarono ad interrogarsi sulla natura profonda delle Humanities Computing; come
scriveva John Unsworth:
[le HC] sono una pratica rappresentativa, una forma di modellizzazione o […] di
mimetismo. Sono un modo di ragionare e un insieme di impegni ontologici e la loro
pratica rappresentativa è definita dal bisogno da un lato, di una computazione efficiente,
dall’altro dalla comunicazione30.
27 Fred Gibbs afferma che «se ci sono due cose di cui l'accademia non ha bisogno sono un altro libro su
Darwin e un altro blog post per definire cosa siano le Digital Humanities» (F. GIBBS, Digital
Humanities Definitions by Type, in fredgibbs.net, 5 settembre 2011 [blog post],
<http://fredgibbs.net/posts/post/digital-humanities-definitions-by-type>; pubblicato in Defining
Digital Humanities, cit., p. 289), mentre Rafael Alvarado arriva a sostenere la tesi che «non [può]
esiste[re] una definizione di Digital Humanities, se per definizione intendiamo un insieme consistente
di preoccupazioni teoriche e metodi di ricerca che possano essere allineati ad una disciplina data, un
campo di ricerca stabilito». (R. ALVARADO, The Digital Humanities Situation, in The Transducer, 11
maggio 2011 [blog post], <http://transducer.ontoligent.com/?p=717>; pubblicato in Debates in the
Digital Humanities, ed. by M. K. GOLD, University of Minnesota Press, Minneapolis 2012, p. 50).
28 Ibidem.
29 K. DE SMEDT et al., Computing in Humanities Education, A European Perspective,
[SOCRATES/ERASMUS thematic network project on Advanced Computing in the Humanities
(ACO*HUM)], University of Bergen, Bergen 1999, citato in Defining Digital Humanities, cit., p. 4.
30 J. UNSOWRTH, What i Humanities Computing and What i Not? , in «Jahrbuch für
Computerphilologie», 4 (2002), <http://computerphilologie.uni-muenchen.de/jg02/unsworth.html>,
79
L’uso dei linguaggi e dei metodi computazionali per la ricerca umanistica, come ed
esempio TEI, crea modelli e formalismi che riducono la complessità delle analisi; la
modellizzazione, ricorda Vanhoutte, è un processo che parte da una conoscenza
imperfetta e articolata, arrivando ad uno sguardo più profondo sulla realtà 31; è un
procedimento ermeneutico, se con questo termine si intende l’insieme delle
«interpretazioni che conferiscono valore agli oggetti culturali»32. Il digitale si comporta
dunque come un medium.
Partendo da queste riflessioni, Williard McCarty sottolineava che esiste una «differenza
sostanziale tra la computazione per le scienze umane, e nelle scienze umane»33. Dal
momento che le tecnologie sono embedded nella società contemporanea e che portano ad
un ripensamento di tutte le aree del sapere, Dave Parry afferma che non possono esistere
delle humanities non digital, che non è più possibile svolgere ricerca nella maniera
tradizionale, con matita e macchina da scrivere. Quello che viene definito come
umanesimo digitale presenta quindi un duplice approccio: il digitale come una serie di
applicazioni utili alla ricerca umanistica (approccio strumentale) o come oggetto di studi
(approccio metodologico)34. Ma gli strumenti digitali sono per natura multimediali,
«artefatti retorici basati sui computer in cui sono integrati molteplici media, in un
insieme artistico e interattivo»35; la loro caratteristica è quella di «collegare, connettere,
unire e tradurre, rompere e riformulare» i vecchi media «che diventano – come
osservava McLuhan– il contenuto di quelli nuovi» 36. Per questa ragione, le Digital
Humanities non possono che avere, come sostiene McCarty, un approccio
interdisciplinare; esse sono, riprendendo la metafora di Peter Galison, trading zones,
«luoghi dove avviene il lavoro interdisciplinare e dove, allo stesso tempo, vengono
mantenute le differenti tradizioni e portato avanti il reciproco scambio [tra le
discipline]»37. Secondo Patrik Svensson:
pp. 71-85; pubblicato in Defining Digital Humanities, cit., p. 8.
31 Cfr. E.VANHOUTTE, The Gates of Hell, cit., p. 140-141.
32 Ivi, p.141. Cfr. L. BURNARD, On the Hermeneutic Implications of Text Encoding, in New Media and
the Humanities. Research and Applications, ed. by D. FIORMONTE, J. USHER, Humanities
Computing Unit, Oxford 2001, pp. 31-38.
33 Cfr. W. McCARTY, Humanities Computing, Palgrave Macmillan, Basingstoke 2005.
34 Cfr. D. PARRY, The Digital Humanities or a Digital Humanism, in Debates in the Digital
Humanities, cit., pp. 429-437.
35 G. ROCKWELL, Is Humanities Computing and Academic Discipline?,Univeristy of Virginia 1999
intervento al seminario interdisciplinare Is Humanities Computing and Academic Discipline?,
Univeristy of Virginia 12 novembre 1999; pubblicato in Defining Digital Humanities, cit., p. 22.
36 C. BASSETT, Canonicalism and Computational Turn, in Understanding Digital Humanities, cit., p.
107.
80
Le Digital Humanities possono essere viste come una trading zone frazionata (non
omogenea) e cooperativa (non costretta) e un luogo di incontro che supporta
profondamente il lavoro collaborativo, l’espressione individuale, le connessioni inaspettate
e le sinergie. Il digitale, in un senso ampio e in varie manifestazione, funzione come un
oggetto dai confini condivisi38.
L’abbattimento delle barriere disciplinari ha quindi portato ad un progressivo
allargamento dei campi di ricerca e degli scenari applicativi delle Digital Humanities.
Riprendendo una fortunata metafora, si può parlare di una big tent39 che abbraccia la
varietà dei possibili ambiti di ricerca: dall’analisi testuale alla Cultural Analytics40; dalla
ricerca basata sull’applicazione delle tecnologie computazionali all’ambito storico,
letterario e artistico all’umanistica ludica; dalle strategie per conservare l’eredità culturale
di biblioteche, archivi e musei all’elaborazione di visualizzazioni grafiche della varietà
dei dati (information visualisation); dall’analisi del linguaggio naturale (NLP, Natural
Language Processing) ai media studies. In senso lato sono tutti strumenti che consentono
di «vagliare, analizzare, mappare, valutare – e riscrivere – in modo efficace la valanga di
dati digitali […] di individuare tendenze e relazioni»41.
Come illustrato in precedenza, lo scopo del Web è da sempre quello di «consentire
l’esplorazione e lo scambio delle idee» 42; grazie al potenziale delle tecnologie 2.0, le
Digital Humanities hanno ampliato i loro confini e ripensato i propri limiti. Ad esempio
l’ubiquitou computing abbatte gli spazi tradizionali della produzione e comunicazione
delle conoscenze, la divisione tra aula, biblioteca e archivio, consentendo, in linea
37 P. SVENSSON, Beyond the Big Tent, in Debates in the Digital Humanities, cit., p. 46. Cfr. P.
GALISON, Image & Logic. A Material Culture of Microphysics, University of Chicago Press, Chicago
1997.
38 P. SVENSSON, Beyond the Big Tent, cit., p. 46.
39 Cfr. Ivi, p. 36.
40 L’analitica culturale è quella «pratica che prevede l'utilizzo di strumenti di analisi computazionale di
fascia alta e di visualizzazione di insiemi culturali su larga scala […] amplia[ndo], inolte il corpu di
oggetti e materiali esaminati dagli studiosi delle discipline umanistiche» (A. BURDICK et. al.,
Umanistica_Digitale, cit., p. 69). Le tecnologie di data mining e di estrazione automatica delle
informazioni, adottate nell’analisi dei big data vengono applicati per esempio al giornalismo o alla
professione legale e consentono di manipolare, strutturare e visualizzare i dati mostrandone sia le
caratteristiche specifiche che le tendenze su larga scala. Un esempio è il servizio Ngram Viewer di
Google Books che, tramite l’approccio statistico "n-gramma", consente di cercare le occorrenze di uno
o più termini all’interno dell’insieme dei volumi digitalizzati dall’azienda californiana
( <https://books.google.com/ngrams>; cfr. infra § 3.2.6) .
41 A. BURDICK et. al., Umanistica_Digitale, cit., p. 65. In generale, per una presentazione dei vari scenari
possibili all’interno delle Digital Humanities cfr. Ivi, pp. 51-130.
42 L. SPIRO, “Thi Is Why We Fight”. Defining the Values of the Digital Humanities, in Debates in the
Digital Humanities, cit., p. 22.
81
teorica, un accesso democratico al sapere; il mashup o remix dei contenuti ha consentito
il superamento dell’approccio di «sola lettura» dei contenuti digitali, favorendo quello di
«lettura-scrittura-riscrittura»43. Lisa Spiro ha colto nel cambiamento tecnologico la
possibilità di ripensare gli obiettivi della disciplina e proporre una serie di presupposti etici
e di valori per la ricerca nel campo delle Digital Humanities 2.044, tra i quali si possono
evidenziare: a) openess, scambio libero e aperto delle idee, basato sui principi dell’open
source, della licenza Creative Commons e sulla revisione peer-to-peer; b) collaboration,
creazione di team molto diversificati per leggere i problemi e i flussi informativi da
diverse prospettive; c) experimentation, l’importanza rivestita dal metodo e da
applicazioni per supportare l’esplorazione e l’interpretazione dei dati culturali 45.
Ma quale può essere, alla luce di queste riflessioni, una parziale risposta alla domanda:
"cosa sono le Digital Humanities?" Una buona sintesi è stata proposta da Katlheen
Fitzpatrick, che le definisce come:
un legame fra domini di studio all’interno del quale i ricercatori usano le tecnologie
computazionali per indagare le tradizionali problematiche delle discipline umanistiche, o
porre domande, orientate dalle ricerche nelle scienze umane, sui temi riguardanti le
tecnologie computazionali46
Uno degli scenari che abbracciano un’analisi del digitale ad un livello più profondo
rispetto a quello strumentale è rappresentato dai software studies. «Grazie all’insistenza di
McLuahn sul ruolo della tecnologia come agente di cambiamento – osserva Federica
Frabetti –, quest’ultima era già da molti anni entrata a far parte del campo dei media e dei
cultural studies»47. L’ambito dei software studies, inserendosi in questa tradizione,
propone di indagare il software come oggetto storico, come un medium o «motore
culturale»48; in questa prospettiva il coding, «area di produzione delle Humanites
Computing»49, può essere studiato anche come una particolare forma di scrittura che si
sviluppa a partire dagli anni Sessanta del Novecento. Alla luce di ciò si può proporre una
riconcettualizzazione delle Digital Humanities come un ambito di studi che cerca di
43 A. BURDICK et. al.,Umanistica_Digitale, cit., p. 93.
44 Cfr. The Digital Humanities Manifesto 2.0, in digitalhumanities, 29 maggio 2009 [blog post],
<http://manifesto.humanities.ucla.edu/2009/05/29/the-digital-humanities-manifesto-20>, § 46.
45 Cfr. L. SPIRO, “Thi Is Why We Fight”, cit., pp. 19-31.
46 K. FITZPATRICK, The Humanities, Done Digitally, in Debates in the Digital Humanities, cit., pp. 12.
47 F. FRABETTI, Have the Humanities Always Been Digital? For an Understandig of the “Digital
Humanities” in the Context of OriginaryTechnicity, in Understanding Digital Humanities, cit., p. 163.
48 Ivi.,
p.
164.
Cfr.
L.
MANOVICH,
Software
Takes
Command,
2008,
<http://softwarestudies.com/softbook/manovich_softbook_11_20_2008.pdf> .
49 N. K. HAYLES, How We Think. Transforming Power and Digital Technologies, in Understanding
Digital Humanities, cit., p. 46.
82
«comprendere il digitale in termini tecnici, da un lato, e dall’altro indagando le [sue]
dinamiche di produzione, circolazione e consumo» 50. Pertanto si tratta, come è stato
notato, di un «dominio di ricerca ibrido, trans-disciplinare che abbatte le barriere
tradizionali tra teoria e pratica»51; creando un ponte fra tecnologia e scienze umane, le
Digital Humanities si presentano come un tentativo di ricucitura della frattura tra le "due
culture".
Nel suo famoso saggio del 1959, intitolato appunto Le due culture, lo scrittore e scienziato
britannico Charles P. Snow, prendeva atto della crisi del modello humboldtiano di
produzione della conoscenza, della separazione e della reciproca incomprensione tra
discipline letterarie (cultura già allora in ritirata) e scientifiche (cultura in ascesa),
cominciata a inizio Novecento; l’atteggiamento luddista degli umanisti nei confronti
della scienza e quello disinteressato degli scienziati nei confronti delle arti conducevano
Snow a formulare la necessità di colmare questa frattura per rilanciare la funzione del
pensiero occidentale52. Oggi, più di mezzo secolo dopo, il digitale offre una risposta a
quella necessità; anche nelle scienze umane, l’accettazione, su larga scala tardiva, della
tecnologia, conduce alla riabilitazione delle discipline cosiddette ausiliarie – quelle che,
come l’archivistica si occupano di organizzare la conoscenza – sanando il conflitto tra
approccio pratico ed euristico53. Il digitale può essere letto come una rivoluzione,
nell’accezione kuhniana del termine, un cambiamento epocale: le tecnologie
informatiche favoriscono la ridefinizione dei paradigmi disciplinari e l’unificazione delle
molteplici conoscenze prodotte negli ambiti accademici. Se i media digitali superano i
tradizionali spazi e canali di produzione e comunicazione del sapere, allora, attraverso le
Digital Humanities può essere proposta non solo una nuova prospettiva di ricerca, ma
anche un rinnovamento del concetto di Bildung, vale a dire di una formazione poliedrica
che consenta uno libero sviluppo spirituale dell’uomo54.
50 F. FRABETTI, Have the Humanities Always Been Digital? , cit., p. 169.
51 J. FLANDERS – W. PIEZ – M. TERRAS, Welcome to Digital Humanities Quarterly, in «Digital
Humanities Quarterly», 1 (2007), n. 1; citato in, P. SVENSSON, Humanities Computing as Digital
Humanities,
in
«Digital
Humanities
Quarterly»,
3
(2009),
n.
3,
<http://digitalhumanities.org/dhq/vol/3/3/000065/000065.html>, pubblicato in Defining Digital
Humanities, cit., p. 174.
52 Cfr. C. P. SNOW, Le due culture, Marsilio, Venezia 2005 (ed. or. 1959).
53 Cfr. B. RIEDER – T. RÖHLE, Digital Methods. Five Challenges, in Understanding Digital
Humanities, cit., pp. 67-85.
54 Cfr. Understanding Digital Humanities, cit., pp. 7-16.
83
Illustrazioni §3.1
Figura 33. La dislocazione europea di centri di ricerca, dipartimenti, corsi di laurea,
corsi universitari e summer school inerenti alle Digital Humanities (<https://dhregistry.de.dariah.eu>).
84
3.2 Storia digitale o storia con il digitale?
3.2.1 Premessa
Nell'ampia cornice delle Digital Humanities il rapporto che intercorre tra le discipline
storiche e quelle informatiche merita una riflessione separata. La peculiarità del metodo
storico, l’esercizio critico sulla natura delle fonti, si è da subito scontrata con l’intrinseca
virtualità dei documenti digitali, aprendo la strada a implicazioni che solo in parte
coincidono con le riflessioni che valgono per l’umanistica digitale. Come afferma Serge
Noiret, uno tra i primi storici in Italia ad interessarsi delle questioni relative ai rapporti
tra storia e informatica,
quasi tutte le problematiche tradizionali del mestiere di storico, dalla delimitazione di
un’ipotesi di ricerca alla scoperta, all’accesso e alla gestione dei documenti e delle fonti,
fino al conseguimento di un impianto narrativo e, soprattutto, alla comunicazione della
storia e dei risultati della ricerca, e, infine all’insegnamento della storia, passano oramai in
parte o in toto, attraverso lo schermo del computer55.
Partendo dallo stesso tipo di considerazioni pratiche, Roy Rosenzweig, già fondatore del
Center for History and New Media56, nel 2003 parlava di «destrutturazione della pratica
storica portata dalle tecnologie digitale» che ha condotto «gli storici ad interrogarsi
sugli obiettivi e le metodologie del proprio mestiere» 57. Il digital turn, il momento in cui
le tecnologie digitali sono divenute indispensabili per l’attività di ricerca e lavoro –
all’incirca dalla seconda metà degli anni Novanta – ha posto quindi, «in maniera
drammatica», la necessità di «ripensare la natura stessa dell’attività di ricerca» 58. Il
S. NOIRET, Storia digitale o storia con il digitale?, in «Storiografia», 18 (2014), doi: 10.1400/230761 , p.
242.
56 CHNM, presso la George Manson University, Fairfax, Virginia; oggi porta il nome del suo fondatore.
L’obiettivo del centro di ricerca è semplice: «Democratizing history through digital media and tools»;
<https://rrchnm.org> .
57 R. ROSENZWEIG, Scarcity or Abundance? Preserving the Past in a Digital Era, in «The American
Historical Review», 108 (2003), n. 3, doi:10.2307/3523084, pp. 735–62; ripubblicato in ID., Clio Wired.
The Future of the Past in the Digital Age, Columbia University Press, New York 2011, pp. 3-28.
58 «Le risorse digitali hanno già trasformato i modi in cui è condotta la ricerca nelle scienze umane – si
affermava in un rapporto redatto dal King’s College di Londra nel 2006 – e il loro impatto non potrà
che crescere in parallelo allo sviluppo di nuove tecnologie e alla pubblicazione [digitale] di nuovi
materiali. […] Le risorse digitali possono cambiare le metodologie di lavoro rendendo i materiali più
facilmente accessibili, rendendo possibile collegarli ad altre risorse e facendo risparmiare nella ricerca e
nella navigazione dei contenuti. Possono anche, tuttavia, cambiare la natura della ricerca che si è
55
85
campo disciplinare che si delinea come storia digitale, non comprende soltanto
«l’utilizzo di nuovi strumenti digitali che facilitano pratiche [consolidate] […] ma si
tratta anche dello sviluppo di un rapporto stretto con le tecnologie» 59 che pone nuove
questioni epistemologiche. Nonostante già trent’anni fa si riflettesse sull’impatto che i
computer avevano assunto nella pratica storica 60, la maggior parte degli studiosi si è
dimostrata, con ragioni fondate, disinteressata e scettica rispetto alle possibilità offerte
dalle tecnologie, avviando con ritardo quel dibattito che si è visto fervido all’interno delle
altre scienze umane.
L’interesse posto dagli storici per l’informatica, coltivato più che altro dai prosecutori
della scuola quantitativa e dalle ricerche di ambito filologico-documentario, ha visto un
rinnovamento grazie alla diffusione del Web, in seguito alla quale «divenire digitali non
è [più] una scelta, ma un dato di fatto» 61. Se oggi, a distanza di venticinque anni, si
impone ancora la necessità di una discussione, questo è sintomatico della lentezza con la
quale la comunità storica, in particolare quella europea, nonostante un numero crescente
di eccezioni, abbia affrontato le questioni metodologiche relative al digitale. In una
prospettiva critica, ma comunque desiderosa di sollecitare riflessioni positive in merito ad
una maggiore cooperazione tra le discipline storiche e quelle informatiche, ci si propone,
in queste pagine, di adottare un approccio né ottimista, né pessimista e soprattutto non
appiattito sull’adesione alla moda imperante del "2.0". La prospettiva è quindi quella di un
"tecno-realismo"62, che cerchi di rispondere alla sollecitazione fatta da Marc Bloch in
un’era quasi totalmente analogica:
Lo strumento, certo, non fa scienza. Ma una società che abbia la pretesa di rispettare le
scienze non dovrebbe disinteressarsi dei loro strumenti. Certo sarebbe saggio altresì non
affidarsi troppo, per questo, a corpi accademici, il cui reclutamento, favorevole alla
59
60
61
62
intrapresa, consentendo di interrogare le risorse, storiche e non, in modalità del tutto nuove e porre in
agenda nuove questioni. C’è un chiaro riconoscimento di ciò all’interno della professione anche tra
coloro i quali si sono già affacciati con questo quadro di ricerca alterato. […] le risorse digitali offrono
un tremendo potenziale di democratizzazione della disciplina, ma questo dipende dall’esistenza di un
accesso alle risorse open e finanziato pubblicamente». D. BATES et al., Peer Review and Evaluation of
Digital Resources for the Arts and Humanities. Final Report, Institute of Historical Research, London
2006, <http://www.history.ac.uk/sites/history.ac.uk/files/Peer_review_report2006.pdf>, p. 13.
S. NOIRET, Storia digitale o storia con il digitale?, cit., p. 242.
Cfr. J.-P. GENET, Histoire, Informatique, Mesure, in «Histoire & Mesure», 1 (1986), n. 1,
doi:10.3406/hism.1986.904, pp. 7-18.
G. ZAAGSMA, On Digital History, p. 19.
Cfr. D. J. COHEN – R. ROSENZWIEG, Digital History. A Guide to Gathering, Preserving, and
Presenting the Past on the Web, University of Pennsylvania Press, Philadelphia 2006,
<http://chnm.gmu.edu/digitalhistory/exploring>, § 2.
86
preminenza dell’età e benevolo coi i bravi scolari, non dispone particolarmente allo spirito
di iniziativa63.
3.2.2 Origini
Tra iper-entusiasti e ultra-scettici il rapporto tra "storici e computer" 64 (e Web) è da
sempre molto controverso. I primi studi inerenti l'applicazione di metodologie
computazionali alla ricerca storica risalgono all'inizio degli anni Sessanta in ambito
francese e statunitense65; l'uso delle macchine a schede perforate per l'analisi di dati storici,
tuttavia, si retrodata di un decennio, a quell'«epoca dei precursori» 66, come l’ha chiamata
Tito Orlandi, aperta dal mastodontico lavoro di padre Busa nel 1949. Quindi, secondo
Geerbert Zaagsma, «assumendo che la storia sia una disciplina accademica moderna e che
la professione sia strutturata dalla seconda metà del XIX secolo, ne consegue che il digitale
sia parte della pratica storica da un considerevole periodo di tempo» 67, più di mezzo
secolo.
Fu nel tentativo di dare alla storia uno statuto maggiormente scientifico e oggettivo,
inglobando le metodologie proprie delle scienze sociali (sociologia, economia e
demografia), che venne avviato l'uso massiccio di strumenti informatici. La storia
quantitativa, disciplina nata nel solco della scuola delle Annales, che aveva fra i suoi
caratteri fondativi l'uso di metodologie di analisi statistica per l'elaborazione dei dati
provenienti dalle fonti nella costruzione e verifica delle ipotesi interpretative 68, ricevette
63 M. BLOCH, Apologia della storia,cit, pp.55-56.
64 Cfr. Storia & computer. Alla ricerca del passato con l’informatica, a cura di S. SOLDANI e L.
TOMASSINI, Bruno Mondadori, Milano 1996.
65 Cfr. J.-C. GARDIN – P. GARELLI, Étude par ordinateurs des établissements assyriens en Cappadoce,
in «Annales. Économies, Sociétés, Civilisations», XVI (1961), n. 5, doi:10.3406/ahess.1961.420758 pp. 837
-76, e W. O. AYDELOTTE, Voting Patterns in the British House of Commons in the 1840s, in
«Comparative Studies in Society and History», 5 (1963), n. 2, doi:10.1017/S0010417500001596, pp. 134–63;
citati in S. VITALI, Passato digitale. Le fonti dello storico nell’era del computer, Bruno Mondadori,
Milano 2004, § 1.1. Il primo studio che ricostruiva le origini dei rapporti tra storici e informatica sono
quelli di R. P. SWIERENGA, Clio and Computers. A Survey of Computerized Research in History, in
«Computers and the Humanities» 5 (1970), n. 1, pp. 1-21 e ID., Computers and American History. The
Impact of the “New” Generation, in «The Journal of American History» 60 (1974), n. 5,
doi:10.2307/1901012, pp. 1045–70.
66 Cfr. C. FAVERO, Developing Digital Historians in Italy, The Open University, 2014,
<http://oro.open.ac.uk/44504> [Tesi di dottorato], p. 24.
67 G. ZAAGSMA, On Digital History, cit., p. 2
68 Cfr. P. BURKE, Una rivoluzione storiografica. La scuola delle Annales. 1929-1989, Laterza, Roma-Bari
1993² (ed. or. 1990).
87
così un nuovo impulso: «la quantificazione era lo strumento per collocare a tutti gli
effetti la storia all'interno del quadro delle altre scienze sociali, possibilmente in
posizione egemonica»69. Partendo dal presupposto di a rendere «solo il quantificabile
oggetto di storia»70 si affermava, specialmente negli Stati Uniti la tendenza a leggere la
storia come un mezzo per «scoprire e dimostrare le leggi generali del comportamento
umano»71, basandosi sui dati di natura economico-statistica (cliometria). L'approccio
adottato dalla storia quantitativa, da alcuni critici coevi era ricondotto ad una sorta di
atteggiamento neopositivista, veniva difeso da storici come François Furet i quali
sottolineavano la possibilità di aprire nuovi problemi e prospettive di ricerca grazie
all'analisi massiccia delle fonti; in quest’ottica l'uso del computer segnava non solo un
progresso tecnologico, ma anche «una coazione teorica molto utile, nella misura in cui la
formalizzazione di una serie documentaria obbliga[va] fin dall'inizio lo storico […] a
costruire il suo oggetto di ricerca, a riflettere sulle sue ipotesi, e a passare dall'implicito
all'esplicito»72. I processi informatici cui guardava la storia quantitativa erano
naturalmente molto differenti rispetto a quelli odierni: avvenivano nei pochi centri di
calcolo universitari tramite l'uso di schede perforate o nastri magnetici (batching), i tempi
di preparazione e attesa dei risultati erano lunghissimi e occorreva una folta schiera di
tecnici che aiutasse gli studiosi nelle loro elaborazioni 73. Nonostante i costi elevatissimi e i
risultati non propriamente soddisfacenti, l'informatica appariva, verso la fine degli anni
Sessanta se non l'unica frontiera per lo storico del futuro 74, almeno l'unica disciplina in
69 Cfr. S. VITALI, Passato digitale, cit., p. 9; questo tipo di dibattito era sorprendentemente in ritardo
rispetto a quello sulle rivoluzioni scientifiche avviato da Thomas Kuhn nei primi anni Sessanta. Cfr.
supra § 1.3.1.
70 Cfr. E. LE ROY LADURIE, Le frontiere dello storico, Laterza, Roma – Bari 1976 (ed. or. 1973).
71 R. P. SWIERENGA, Computers and American History, cit, p. 1062; citato in S. VITALI, Passato
digitale, cit., p. 9.
72 F. FURET, Il quantitativo in storia, in Fare storia. Temi e metodi della nuova storiografia, a cura di J. Le
GOFF e P. NORA, Einaudi, Torino 1981, p. 15; citato in S. VITALI, Passato digitale, cit., pp. 19-20.
73 Un esempio fu la codificazione in digitale del Catasto fiorentino del 1427, avvenuta tra il 1966 e il 1972
sotto la direzione di David Herlihy, database ora consultabile online al sito
<http://cds.library.brown.edu/projects/catasto/overview.html>; cfr. D. HERLIHY – C. KLAPISHZUBER, I Toscani e le loro famiglie. Uno studio sul catasto fiorentino del 1427, Il Mulino, Bologna 1988
(ed. or. 1985).
74 «Per quanto riguarda la storia quantitativa un facile pronostico s'impone anche in Francia: almeno in
questo campo, lo storico di domani dovrà essere un programmatore o non sarà affatto»; (E. LE ROY
LADURIE L'historien et l'ordinateur, «Le Nouvel Observateur», 8 maggio 1968; tradotto in ID., Le
frontiere dello storico, cit., p. 7).
88
grado di aiutare gli storici nel «mâitriser le gigantisme» 75 della crescente massa
documentaria contenuta negli archivi.
In ambito europeo, al di fuori dell’interesse mostrato dagli storici quantitativi, furono
soprattutto i medievisti ad interessarsi alle implicazioni teoriche nell’uso di strumenti
informatici per le ricerche storiche, organizzando un primo ciclo di studi seminariali
all’École Française di Roma nel 197776. Negli stessi anni si assistette ad un raffreddamento
dell'interesse nei confronti della storia quantitativa i cui punti critici riguardavano, da un
lato, l'eccessiva riduzione della complessità dei problemi storici nella computazione e
dall'altro l'eccessiva fiducia nella costruzione e validazione di ipotesi che spesso si erano
rivelate erronee. Così, nel quadro delle mutate prospettive storiografiche, come
l'antropologia storica, la nuova storia culturale e la microstoria, l'attenzione degli storici
rispetto alle discipline informatiche divenne più lieve e progressivamente incentrata sul
testo più che sull'analisi statistica – studiosi come Lawrence Stone furono tra i primi a
leggere in questo mutamento lo spostamento del dibattito storiografico sui problemi
posti dal cosiddetto linguistic turn77. In questo contesto, le metodologie della storia
quantitativa, sebbene per un certo periodo di tempo relegate ad una nicchia, vennero
riprese successivamente spurie dalla costruzione di leggi universali, come valide alleate per
l’analisi testuale e, oggi, da coloro i quali propongono un tipo di storiografia che usa
anche i big data.
La diffusione dei personal computer negli anni Ottanta che, come si è visto, segnò un
punto di svolta nella ricerca umanistica tout court, rappresentò invece per la comunità
storica un momento di parziale isolamento rispetto all’evoluzione tecnologica, sia per un
latente scetticismo, sia soprattutto a causa i numerosi problemi filologici insiti nel
passaggio alla ricerca per mezzo dei documenti digitali. Nonostante questo momento di
riflessione, ci furono, nella comunità storica, alcuni esempi di avvicinamento agli
orizzonti di ricerca proposti nell’ambito delle Humanities Computing. L’avvento
dell’informatica di consumo permise agli storici di usare i computer senza intermediari;
uno dei progetti più riusciti di informatica storica fu senza dubbio l’«historical
workstation» KELIO sviluppata da Manfred Thaller presso il Max-Planck Institut di
Berlino a partire dal 1978, che forniva uno spazio virtuale per l’editazione dei testi, la
75 Cfr. Historie économique et sociale de la France, dirigée par Fernand Braudel et Ernest Labrousse, vol. I,
L'avenènement de l'ère industrielle (1789-1880), Puf, Paris 1976, p. 15.
76 Il convegno si intitolava Informatique et histoire médievale e fu organizzato da Lucie Fosser, André
Vauchez e Cinzio Violante; cfr. A. ZORZI, Conclusioni. Fare storia 2.0, in Les historiens et
l’informatique. Un métier à réinvetner, dirigé par J.-P. GENET et A. ZORZI, École Française de
Rome, Rome 2011, doi:10.1400/171941, p. 320.
77 Cfr. L. STONE, Viaggio nella storia, Laterza, Roma-Bari 1987 (ed. or. 1981).
89
consultazione di database e di fonti digitalizzate 78. Accanto a questo tipo di
sperimentazione si affacciava l’uso di Internet, che, come si è visto, assumeva durante la
seconda metà degli anni ‘80, un ruolo importante nelle università; prima della diffusione
del Web gli storici cominciavano ad usare le liste di discussione (come HISTORY) che
rimandavano a numerosi progetti di siti espressi col protocollo FTP contenenti fonti
storiche di varia natura79. Proprio con il proposito di dare conto della quantità crescente
di progetti di «applicazione degli strumenti informatici alla ricerca storica» 80 e delle loro
implicazioni metodologiche, nel 1987-89 vennero pubblicati due volumi dal titolo
History and Computing81; queste monografie rientravano sotto l’egida dell’Association for
History and Computing (AHC), fondata nel 1985, che diffonde dal 1989 un suo periodico,
History & Computing82.
Riprendendo il modello di periodizzazione proposto da Claudia Favero, questa prima fase
di riflessioni sul rapporto tra discipline storiche e informatiche si può far concludere con
il convegno dell’AHC svoltosi a Bologna nel 1992; in quella occasione il Web, che pure era
una realtà già avviata da un paio di anni non fu al centro delle riflessioni degli storici,
come invece avvenne dall’anno successivo, con la comparsa del browser Mosaic 83. Come
ricorda Lynn Nelson, da quando cominciò ad essere alla portata di tutti la pubblicazione e
la fruizione di contenuti, il Web venne riempito di materiali, direttamente o
indirettamente utili alla ricerca: «centinaia di liste di discussioni, migliaia di libri, poesie,
opere teatrali e saggi; centinaia di migliaia di documenti, bollettini, elenchi, cataloghi,
mappe, illustrazioni e materiale del genere», che vennero poi raccolte nel progetto
WWW Virtual Library84. Questa sorta di «archivio globale» 85 e infinito propose agli
storici nuove possibilità conoscitive (come la scrittura ipertestuale, l’accesso immediato
78 Cfr. R. MINUTI, Internet e il mestiere di storico. Riflessioni sulle incertezze di una mutazione, in
«Cromhos», 6 (2001), <http://www.fupress.net/index.php/cromohs/article/view/15778>, pp. 1-75.
79 Cfr. L. H. NELSON, Prima del Web. Gli sviluppi della storia on line, in Linguaggi e siti: la storia online, a cura di S. Noiret, in «Memoria e ricerca», 3 (1999), pp. 115-131.
80 R. ROWLAND, L’informatica e il mestiere dello storico, in «Quaderni Storici», XXVI, 78 (1991), n. 3,
pp. 693-720.
Cfr. History and Computing 1, ed. by P. DELNEY and D. HOPKIN, Manchester Unicersity Press,
Manchester 1987 e History and Computing 2, ed. by P. DELNEY, S. FOGELVIK and C. HARVEY,
Manchester Unicersity Press, Manchester 1989.
82 L’ACH fu attiva fino al 2001; nel 1996 venne fondata l’American Association for History and
Computing (AACH), che tiene conferenze biennali e pubblica un suo periodico
(<https://www.historians.org/about-aha-and-membership/affiliated-societies/american-associationfor-history-and-computing>).
83 Cfr. C. FAVERO, Developing Digital Historians in Italy, cit., pp. 24- 34. Cfr. Storia & multimedia. Atti
del settimo congresso internazionale dell’Association for History and Computing, ed. by F. BOCCHI e P.
DELNEY, Grafis, Bologna 1994.
81
90
alle informazioni…), ma ripropose antichi problemi, facendone sorgere di nuovi. In
primo luogo quello della natura virtuale del documento digitale veniva ulteriormente
amplificato dalla possibilità di essere accessibile dovunque e in qualunque momento
rendendo quindi difficile la sua esegesi. In secondo luogo, la possibilità offerta dalla rete
di pubblicare sia senza intermediari poneva problemi relativi alla validità dei contenuti e
abbatteva i confini accademici e faceva entrare definitivamente il concetto di autorità.
Nella "società liquida" la letterale esplosione di siti e pagine relative ad argomenti storici,
spesso molto controversi (come l’Olocausto o il Risorgimento), era, ed è, difficile da
controllare; anche prima della diffusione capillare della rete il processo di moltiplicazione
delle voci era evidente, ma come osservava Rosenzweig, ancor di più grazie al Web,
«everyone is an historian»86.
Inizialmente gli storici intervennero soprattutto per cercare di dare un forma al mare
magnum informativo continuamente in crescita; era l’obiettivo di vere e proprie guide
all’uso critico della rete come quelle di Trinke e Merriman 87 che si proponevano di fornire
un elenco ragionato dei siti web che trattassero argomenti di carattere storico o
raccogliessero fonti utili alla ricerca. Il problema di questi repertori non era solo la loro
necessaria incompletezza e rapida obsolescenza, ma anche il tentativo impossibile e forse
erroneo di costruire una sorta di indice dei contenuti digitali ritenuti attendibili. Accanto
a questo tipo di pubblicazioni si affacciava, partendo dai lavori di Rosenzweig e del
collega Dan Cohen, una tipologia di studi incentrati sull'analisi del Web come
espressione di una storia dal basso, fatta da appassionati, da associazioni culturali o più
semplicemente dai cittadini per raccogliere e divulgare le proprie memorie 88. Le
possibilità di condivisione che la rete offriva sono state, come mostrato in precedenza,
ampliate dal Web 2.0 nelle sue sfaccettate forme collaborative, che naturalmente
investivano anche il vasto campo delle discipline storiche, come blog di docenti o storici
dilettanti, contenuti multimediali a carattere divulgativo e, soprattutto, Wikipedia. Se gli
84 Cfr. L. H. NELSON, Prima del Web, cit., p. 115. Cfr. WWW-Virtual Library, <http://vlib.org> (oggi
non più aggiornato).
85 Internet è «semplicemente il più rivoluzionario magazzino della conoscenza mai costruito nella storia
dell’uomo». D. TRINKE – S. MERRIMAN, The History Highway 2000. Guide to Internet Resources,
Sharpe, Amonk 2000, p. xiii.
86 Cfr. R. ROSENZWEIG – D. THELEN, The Presence of the Past. Popular Uses of History in American
Life Columbia University Press, New York 1998, pp. 177-190.
87 Cfr. D. TRINKE et al., The History Highway. A Guide to Internet Resources, Sharpe, Amonk 1997; ID.
– S. MERRIMAN, The History Highway 2000. A Guide to Internet Resources, Sharpe, Amonk 2000;
ID., The History Highway. A Guide to Internet Resources, Sharpe, Amonk 2002; ID., The European
History Highway. A Guide to Internet Resources, Sharpe, Amonk 2002.
88 Cfr. D. J. COHEN – R. ROSENZWIEG, Digital History. A Guide, cit.
91
storici più tradizionalisti si erano già trovati spaesati di fronte al Web ipertestuale,
l’atteggiamento assunto da una parte consistente del mondo accademico riguardo a
queste nuove forme di scrittura e comunicazione della storia è stato fino ad oggi per lo più
distaccato.
3.2.3 Riflessioni epistemologiche: un nuovo ambito disciplinare?
Usare le tecnologie digitali per scrivere testi, reperire le fonti e organizzarle con un
computer, ovviamente, non vuol dire essere storici digitali 89; in questo senso Cohen ha
distinto tra un atteggiamento di chi usa le tecnologie in maniera raw, cioè solamente
fruendo delle possibilità offerte, e chi in maniera cooked, invece si impegna in primo
luogo in un’analisi metodologica e in secondo luogo all’arricchimento dei contenuti
digitali, per esempio collaborando a progetti di digitalizzazione 90. Uno dei primi e
migliori esempi di raccolta e sistemazione di contenuti storici in ambiente web fu Valley
of Shadows, un sito, dalla duplice natura scientifica e divulgativa, che raccoglieva
immagini, mappe interattive, percorsi guidati, fonti e database inerenti alla Guerra Civile
americana91. Il progetto, diretto da due storici dell’Università della Virginia, Edward Ayers
e William G. Thomas, è considerato punto di partenza per le riflessioni epistemologiche
sulla storia digitale intesa non solo più come propensione all’uso delle tecnologie digitali
da parte degli storici ma come una «cornice» entro la quale aggiornare le metodologie di
ricerca, un «ponte», per riprendere la metafora di Snow, tra culture molto distanti 92. La
digital history occupa quindi spazi rimasti finora vuoti all’interno delle scienze storiche e
ci si domanda se essa sia da considerarsi o meno come una disciplina a tutti gli effetti,
«non solo un modo per strutturare la descrizione della realtà, ma anche un mestiere, un
insieme di procedure consolidate atte a garantire un discorso coerente» 93.
89 Cfr. History in the Digital Age, ed. by T. WELLER, Routledge, London – New York 2013, pp. 3-4.
90 D. J. COHEN, History and the Second Decade of the Web, in «Rethinking History», 8 (2004), n. 2,
doi: 10.1080/13642520410001683950, pp. 293-301; sulla distinzione tra crudo e cotto, ripresa da LeviStrauss cfr. supra § 1.1.1.
91 Il sito non è più aggiornato ma ancora consultabile all’indirizzo <http://valley.lib.virginia.edu>.
92 Cfr. C. L. RILEY, Beyond ctrl-v, ctrl-c, in History in the Digital Age, cit., p. 166.
93 B. LEPETIT, L’histoire quantitative. Deux ou troi choses que je sai d’elle , in «Histoire & mesure»,
(IV 1989), n. 3-4, pp. 191-199. Cfr. F. HEIMBURGER – É. RUIZ, Has the Historian’s Craft Gone
Digital? Some Observations from France, in «Diacronie» 10 (2012), n. 2,
<http://www.studistorici.com/2012/06/29/heimburger-ruiz_numero_10 >, p. 2.
92
Come cambia – quindi – il mestiere di storico nel contesto di democratizzazione della
conoscenza94? Il dibattito storiografico, partendo dal presupposto che l’uso di pratiche
informatiche sia gravido di implicazioni a carattere epistemologico, ruota intorno a due
approcci, uno teorico, un altro più pragmatico. Una definizione generale, all’interno della
quale vanno ricercate le diverse sfaccettature, può essere quella data da Giancarlo Monina:
la storia digitale è «tutto il complesso universo di produzioni e scambi sociali aventi
come oggetto la conoscenza storica, trasferito e/o direttamente generato e sperimentato
in ambienti digitali (ricerca, organizzazione, relazioni, diffusione, uso pubblico e
privato, fonti, libri, didattica, performance e via dicendo)» 95. Cohen traccia un quadro
ancor più generico definendo la digital history come «l’insieme delle teorie e delle
pratiche tecnologiche per sostenere l’abbondanza [di risorse] con le quali ci
confrontiamo». «Qualunque cosa – insomma – (metodologie di ricerca, articolo di una
rivista, monografia, blog, esercitazione) che usi le tecnologie digitali nella creazione,
distribuzione o miglioramento delle ricerche storiche»96, un framework all’interno del
quale il passato si possa analizzare, rappresentare e comunicare 97. In questa prospettiva la
digital history «tratta di un approfondito uso delle risorse digitali non solo per accedere
alle fonti e alla letteratura, ma anche per produrre contenuti di rete e preservarli nel
tempo»98.
Letture più stringenti tendono a immaginare una riduzione degli spazi di manovra della
ricerca storica all’interno dell’informatica99, considerando gli aspetti pratici della storia
digitale come «lo studio del passato usando una varietà di fonti primarie riprodotte
elettronicamente (testi, immagini e artefatti) e, allo stesso tempo, la narrazione, i
resoconti o le presentazioni che emergono dalle ricerche storiche» 100; ci si è quindi
chiesto in che modo questa nuova «cassetta degli attrezzi» cambi la natura del lavoro
94 È la domanda che si pone Michael Frisch, in D. J. COHEN et al, Interchange. The Promise of Digital
History, in «The Journal of American History», 95 (2008), n. 2, doi: 10.2307/25095630, p. 458.
95 G. MONINA, Storia digitale. Il dibattito storiografico in Italia, in «Memoria e ricerca», 43 (2013),
doi:10.3280/MER2013-043012, p. 186.
96 D. J. COHEN et al, Interchange, p. 458.
97 È la prospettiva di Thomas III, cfr. Ivi, p. 454.
98 S. NOIRET, Storia Digitale. sulle risorse di rete per gli storici (pre-print), in La Macchina del Tempo.
Studi di informatica umanistica in onore di Tito Orlandi, a cura di D. FIORMONTE e L. PERILLI, Le
lettere, Firenze, 2011 <http://cadmus.eui.eu//handle/1814/23995>, p. 180.
99 Cfr. O. V. BURTON, American Digital History, in «Social Science Computer Review», 23 (2005), n. 2,
<https://doi.org/10.1177/0894439304273317>, pp. 206-220.
100 B. CALANDRA – J. LEE, The Digital History and Pedagogy Project. Creating an Interpretative /
Pedagogical Historical Website, in «Internet and Higher Education», 8 (2005),
doi:
10.1016/j.iheduc.2005.09.007, p. 323; citato in C. FAVERO, Developing Digital Historians in Italy, cit., p.
19.
93
degli storici101. Una risposta l’ha provata a dare Noiret, individuando quattro tipi di
attività alla base del mestiere di storico che sono state trasformate dal digitale: a) la
comunicazione, migliorata a partire dai gruppi di discussione su Usenet fino ad arrivare
alle piattaforme collaborative 2.0; b) le nuove forme di narrazione in cui coabitano
tecnologie multimediali differenti (dalla digitalizzazione dei testi in formato PDF, alla
scrittura wiki, ai podcast, eccetera); c) l’uso di software che consentono il lavoro di gruppo
in tempo reale e interattivo sincronico o asincronico (come Google Docs), trasformando
quindi la natura tradizionalmente solitaria della ricerca storica; d) l’accesso alle fonti
primarie che, native digitali e non, si possono trovare in rete 102. Su questa falsa riga si può
qui proporre integralmente una sintesi delle molteplici posizioni brevemente delineate,
quella proposta da Jason Heppler:
L’avvento delle tecnologie digitali sta modificando e stimolando le modalità in cui gli
storici praticano il loro mestiere. I modi attraverso i quali reperire, organizzare e presentare
le informazioni sono cambiati rapidamente negli ultimi vent’anni. La storia digitale è
molte cose: una metodologia che si affianca alla pratica tradizionale degli storici attraverso
l’uso delle applicazioni digitali, l’acquisizione di informazioni che non può essere fatta con
carta e penna, che consente di cimentarsi in nuovi percorsi narrativi e raggiungere un
pubblico più ampio. L’obiettivo non è una sorta di cliometria 2.0 o dimostrare teorie delle
scienze sociali, ma quello di rispettare l’interesse dello storico per la complessità
sfumandolo con l’uso di tecnologie digitali103.
Lasciando a margine di quest’analisi periodizzazioni troppo restrittive 104 è
indubbiamente utile rilevare come gli sviluppi più recenti del dibattito storiografico
affrontino il tema della storia digitale nell’ambito del Web 2.0 105. Rimarcando le
numerose possibilità di condivisione delle informazioni e di collaborazione nella ricerca
e nella pubblicazione, alcuni studiosi si sono concentrati sulle possibilità partecipative che
101 Cfr. D. J. COHEN et al., Interchange, p. 458.
102 S. NOIRET, Storia contemporanea digitale, in Il web e gli studi storici. Guida critica all’uso della rete, a
cura di R. MINUTI, Carocci, Roma 2015, pp. 269-271.
103 J. HEPPLER, Defining Digital Humanities, in jason heppler, 8 gennaio 2013 [blog post],
<http://jasonheppler.org/2013/01/08/defining-digital-humanities>.
104 Cfr. supra § 2.2.2.
105 Cfr. S. NOIRET, Digital Histry 2.0, in L’histoire contemporaine à l’ère numérique, dirigé par F.
CLAVERT
et
S.
NOIRET,
Peter
Lang,
Bruxelles
2013,
<https://www.academia.edu/4558748/Digital_History_2.0_in_Clavert_Fr%C3%A9d
%C3%A9ric_and_Noiret_Serge_dir._eds._Lhistoire_contemporaine_%C3%A0_l%C3%A8re_num
%C3%A9rique__Contemporary_History_in_the_Digital_Age_Bruxelles_Bern_Berlin_Frankfurt_am_Main_New
_York_Oxford_Wien_Peter_Lang_2013_pp._155-190>, pp. 155-191.
94
la rete offre (crowdsourcing). Il Web, come avrebbe detto McLuhan, è un medium caldo 106
nel quale è molto semplice per chiunque pubblicare contenuti e, soprattutto, dotarli
automaticamente di un certo grado di oggettività che invece gli altri mezzi di
comunicazione di massa hanno progressivamente perduto. È forse questa una delle
ragioni per le quali in rete è così elevata la circolazione di false informazioni a carattere
storico veicolate, all’inizio, da siti internet creati da gruppi di storici dilettanti e oggi dai
social network, spesso, purtroppo, con evidenti intenti mistificatori 107. Esempi positivi di
creazione di piattaforme condivise per la divulgazione, di cui si renderà conto
successivamente, in cui le persone possano partecipare condividendo propri ricordi,
oggetti, documenti108, esistono e riguardano soprattutto eventi storici che hanno toccato
l’opinione pubblica o che hanno una grande rilevanza nel contesto attuale. Entrambi gli
approcci sono esemplificativi di una «presenza esuberante di passato in rete [che]
risponde, con la mediazione digitale, a un profondo bisogno di riallacciare le memorie
individuali, familiari, collettive e comunitarie al passato locale, regionale e nazionale
nelle nostre società globalizzate» 109, in cui spesso è messa in discussione l’autorevolezza
dello storico di professione110. Nonostante non manchino i critici, i quali, come Philippe
Joutard, derubricano «le forme spontanee di narrazione del passato in rete [come] forme
memoriali che nulla [hanno] a che vedere con l’epistemologia della storia» 111, la raccolta e
pubblicazione di fonti di varia natura e di provenienza non istituzionalizzata è
valorizzato nell’ambito della storia contemporanea dalla Public History. Si tratta di una
tendenza storiografica nata alla fine degli anni Settanta, in concomitanza con i primi
lavori di microstoria e di storia orale, che «si riferisce all’impiego di storici e
metodologie storiche fuori dai circuiti accademici: nel governo, nelle aziende private, nei
106 Cfr. M. McLUHAN, Gli strumenti del comunicare, cit.
107 È facile per esempio su Facebook imbattersi in pagine che rievocano i presunti fasti del ventennio
fascista o che denunciano la deportazione dei soldati borbonici nel forte sabaudo di Fenestrelle.
L’aspetto inquietante è che non esiste una politica dell’azienda che provveda ad oscurare quei contenuti
come altri creati a scopo diffamatorio.
108 Come il September 11 Digital Archive, <http://911digitalarchive.org>.
109 S. NOIRET, Storia pubblica digitale, in «Zapruder. Storie in movimento», 36 (2015),
<http://storieinmovimento.org/wp-content/uploads/2016/02/Zap36_2-Zoom1.pdf>, p. 17. Cfr. Digital.
Personal Collections in The Digital Era, ed. by C. A. LEE, Society of American Archivists, 2011.
110 La ridefinizione del concetto di auctoritas è, come si è visto, una delle caratteristiche peculiari
dell’ipertesto che, come ricordava Gorge Landow permette al lettore «in virtù della destrutturazione
dell’edificio testuale e del movimento interno attraverso i link [di costruire] sistematicamente il
proprio testo e partecipa in maniera diretta alla sua definizione». R. MINUTI, Internet e il mestiere di
storico cit., §57; cfr. G. P. LANDOW, L’ipertesto, cit.
111 P. JOUTARD, Révolution numérique et rapport au passé, in «Le Débat», 177 (2013), pp. 145-152; citato in
S. NOIRET, Storia pubblica digitale, cit., p. 16.
95
media, nelle società storiche e nei musei» 112. In questa prospettiva il Web è uno degli
ambienti più fecondi in cui è possibile fare un uso pubblico della storia, ma per
inquadrare questa magmatica varietà è necessario un approccio ibrido, quello proposto
dalla Digital Public History, che si ponga come intermediario tra il pubblico e i luoghi di
produzione della conoscenza storica, filtrando i contenuti che provengono dal Web e
studiando forme interattive di comunicazione della ricerca113.
Se si prova a ricondurre la storia digitale al suo contesto di appartenenza, cioè a quello
delle Digital Humanities, la creazione di un nuovo ambito disciplinare può apparire
eccessiva. Il dibattito interno alle discipline storiche, come si è visto, è stato molto più
lento, se si pensa che ancora nel 2001 Rolando Minuti così scriveva: «[alcuni storici] si
rifugiano, accettano la presenza [dell’informatica] come fenomeno da tollerare,
ignorandone o fingendo di ignorare la ricaduta fortissima sul piano della cultura e
dell’identità civile collettiva, per continuare a coltivare forme tranquillizzanti,
accademiche e sostanzialmente aristocratiche di sapere»114. Oggi, come evidenziato da
alcune ricerche di natura sociologica115, la situazione, almeno per quanto concerne
l’Europa appare, seppur con alcuni passi in avanti, immutata: nel nostro paese non
esistono corsi di laurea o programmi di dottorato in storia digitale (vi sono solo due
master in Public History), ma nemmeno una sistemazione stabile per i docenti che si
occupano di informatica umanistica, per usare l’espressione italiana, di cui esiste un solo
corso di laurea magistrale all’università di Pisa (fig. 33) Uno degli aspetti più critici del
sistema è quello di offrire nel nostro paese pochi corsi universitari volti ad affrontare il
tema dell’esegesi dei documenti e delle risorse reperibili in rete; non si considera che
l’accesso alle informazioni avviene quasi esclusivamente, anche a livelli di studi più
avanzati, per mezzo dei motori di ricerca, che, sostanzialmente, "ciò che non è nel Web
non esiste"116 e che non è affatto scontato che chi usa gli strumenti digitali
quotidianamente sia in grado di avvalersene con consapevolezza nel fare ricerca 117.
112 “The History Manifesto”. A Discussion, introduction by S. NOIRET, with contributions by E.
ARNESENIN, R. DELAFONTAINE, Q. VERREYCLEN, in «Memoria e Ricerca», 1 (2016),
doi:10.14647/83225, pp. 97-126.
113 S. NOIRET, Storia pubblica digitale, cit.
114 R. MINUTI, Internet e il mestiere di storico cit., §7.
115 C. FAVERO, Storici digitali in Italia. Riflessioni ed esperienze, in «Memoria e Ricerca», 47 (2014), pp.
193-2014.
116 Cfr. S. NOIRET, Storia Digitale, cit., pp. 206 e segg.
117 Cfr. R. MINUTI, Insegnare storia al tempo del web 2.0. considerazioni su esperienze e problemi aperti ,
in Les historiens et l’informatique, cit., doi: 10.1400/171919, pp. 109-23 e T. M. KELLY, Teaching History
in the Digital Age, University of Michigan Press, Ann Arbor 2013.
96
Solo una riflessione allargata consentirebbe agli storici che oggi «si servono del digitale»,
come tutti, di divenire attori consapevoli, «storici digitali», capaci cioè di proporre alle
nuove generazioni una formazione in informatica umanistica applicata alla storia in
grado di stare al passo coi tempi 118. La posizione sostenuta da Claire Lemercier, incentrata
sull’inutilità della strutturazione della storia digitale come disciplina a sé stante fondata
sull’idea che fare storia oggi voglia dire necessariamente usare strumenti tecnologici 119,
appare corretta, ma, d’altra parte, la necessità di distinzione disciplinare può essere valida
per proporre all’attenzione dei circuiti del dibattito accademico più tradizionale il
problema dei rapporti tra storia e informatica 120, valorizzando un approccio critico, ma
non pregiudizialmente contrario alle tecnologie digitali.
3.2.4 Per una critica delle fonti digitali
La società dell’informazione produce, come visto, una quantità di risorse digitali
superiore alla capacità umana di gestirle; nel complesso non tutte vengono sfruttate e
ancor meno sono quelle che hanno direttamente o indirettamente un valore culturale.
Nonostante queste considerazioni il rumore informativo che caratterizza il Web, il luogo
virtuale in cui le informazioni vengono conservate, diffuse e dunque "lavorate", il
medium che fagocita tutti gli altri sistemi di comunicazione tradizionali, è assordante 121.
Anche solo usando la rete come strumento per le ricerche in ambito umanistico si rimane
spaesati di fronte alla varietà delle risorse che si possono reperire: dal catalogo di una
biblioteca, alla riproduzione di un’opera d’arte, da una pubblicazione accademica ad una
banca dati specialistica. Come ha scritto Rosenzweig, il presente è caratterizzato
dall’abbondanza di risorse, ma ci si sta adoperando perché il futuro non sia invece
costellato dalla scarsità di informazioni sulla nostra epoca e su quelle precedenti 122? Come
viene conservata l’eredità culturale e quali meccanismi sono adottati per lasciare ai posteri
una traccia delle risorse native digitali e digitalizzate? Se si prende un preciso evento
storico, come la recente campagna elettorale negli Stati Uniti d’America, come sarà
118 Cfr. S. NOIRET, Informatica, storia e storiografia. La storia si fa digitale, in «Memoria e Ricerca», 28
(2008).
119 Cfr. E. GRANDI – É. RUIZ, Ce que le numérique fait à l’historien.ne. Entretien avec Claire Lemercier,
in
«Diacronie.
Studi
di
Storia
Contemporanea»,
10
(2012),
n.
2,
<http://www.studistorici.com/2012/06/29/grandi_numero_10>, pp. 2-16.
120 Almeno per quanto riguarda il panorama italiano nessuna delle riviste più prestigiose affronta il tema,
che è invece oggetto di un fervido dibattito in «Memoria e Ricerca», «Reti medievali», «Diacronie»
e «Historia Magistra».
121 Cfr. supra § 2.2.4.
122 Cfr. R. ROSENZWEIG, Scarcity or Abundance?, cit.
97
possibile, per gli storici che tra cento anni lo vorranno, ricostruire il successo di Donald
Trump usando come fonte primaria i suoi tweet?
Le fonti sono il «pane quotidiano dello storico» 123, la base del metodo critico, grazie al
quale esse vengono relazionate le une alle altre per costruire, con ragionevole certezza, un
avvenimento o contestualizzare un problema. Come scriveva Edward Carr, una fonte, un
fatto non sono tali senza un intermediario, uno storico, che abbia l’abilità di «farli
parlare» e quindi non tutte le testimonianze del passato sono fonti, ma solo quelle che
vengono coerentemente inserite in un’argomentazione la quale deve contenere al suo
interno gli opportuni riferimenti per essere verificata o confutata: gli storici sono
deontologicamente obbligati all’onere della prova124. I documenti citati devono essere
stabili, cioè non devono mutare nel tempo, come sosteneva Minuti:
perché [il] procedere del lavoro storiografico mantenga i caratteri propri della verificabilità,
dell’eventuale contestabilità ed in ultima analisi della scientificità propria ed originale del
sapere storico, occorre che i documenti e le testimonianze che costituiscono la base del suo
operare risultino identificabili, stabili e inalterabili, e come tali suscettibili di analisi, di
critica e di interpretazione125.
Il digitale ha spiazzato questo tipo di critica delle fonti dal momento che ogni contenuto,
privato della sua dimensione materiale, viene visualizzato tramite una macchina: ogni
accesso è quindi un "atto performativo", che termina nel momento in cui viene spento il
dispositivo126.
Rimanendo in termini generici gli oggetti digitali sono risorse di varia natura, ma non
necessariamente fonti, anche se questa distinzione si elimina con la parola source che in
francese e in inglese conserva la sua duplice valenza. Allo stesso modo dare alle risorse
digitali valore documentario è problematico, dal momento che la stessa definizione di
documento può essere molto ampia; tutto può essere documento e quindi il valore
dipende dall’interpretazione che gli studiosi danno degli oggetti 127. Le risorse digitali
sono, come intuì Genet, metafonti, ossia fonti che subiscono la mediazione dello
123 P. BERTRAND – C. JACOBS, Digital humanites et critique historique documentaire. Digital ou critical
turn?, in Les historiens et l’informatique, cit., doi: 0.1400/171921, p. 125.
124 Cfr. E. H. CARR, Sei lezioni sulla storia, seconda edizione a cura di R. V. DAVIS, Einaudi Torino 20oo
(ed. or. 1961), in particolare il § 1 Lo storico e i fatti storici e V. FERRONE, Lezioni illuministiche, cit.,
parte seconda §1 e 2. Per ulteriori spunti di riflessione epistemologici si rimanda a K. HERING,
Provenance Meets Source Criticism, in «Journal of Digital Humanities», 3 (2014), n. 2,
<http://journalofdigitalhumanities.org/3-2/provenance-meets-source-criticism>, pp. 60-73.
125 R. MINUTI, Internet e il mestiere di storico cit., § 36.
126 Cfr. A. BURDICK et. al., Umanistica_Digitale, pp. 50-51.
127 Cfr. S. VITALI, Passato digitale, cit., p. 80; si veda anche A. SALARELLI – A. M. TAMMARO, La
biblioteca digitale, Editrice bibliografica, Milano 2006² (prima ed. 2000), pp. 17-20.
98
strumento tecnologico da cui non sono separabili 128; ad esempio, un documento scritto
con un word processor su un floppy disk oggi è, a distanza di vent’anni, difficilmente
consultabile perché il progresso tecnologico ha sostituito quella tecnologia. È più difficile
quindi per lo storico ricondurre le proprie fonti digitali al loro contesto di produzione
esercitando «le procedure esegetiche che hanno caratterizzato il rapporto con il
documento a partire dall’umanesimo» 129. Procedimento ancor più complicato se si cerca
di attuarlo sui dati, cioè sul risultato della trasformazione che investe il documento
analogico non solo nella sua forma (per esempio la copia digitale di una pagina di libro),
ma anche nelle sua natura (la codifica testuale tramite Optical Character Recognition
delle parole); questo processo, serializzato su milioni di pagine, fa perdere il contesto
originale dal quale il dato è estrapolato (la ricerca di una specifica parola o l’inserimento
in un database).
Usare risorse digitali comporta una serie di problemi. In primo luogo la loro virtualità,
cioè la codifica di un insieme di informazioni in codice binario, lega indissolubilmente il
documento al suo supporto che non è solo fisico, come nel caso della carta, ma anche a sua
volta immateriale: «la natura del documento digitale, quel connotato virtuale proprio di
oggetti che perdono la loro fisicità e si traducono in tracce magnetiche costituite, alla
radice, da lunghe stringhe di 0 e 1, è quanto pone direttamente problemi ad una loro
utilizzazione diretta da parte degli storici»130. Si pone quindi il problema di preservare in
qualche modo l’obsolescenza cui sono sottoposte le risorse digitali, slegandole dal loro
hardware e dal loro software. Questo problema vale anche per gli oggetti analogici (come
le VHS), che, al pari di un programma scritto per Apple II, devono subire processi di
migrazione (trasformazione di formato) o di emulazione (cioè scrivere un programma
che interpreti il codice originario). Sia i documenti digitali nativi che quelli digitalizzati,
dunque sono estremamente fragili e quando vengono prodotti direttamente per il Web
acquisiscono un grado ancora maggiore di indeterminatezza perché legati ad un medium
in costante cambiamento: ad esempio, è il caso di documenti digitalizzati verso la metà
degli anni Novanta, che oggi o non sono più reperibili oppure non visualizzabili perché le
applicazioni web per le quali sono stati pensati non funzionano più coi recenti browser 131.
Allo stato attuale è anche difficile usare un sito Web come fonte storica perché nella
128
129
130
131
J.-P. GENET, Source, metasources, texte, histoire, in Storia & multimedia, cit., pp. 3-17.
R. MINUTI, Internet e il mestiere di storico cit., § 36.
Ivi., § 37.
Cfr. infra § 3.3.2. Per una sintesi sulle problematiche relative alla digitalizzazione del patrimonio
culturale si veda M. TERRAS, Digitization and Digital Resources in the Humanities, in Digital
Humanities in Practice, ed. by M. TERRAS, J. NYHAN and C. WARWICK, Facet Publishing - UCL
Centre for Digital Humanities, London 2012, pp. 47-71.
99
maggior parte dei casi anche quelli costruiti una decina di anni fa non sono più reperibili
non solo nei contenuti, ma anche nella struttura grafica (è il caso per esempio di un
quotidiano online). Per cercare di dare una soluzione a questo problema il sito Internet
Archive conserva, tra i numerosi documenti disponibili (libri, immagini, audio, film,
software, videogiochi, ecc.), anche delle copie statiche dei maggiori siti web, dal 1996 ad
oggi, in modo da garantire quantomeno la visualizzazione dei contenuti; quello che però
sarà impossibile riprodurre è la natura ipertestuale dei collegamenti, dal momento che il
Web, a differenza del progetto proposto da Ted Nelson, non prevede una visualizzazione
retroattiva delle modifiche subite da uno stesso arco ipertestuale 132.
Il secondo ordine di problemi posto dall’uso dei documenti digitali riguarda la loro
contestualizzazione. Come hanno rilevato Tommaso Detti e Giuseppe Lauricella,
«l’incorporietà dei documenti digitali può facilmente determinare la perdita di molte
delle loro informazioni accessorie – i metadati –, in particolare delle coordinate spazio
temporali»133, mettendo in crisi il concetto di autenticità. Non solo le riproduzioni
digitali spezzano, così come avviene in parte con la stampa, la catena del rapporto
originale/copia, ma è possibile per chiunque stravolgerle; i documenti digitali possono
essere facilmente modificati o mistificati e diventare così completamente slegati dal loro
contesto originario e dal loro autore (per esempio un ritocco fotografico, o un’azione di
copia/incolla su un documento di testo). Questi problemi vengono amplificati dal Web,
che appiattisce completamente la dimensione spazio-temporale in quanto ogni risorsa è
fruibile in dovunque e in qualunque momento; anzi il flusso informativo che permette
l’accesso al documento viene, come visto, scomposto in molteplici pacchetti che poi
vengono visualizzati dal browser. Non solo quindi si perde la natura fisica del documento,
ma anche la sua rappresentazione, conservata in qualche tipo di server, subisce un
ulteriore processo di rimediazione (teoria dei gradi di separazione) 134.
3.2.5 Conservazione e accesso delle risorse digitali
Già dagli albori del Web emerse quindi il problema della conservazione stabile delle
risorse digitali, in particolare di quelle con un alto valore culturale. Le biblioteche
132 Internet Archive – Wayback Machine, <https://archive.org/web>; tra le altre organizzazioni che si
occupano di conservare una porzione del Web si segnalano l’IIPC (International Internet Preservation
Consortium,
<http://www.netpreserve.org>)
e
l’IMF
(Internet
Memory
Foundation
<http://internetmemory.org/en/>).
133 T. DETTI – G. LAURICELLA, Una storia piatta? Il digitale, internet e il mestiere e di storico,
Contemporanea, 10 (2007), n. 1, <http://www.jstor.org/stable/24653055>, p. 8.
134 Cfr. Ivi, p. 15.
100
digitali, il cui elenco sarebbe qui sostanzialmente inutile, si sono da subito proposte il
duplice obiettivo di consentire a tutti l’accesso alla riproduzione dei materiali fisici e la
loro conservazione a lungo termine sul Web. Una delle soluzioni adottate, come si è visto,
è stato lo sviluppo, ancora in corso, delle tecnologie semantiche che si propongono di
garantire da un lato una razionalizzazione dell’informazione, riducendo il grado di
serendipità che caratterizza il Web, e dall’altro il reperimento preciso delle risorse e delle
informazioni ad esse collegate. Oltre a progetti avviati dalle grandi istituzioni nazionali
come le biblioteche centrali o transnazionali, come il sito Europeana, il processo di
digitalizzazione dell’eredità culturale che ha riguardato molti soggetti, pubblici e privati,
e ha coinciso spesso con la volontà di affermare o consolidare un’identità di gruppo; a
livello europeo, ad esempio, molti fondi sono stati spesi dalle Repubbliche Baltiche per la
digitalizzazione del loro patrimonio museale e documentario, contribuendo
all’affermazione di un’identità nazionale autonoma dalla Russia e che guardasse al
processo di inserimento nell’Unione Europea. Accanto alle iniziative pubbliche si sono
affiancate quelle dei grandi colossi del Web, come Google, che nel 2004 avviava il
progetto Books e Amazon, che dal 1999 ha acquisito Internet Archive tramite la società
Alexa, che hanno collaborato con le istituzioni bibliotecarie per rendere fruibile i loro
materiali in rete135. Internet Archive, che a differenza di Google adotta uno spirito di
crowdsourcing, ha creato un progetto sinergico con la piattaforma Wikisource 136. Gli
utenti o le istituzioni possono caricare su Internet Archive le scansioni dei propri
documenti137; una volta acquisito il documento viene scansionato e i caratteri del testo
riconosciuti e successivamente condiviso su Wikisource dove, a questo punto è possibile
fruire sia della riproduzione delle pagine del libro sia della loro trascrizione. Gli
utilizzatori della piattaforma possono, quindi, editare con precisione il testo usando
un’applicazione intuitiva che sfrutta il linguaggio wiki, sottoporlo a controllo degli altri
wikipediani (la piattaforma è comune con Wikipedia) e infine rilasciare un documento
validato molto simile ad uno editato usando TEI. In questo caso l’approccio sinergico tra i
tanti sostenitori della filosofia dell’accesso libero alle conoscenze (discendente dalla
filosofia del Project Gutenberg), tra gli attori classici della conservazione dell’eredità
culturale (biblioteche, archivi e musei) e le web enterprises, che spesso hanno mezzi
tecnici non paragonabili a quelli delle istituzioni pubbliche (i cui sforzi sono stati spesso
frammentari, come purtroppo in Italia), produce un efficace strumento di condivisione
del sapere.
135 Google Libri – biblioteche partner, <https://books.google.it/intl/it/googlebooks/partners.html>.
136 Wikisource, <https://it.wikisource.org/wiki/Pagina_principale>.
137 Per esempio esiste una sezione dedicata ai libri antichi digitalizzati della biblioteca Arturo Graf
dell’Università di Torino, <https://archive.org/details/opallibriantichi>.
101
Un’altro servizio di Internet Archive, non ancora attivo, è quello di conservare, su
specifica richiesta di Twitter, tutti i "cinguettii" degli utenti pubblici a partire dal 2010 138;
questo consegna in mani private una mole di informazioni utilissima per gli studiosi, che
può essere analizzata per valutare ad esempio il ruolo giocato dall’opinione pubblica in un
determinato arco di tempo (sentiment analysi). Ma sia Google che Amazon sono soggetti
privati che potrebbero nel futuro, legittimamente, non garantire più l’accesso alle loro
informazioni di carattere culturale, limitando le possibilità di ricerca. «Can History be
Open Source?»139 si chiedeva, una decina di anni fa, Rosenzweig, stimolando gli storici ad
un uso consapevole e attivo di Wikipiedia, già allora uno fra gli strumenti principali per
l’accesso alla conoscenza; era chiaro che gli schemi di pubblicazione tradizionali non
potevano più reggere in un contesto come quello del Web, dove i tempi di pubblicazione
diventano molto più rapidi. Tralasciando i problemi legali e quelli professionali (ad
esempio la validità maggiore di un articolo pubblicato su una rivista accademica rispetto
ad uno pubblicato in rete), molti studiosi, per fortuna, oggi pubblicano in piattaforme
open access; l’obiettivo è quello di offrire un accesso gratuito alla conoscenza,
direttamente sul Web, al fine di integrare e in una certa misura contrastare l’uso esclusivo
dei motori di ricerca e delle enciclopedie online per la ricerca 140. Nell’ambito della
comunità storica il precursore di questo approccio, oggi sempre più diffuso, fu Darnton
che, da direttore delle biblioteche di Harvard, impose a tutti i ricercatori di conservare
una copia pre-print delle loro pubblicazioni, questo per evitare il paradosso di dover
pagare per consultare online i lavori fatti dagli studiosi di una stessa università 141.
L’approccio open si propone di ridurre il digital divide, ovvero di dare a tutti il medesimo
accesso ai contenuti in rete; piattaforme private come Historical Abstracts142 utilissime alla
ricerca perché indicizzano milioni di contenuti, rendendola più veloce, non sono gratuite
138 Cfr. J. STERFELD, Historical Understanding in the Quantum Age, in «Journal of Digital
Humanities», 3 (2014), n. 2, <http://journalofdigitalhumanities.org/3-2/historical-understanding-inthe-quantum-age>, pp. 47-56; anche la Library of Congress ha parallelamente iniziato la
conservazione dei tweet.
139 R. ROSENZWEIG, Can History Be Open Source? Wikipedia and the Future of the Past, in «The
Journal of American History», 93 (2006), n. 1, doi: 10.2307/4486062, pp. 117–46.
140 Ad esempio il portale francese HAL. Archive ouverte en Sciences de l'Homme et de la Société
(<https://halshs.archives-ouvertes.fr>), si propone di conservare articoli accademici con licenza open
source (spesso si tratta di versioni preprint di pubblicazioni a stampa).
141 Tra le molte iniziative nel campo dell’open access si segnala quella dell’Università di Torino che dal 2013
ha inaugurato un portale per reperire informazioni bibliografiche e contenuti digitali, fare text mining
e favorire la creazione di piattaforme accademiche collaborative; cfr. <http://www.oa.unito.it>.
142 EBSCO - Historical Abstracts, <https://www.ebscohost.com/academic/historical-abstracts>.
102
e quindi si crea un gap tra le Università che possono permettersi l’accesso a determinate
risorse e quelle che non possono farlo143.
3.2.6 Distant reading e ricerca storica
Qualunque sia la natura delle piattaforme digitali da cui si estrapolano risorse da inserire
in un’argomentazione è necessario chiedersi come e perché quei contenuti siano resi
disponibili; se è immediatamente chiaro lo scopo dei luoghi fisici di conservazione della
conoscenza, come gli archivi, nei quali il rapporto tra l’oggetto e l’istituzione che lo
conserva, in ambito digitale non è così. Occorre dunque svolgere ricerca in maniera
consapevole, contestualizzando la risorsa o il dato: anche la sola operazione di descrivere i
dati in un database, ha bisogno di una sua esegesi, perché modificare i parametri può
evidenziare un aspetto piuttosto che un altro 144. Come si è visto, aggregare una grande
massa di dati significa aprire la strada a nuove forme conoscitive che possono andare da
una visualizzazione generale a una lettura molto particolareggiata; attualmente, data la
grande disponibilità di dati in rete, anche solo quelli attinenti all’ambito storico (per
esempio quelli di Google Books o di una biblioteca digitale, come Europeana) consente,
se accessibili o debitamente espressi in maniera semantica attraverso delle applicazioni
web. È il caso di Google Ngram Viewer che permette di ricercare l’occorrenza di uno o più
termini all’interno del database di Google Books. Il risultato può dare una tendenza della
ricorrenza di determinate parole all’interno dei libri digitalizzati, pubblicati in un certo
periodo di tempo; negli esempi si riportano i risultati della ricerca dei termini "Marc
Bloch","Fernand Braudel" e "Lucien Febvre" nel database di Google limitato alla lingua
italiana (fig 35). La visualizzazione dei dati si estende a qualunque dominio di ricerca ed è
uno degli aspetti più studiati nel campo delle scienze statistiche; i gruppi di lavoro che
analizzano i big data, composti anche da umanisti e designer, si occupano di costruire
programmi informatici che estraggano automaticamente le informazioni e le processino
sotto forma grafica145.
143 Sul tema del digital divide. Cfr. D. BOYD, K. CRAWFORD, Six Provocations for Big Data, 2011 [paper
presentato al seminario A Decade in Internet Time: Symposium on the Dynamics of the Internet and
Society], <https://papers.ssrn.com/sol3/papers2.cfm?abstract_id=1926431>.
144 Cfr. A. M. BADANELLI – G. OSSENBACH, Making History in the Digital Age. New Froms of Access
to the Sources and of Preservation of the Historical-Educational Heritage, in «History of education &
Children’s Literature», 1 (2010), pp. 79–91.
145 Un indirizzo di ricerca piuttosto recente è quello di usare i big data ai fini della ricerca storica in
particolare nell’ambito della Global History. Come testi introduttivi si segnalano: S. GRAHAM – I.
MILLIGAN – S. WEINGART, Exploring Big Historical Data. The Historian’s Macroscope, Imperial
College Press, Hackensack 2015; J GULDI – D. ARMITAGE, The History Manifesto, Cambridge
103
Questo processo è un’ulteriore forma di mediazione che insiste sull’oggetto materiale:
non solo il libro, per esempio, viene digitalizzato e reso in forma machine readable, ma il
suo contenuto, completamente estraniato dal contesto è rimodellato e relazionato con
altri in modo da dare una visione d’insieme. È la distant reading di cui parla Franco
Moretti, l’approccio che restituisce uno sguardo complessivo partendo da un insieme di
fonti, contrapposto alla close reading, cioè la lettura circostanziata del documento che è il
metodo classico dell’indagine storica146. Ovviamente non si tratta di nulla di nuovo. Da
sempre le ricerche storiche producono visualizzazioni grafiche, e immaginano tendenze,
basti pensare alle ricerche della storia quantitativa, o più semplicemente agli atlanti
storici (fig. 34); la peculiarità dei metodi attuali risiede nella grande disponibilità di dati e
nella relativa facilità con la quale si possono compiere operazioni semplici, rendendo
quindi possibile usare abbastanza agevolmente i big data all’interno di lavori
storiografici. Per non incorrere nel problema della datificazione, ossia quello di "far
parlare da sé" i dati riducendo la complessità dei problemi, gli storici che si approcciano a
questo tipo di analisi alternano la lettura distante a quella ravvicinata 147; Frederic Clavert
sostiene quindi la necessità di affiancare alla lettura «humaine» una «numérique» delle
fonti148. Anche per questo motivo molti studiosi sottolineano la necessità di rispondere
all’esortazione di Bloch, cioè in senso lato, quella di non demandare ad archivisti e
bibliotecari lo studio di tecniche per la conservazione dei documenti nel digitale, per
l’analisi dei dati e per la pubblicazione stabile e gratuita delle ricerche. La frattura
all’interno delle discipline storiche, che si data dagli anni ‘30 del Novecento, con l’uscita
degli archivisti dalla American Historical Association149, dovrebbe essere ricomposta,
146
147
148
149
University Press, Cambridge 2014, <http://historymanifesto.cambridge.org>, § 4; J. van EIJNATTEN –
T. PIETERS – J. VERHEUL, Big Data for Global History. The Transformative Promise of Digital
Humanities, in «BMGN - Low Countries Historical Review», 128 (2013), n. 4, doi: 10.18352/bmgnlchr.9350, pp. 55-77; P. MANNING, Big Data in History, Palgrave Macmillan, Basingstoke 2013. Per
quanto riguarda la data visualisation si vedano, tra gli altri, Beautiful Data, ed. by T. SEARGAN and J.
HAMMERBACHER, O’Reilly, Sebastopol, CA 2009 e Beautiful Visualisation, ed. by J. STEELE and N.
ILIINSKY, O’Reilly, Sebastopol, CA 2010.
Cfr. F. MORETTI, La letteratura vista da lontano, cit. Un esempio di distant reading ed elaborazione
di dati storiografici è il progetto Mapping the Repubblic of Letter’s dell’università di Stanford che,
ispirato dai lavori di Darton, restituisce un quadro grafico e interattivo della vita intellettuale e
culturale dell’Illuminismo europeo (figg. 36, 37; <http://republicofletters.stanford.edu/index.html>).
Cfr. J. STERFELD, Hstorical Understanding in the Quantum Age, cit.
F. CLAVERT, Lecture des sources historiennes à l’ère numérique, L’histoire Contemporaine À L’ère
Numérique, 14 novembre 2012 [blogpost], <http://histnum.hypotheses.org/1061 >.
Cfr. J. DOUGHERTY et al., Conclusions, in Writing History in the Digital Age, ed. by J.
DOUGHERTY and K. NAWROTZKI, Michigan University Press, Ann Arbor 2013, doi:
10.3998/dh.12230987.0001.001.
104
nell’ottica evitare un atteggiamento passivo, ancorché interessato nei confronti della
tecnologia digitale150.
Illustrazioni §3.2
Figura 34. La famosa carta della Campagna di Russia proposta da Paul Minard; vengono
visualizzate tre variabili: il percorso dell’esercito napoleonico, il calo drammatico dei suoi
effettivi
in
relazione
alle
rigide
temperature
invernali
(<https://commons.wikimedia.org/wiki/File:Minard.png>).
Figura 35. Tramite la ricerca dei termini "Marc Bloch", "Fernand Braudel" e "Lucien Febvre"
tramite Goolge Ngram Viewer è possibile avere un’idea quantitativa della fortuna critica che
la prima scuola delle Annales ha avuto nel dibattito storiografico italiano.
150 Come osservava Genet, «l’apporto dell’informatica è immensamente positivo e riconfigura, per il
meglio, le pratiche degli storici. […] Quanto alla pratica storica, […] non c’è […], scientificamente
parlando domanda di informatica: l’incertezza e i pericoli sono troppo grandi e si preferisce lasciarla a
degli specialisti» J.-P. GENET, La formation des historiens à l’informatique en France. espoir ou
désespoir? in «Le médiéviste et l’ordinateur, histoire médiévale, informatique et nouvelles
technologies», 31-32 (1995), <http://lemo.irht.cnrs.fr/31-32/mo3115.htm>; citato in S. NOIRET, Storia
digitale, cit., p. 203.
105
Figura 36. Elaborazione grafica delle pubblicazioni di Voltaire tra il 1712 e il 1800; in rosso tutti i luoghi di
edizione,
in
arancione
quelli
reali,
in
viola
quelli
fittizi
(<http://republicofletters.stanford.edu/casestudies/voltairepub.html>).
Figura 37. Elaborazione grafica della rete di corrispondenti di Voltaire tra il 1755 e il 1777
(<http://republicofletters.stanford.edu/casestudies/voltaire.html>).
106
3.3 Fare storia digitale. Un approccio comparativo
3.3.1 Premessa. Alcune risorse web per la ricerca storica
Come si è cercato di mostrare, la storia digitale non è un campo disciplinare ben definito
e universalmente accettato; in ambito statunitense esistono già da tempo corsi di laurea,
dottorati di ricerca e posizioni accademiche in Digital History151 e anche in Europa, in
questi anni, si è cominciata ad affacciare l’istituzionalizzazione di questa disciplina 152.
Nonostante sia in corso un dibattito molto vivo nella comunità accademica, la storia
digitale sembra un campo di ricerca – ibrido come tutte le Digital Humanities – già
strutturato se si fa una ricognizione in rete. L’ottimo sito Bibliostoria, della Biblioteca del
Dipartimento di Studi Storici dell’Univesità Statale di Milano, offre, in un sito costruito
con Wordpress (quindi simile ad un blog), un elenco aggiornato della disponibilità di
risorse digitali utili alla ricerca storica 153 (fondi archivistici, biblioteche digitali database,
ecc.). I collegamenti esterni alle risorse digitali sono brevemente descritti ed è possibile
filtrarli per tematicamente sia usando un elenco tematico che una tagcloud; infine, sono
disponibili link per il rimando ad altri numerosi blog di interesse storico. Oltre a ciò
Bibliostoria mette a disposizione un’interessante sezione dedicata agli strumenti utili per
la navigazione Web, come un elenco di software per l’organizzazione bibliografica (come
151 Oltre ai già citati centri di ricerca avviati negli anni Novanta, si segnala l’interesse delle istituzioni
accademiche statunitensi nell’inserire, all’interno dei propri dipartimenti, personale docente nel
campo dalla Digital History, come, per esempio, le Università di Harvard
(<http://history.fas.harvard.edu/digital_teaching_fellows_program>)
e
del
Michigan
(<http://www.cal.msu.edu/criticaldiversity/phase1/digitalhistory>).
152 Ad esempio l’Università del Lussemburgo ha aperto lo scorso anno una call per 13 posti per un corso di
dottorato in Digital History (<http://www.fnr.lu/projects/digital-history-and-hermeneutics>); altre
istituzioni che offrono Phd in storia digitale sono il King’s College di Londra
(<http://www.kcl.ac.uk/artshums/depts/history/study/pgr/digi.aspx>) e il Digital History Research
Centre dell’ Università dell’Hertfordshire (<https://www.herts.ac.uk/digital-history>). Nell’estate 2017
si terrà a Losanna la seconda Summer School in Digital History (<http://www.dhsummerschool.ch>).
In ambito nazionale un insegnamento è stato attivato all’Univiersità di Venezia all’interno del master
in Digital Humanities (<http://www.unive.it/data/insegnamento/224318>) e l’Istituto Universitario
Europeo di Fiesole fornisce, nell’anno accademico in corso, un seminario inerente ai temi della storia
digitale
(<http://www.eui.eu/DepartmentsAndCentres/HistoryAndCivilization/ResearchAndTeaching/Seminar
s/2016-2017-1st-term/TS-Digital-History-BLOCK-EtkindNoiret.aspx>).
153 Bibliostoria, <https://bibliostoria.wordpress.com>.
107
Zotero) o per svolgere lavori di office su piattaforme online gratuite; completa il sito una
sua parte dedicata alla didattica della storia.
L’approccio di raccogliere «risorse web interessanti per la storia» 154 è quello seguito da
altre iniziative focalizzate maggiormente sui temi della Digital History, come il blog La
boîte aux outilès des historiens155 gestito da Franziska Heimburger e Émilien Ruiz, due
ricercatori francesi. Nato da un ciclo di lezioni metodologiche tenute nel 2009 all’EHESS
di Parigi, il blog si propone «un monitoraggio sugli strumenti informatici disponibili e
utili agli storici [con l’obiettivo di]: a) far conoscere e centralizzare le risorse utili per la
ricerca storica; b) proporre un’attività formativa (tramite tutorial); c) suscitare delle
riflessioni circa l’uso dell’informatica nelle discipline storiche»156. Il sito, oltre a proporre
post inerenti alle esperienze di insegnamento e ricerca nell’ambito della histoire
numérique, fornisce una ricognizione bibliografica abbastanza aggiornata su vari temi,
da quelli epistemologici a quelli concernenti l’uso di applicazioni specifiche, utile per chi
si approccia a questo campo di studi. Inoltre, sono presenti tutorial sia per strumenti
basilari (come cataloghi bibliotecari, database) sia per quelli più avanzati (come la guida a
Zotero o alla costruzione di cartografie). A differenza di Bibliostoria, che rimanda a
progetti strutturati, La boîte aux outilès ha nei suoi collegamenti siti e blog inerenti alla
Digital History o alla Digital Public History, come quelli di Serge Noiret157 o Fréderic
Clavert158.
Molte sono le risorse online che si occupano di mettere a disposizione strumenti utili alla
ricerca tra cui, a titolo esemplificativo, si segnalano: il progetto Connected Histories, che
consente un’interrogazione tra varie risorse digitali per la storia britannica tra il 1500 e il
1900159; il sito History Engine, che si propone come un motore di ricerca per la storia
evenemenziale degli degli Stati Uniti dal XIX secolo ad oggi 160; infine la piattaforma Clio
Visualizing History, che ha come obiettivo quello di costruire, a partire dal materiale
154 Ibidem.
155 La boîte aux outilès, <http://www.boiteaoutils.info>.
Ivi, À propos du blog, <http://www.boiteaoutils.info/a-propos-du-blog>.
Digital & Public History, <http://dph.hypotheses.org>.
L’histoire contemporaine a l’ère numérique, <http://histnum.hypotheses.org>.
Connected Histoires, <http://www.connectedhistories.org/Default.aspx>; la piattaforma consente di
cercare all’interno di un vasto corpu testuale per mezzo di una struttura che consente una
visualizzazione dei risultati simile a Google Books (la struttura è semantica, nel senso che si basa
sull’indicizzazione dei testi, ma non è stata pensata in funzione di un espressione semantica dei dati).
160 History Engine, <http://historyengine.richmond.edu>; il sito, a carattere didattico, consente di
navigare fra gli eventi più rilevanti della storia degli Stati Uniti contemporanei, sia usando una linea
del tempo che una mappa interattiva, ottenendo ad ogni ricerca informazioni provenienti da
collezioni di giornali digitalizzati.
156
157
158
159
108
fotografico, percorsi divulgativi e interattivi 161. Fatte queste premesse, in questo ultimo
paragrafo ci si propone di fornire degli esempi di utilizzo di due piattaforme web europee
pensate per la conservazione dell’eredità culturale e utili alla ricerca in ambito storico:
Europeana e CDEC Digital Library. Data la natura complessiva del presente lavoro di
tesi, si è scelto, in questa sede, un approccio comparativo, basato sull’esperienza d’ uso, più
che gli aspetti tecnici, che metta in luce pregi e difetti di ciascun progetto.
3.3.2 Europeana, un luogo virtuale per la conservazione dell’eredità culturale europea?
Come anticipato, è sostanzialmente inutile elencare i numerosi progetti che si occupano
di fornire in rete contenuti utili alla ricerca storica in senso lato, dal momento che
sarebbe un esercizio fine a sé stesso stante la massa di di risorse sterminata e in constante
divenire162; per questo motivo non si intende restituire un’istantanea dello stato dell’arte a
livello globale, ma si è preferito, nella stesura di questa tesi, adottare un approccio
deliberatamente asistematico, attento a vagliare la natura delle fonti e dei contenitori
digitali via via analizzati. Come case studies ne sono quindi scelti due riconducibili
all’esperienza della conservazione in digitale in Italia.
Numerosissimi sono i progetti di digitalizzazione di fondi bibliotecari, archivistici e di
collezioni museali avviati nel nostro Paese a partire dalla seconda metà degli anni
Novanta; tuttavia, a differenza di altre esperienze, come Gallica, il portale della
Bibliothèque Nationale de France, in Italia, per ragioni anche strutturali, è risultata non
del tutto adeguata una direzione da parte del Ministero dei Beni Culturali che da subito
uniformasse i criteri di conservazione delle risorse digitalizzate, armonizzandole con
quelli di altri progetti internazionali; così, il panorama delle istituzioni (pubbliche o
private) che hanno messo a disposizione il loro patrimonio culturale in rete risulta assai
frastagliato. Questa diversificazione scoraggia la ricerca, anche perché, troppo spesso, i
progetti di digitalizzazione sono stati effettuati con finanziamenti una tantum e molti
fondi o non sono completi, o resi disponibili nel solo formato immagine, oppure non
consultabili163. Partendo da questo quadro abbastanza scoraggiante, se si pensa ad altri
161 Clio Visualizing History, <https://www.cliohistory.org/click>, percorso sulla storia del femminismo
negli Stati Uniti.
162 Per un elenco, abbastanza aggiornato, ma non esaustivo, delle fonti digitali utili alla ricerca storica,
archivistica e bibliografica si rimanda al volume Il web e gli studi storici, cit.
163 È il caso della Teca Digitale della Regione Piemonte, in cui i risultati di ricerca non possono essere
visualizzati perché la piattaforma non è più aggiornata ai web browser più recenti; ad esempio,
<http://www.regione.piemonte.it/TecaViewer/index.jsp?RisIdr=TECA0000326132&keyworks=vittorio
%20amedeo>.
109
progetti europei o statunitensi, la linea degli ultimi anni è stata quella di creare dei
metacataloghi che consentissero l’interrogazione su più singoli database di biblioteche
digitali – con questo termine si intende tutto il complesso delle piattaforme che
forniscono risorse documentarie digitalizzate. Sono nati così i progetti Internet Cultuale
dell’ICCU (Istituto Centrale per il Catalogo Unico) e Cultura Italia che sfruttano i
metadati per reperire risultati interrogando cataloghi di istituzioni più piccole 164; gli
algoritmi che gestiscono il ranking non sono pubblici e in entrambi i casi i risultati di
ricerca sono tutt’altro che esaltanti165. La cosa più sconcertante è che, proponendosi come
onnicomprensivi, ci siano risorse poco diversificate e i risultati non siano minimamente
paragonabili a quelli di un motore di ricerca generalista; sono state create due piattaforme
gemelle che non comunicano efficacemente. Un approccio completamente diverso, e
forse più intelligente, è quello di DARIAH – IT 166, che si propone di mettere a
disposizione strumenti utili alla ricerca, senza però unificare le banche dati in un unico
metacatalogo167.
I problemi delle biblioteche digitali italiane si riverberano in Europeana, gigantesco
progetto cofinanziato dall’UE rilasciato nel 2010 in versione stabile che ha l’obiettivo di
«trasformare il mondo con la cultura! [e di] costruire sulla ricchezza dell’eredità culturale
europea rendendola più facile l’accesso alle persone per lavoro, per l’apprendimento o per
lo svago168». Non è facile nell’articolato sito del progetto trovare informazioni dettagliate
sulla sua governance, sui suoi finanziamenti pubblici e sull’impatto effettivo nell’uso
quotidiano. Europeana è gestita da una fondazione che ha sede nei Paesi Bassi, controllata
dalla Commissione Europea e amministrata da un consiglio direttivo internazionale 169 e
come tale riceve finanziamenti pubblici da parte dei singoli stati e dai fondi comunitari
164 Cultura Italia (<http://www.culturaitalia.it>) nasce con l’intento di conservare più che altro risorse
provenienti dai musei o da altre istituzioni culturali; le sue ricerche interrogano, in parte Internet
Culturale (<http://www.internetculturale.it/opencms/opencms/it>) che è invece fornisce cataloghi e
collezioni digitali delle biblioteche italiane.
165 Per esempio se nella ricerca del termine "Primo Levi" nel catalogo dell’Internet Culturale si ottengono
come primi risultati alcune scansioni dei libri dell’autore torinese (ma solo le copertine e gli indici, per
via del diritto d’autore), in Cultura Italia vengono proposti una serie di oggetti per nulla inerenti
all’indagine effettuata, in cui spiccano alcuni quadri e indicazioni museali.
166 DARIAH – IT, <http://it.dariah.eu>; è il nodo italiano di DARIAH – UE, con il quale condivide la
missione principale. DARIAH fornisce servizi avanzati basati sull’uso delle ICT per i ricercatori nel
campo delle arti e le scienze umane, coniugando lo sviluppo tecnologico con l’istruzione e la
formazione, promuovendo la collaborazione e la ricerca comune, la comunicazione e la diffusione, la
condivisione di esperienze e strumenti nel campo delle Digital Humanities per la trasmissione e
l’utilizzo del patrimonio culturale digitale.
167 Per rendersi conto delle istituzioni partecipanti si rimanda a <http://it.dariah.eu/sito/strumenti>.
168 Europeana, <http://www.europeana.eu/portal/it>.
110
per circa 10 milioni di euro annui 170. Europeana si posiziona al 68.411. posto del ranking
Alexa su scala globale171; nella sezione del sito dedicata alle statistiche sono disponibili i
dati relativi agli accessi che ne mostrano l’ammontare per mese e per anno: si registra una
netta diminuzione delle visite, dalle 1.400.000 annue circa del 2014 alle 560.000 del 2016,
con una curva delle visualizzazioni che flette nei mesi estivi per riprendersi tra settembre
e dicembre 172; incrociando questi dati con quelli di Alexa si evince che gli accessi sono per
lo più concentrati ad alcuni Paesi europei e agli Stati Uniti.
Partendo dalla considerazione che allo stato attuale solo il 10 per cento del patrimonio
culturale europeo è digitalizzato (circa 300 milioni di oggetti, di cui un terzo disponibile
online), Europeana si propone come una piattaforma in grado di garantire l’accesso
stabile a queste risorse, che attualmente ammontano a circa 54 milioni, delle quali 32
milioni hanno metadati strutturati173. Per quanto concerne la conservazione dei
documenti digitalizzati, l’obiettivo di Europeana è duplice; da un lato acquisire gli
oggetti digitali dalle varie istituzioni nazionali, come l’ICCU, che hanno già dei loro
cataloghi con sistemi di metadatazione propri; dall’altro fornire ai soggetti che ancora
non hanno sviluppato piattaforme web per la conservazione dei loro materiali uno
schema per organizzarli in modo da essere inseriti nativamente nella piattaforma
comune. In entrambi i casi Europeana usa un suo modello ontologico, EDM (Europeana
Data Model)174 che arricchisce i sistemi per la metedatazione degli oggetti maggiormente
usati (Dublin Core175 e Open Archives Initiative Object Reuse & Exchange176) con le
169 Il consiglio direttivo della Fondazione (management board) è il risultato di una sintesi tra i membri
nominati dalle istituzioni pubbliche e quelli che vi possono essere inseriti tramite un’elezione di
secondo livello che avviene tra tutti gli iscritti alla Europeana Network Association (non sono richieste
particolari credenziali basta appartenere, in senso largo, ad un’istituzione che si occupa di cutltural
heritage). Cfr. Europeana Business Plan 2016. Creating Cultural Connections, 2016,
<http://pro.europeana.eu/files/Europeana_Professional/Publications/europeana-bp-2016.pdf>.
170 Cfr. Europeana. Sharing The Beautiful Things. Annual Report & Accounts 2015, 2016,
<http://pro.europeana.eu/files/Europeana_Professional/Publications/europeana-annual-reportaccounts-2015.pdf> e Europeana Strategy 2020. Network & Sustainability (draft), 2014,
<http://pro.europeana.eu/files/Europeana_Professional/Publications/Europeana%20Strategy
%20Network%20Sustainability.pdf>; circa 30 milioni di euro all’anno sono stati i finanziamenti nel
2010-2015.
171 Europeana.eu Traffic Statistics, <http://www.alexa.com/siteinfo/europeana.eu> .
172 Europeana statistics, <http://statistics.europeana.eu/europeana> .
173 Cfr. Europeana Strategy 2020, cit.
174 Europeana Data Model Primer, 2013, <http://pro.europeana.eu/share-your-data/data-guidelines/edmdocumentation>.
175 Dublin Core, <http://dublincore.org>.
176 Open Archives Initiative, <https://www.openarchives.org/ore>.
111
tecnologie semantiche (Skos177 e Cidoc Crm178); i dati sono cioè ad un primo livello
organizzati seguendo ontologie dettagliate studiate per la conservazione dei beni
culturali e quindi tradotti in formato RDF. Attraverso le best practices del Web
Semantico, Europeana provvede quindi ad arricchire i propri oggetti con i Linked Open
Data (LOD), il che rende il suo gigantesco dataset collegato agli altri nodi della rete
semantica (come Geonames o DBpedia). Le informazioni relative ai documenti
conservati sono quindi molteplici, non solo la descrizione del contenuto, ma anche la sua
geolocalizzazione, i riferimenti all’ente di provenienza e al suo dataset, collegamenti con
altri oggetti dello stesso autore o simili, ecc.; ogni risorsa è dotata di una didascalia che ne
indica le possibilità di riuso179, può essere condivisa sui social network e si può navigare, in
maniera casuale, ad altre immagini digitali che le sono simili per colore. I dataset di
Europeana hanno accesso libero, possono essere interrogati da uno SPARQL endpoint, i
dati e gli oggetti open access si possono riutilizzare liberamente e il portale incoraggia il
riuso dei propri dati tramite delle API che gli sviluppatori hanno la facoltà di inglobare
nei propri siti o applicazioni180. Questo è quanto si evince dal programma quinquennale
2015-2020 e dal business plan 2016 della Fondazione181, dimostrano un’attenzione
maggiore riguardo al riuso dei contenuti rispetto al miglioramento degli algoritmi di
ricerca. Proponendosi come concorrente al Google Arts & Cultural 182, Europeana si
appoggia alla filosofia dell’open source al fine di favorire l’accesso interattivo alle proprie
collezioni che possono ad esempio essere usate dai musei per la ricostruzione di ambienti
virtuali o per la creazione di web app a scopo divulgativo183.
Come sarà chiaro, Europeana si rivolge al tempo stesso a tre pubblici differenti: a) ai
cittadini che desiderano avere accesso ai contenuti del patrimonio culturale; b) a
biblioteche, archivi e musei che intendono usare una piattaforma pubblica per la
conservazione dei propri oggetti digitali; c) alle imprese che si occupano di costruire
applicazioni per costruire tour virtuali (per esempio l’app di un museo184) o a team di
sviluppatori che operano nell’ambito dei Linked Open Data. Proprio per raggiungere i
diversi tipi di pubblico Europeana presenta un sito diviso in diverse sezioni (Collections,
177 Skos, <https://www.w3.org/2004/02/skos>.
178
179
180
181
Cidoc Crm, <http://www.cidoc-crm.org>.
Cfr. <http://www.europeana.eu/portal/it/rights/terms.html>.
Europeana Pro, <http://pro.europeana.eu>.
Cfr.
Europeana
Strategy
2015-2020,
<http://pro.europeana.eu/files/Europeana_Professional/Publications/Europeana%20Strategy
%202020.pdf> e Europeana Business Plan 2016, cit.
182 Google Arts & Cultural, <https://www.google.com/culturalinstitute/beta>.
183 Europeana Labs, <http://labs.europeana.eu>.
184 Come ad esempio l’app Muzeums, <http://labs.europeana.eu/apps/muzeums>.
112
2014,
Pro, Labs e Research), tramite i quali chiunque può usare i contenuti digitali come
meglio crede, purché vengano rispettati i diritti d’autore. Accanto al mashup dei propri
contenuti Europeana ha investito molto nel costruire percorsi tematici divulgativi
incentrati sulla storia dell’arte185 e della musica186 e della moda187. Parallelamente vengono
organizzate delle esibizioni virtuali temporanee come, tra le altre, Europeana 280, una
mostra virtuale di dieci capolavori dell’arte per ciascuno dei 28 Stati dell’Unione 188, da cui è
derivato Faces of Europe, un progetto che si propone di ricostruire una storia del ritratto
nell’Età moderna189. La sua struttura finalizzata alla divulgazione non ha reso Europeana
una piattaforma particolarmente adatta all’uso nelle attività di ricerca in ambito
documentario, privilegiando quello artistico museale 190. Ad esempio, ricercando il
termine «Rousseau», in modo da ottenere risultati in lingua francese, Europeana non
restituisce, in prima battuta, una qualunque delle opere dell’autore ginevrino, ma
contenuti di varia natura tra cui mappe, cataloghi bibliotecari e immagini 191. Sono
risultati non conformi alle aspettative, anche perché le collezioni digitali della BNF sono
conservate in Europeana; confrontandoli con quelli ottenuti su Gallica o su Internet
Archive (due piattaforme generaliste), i risultati di Europeana non sono soddisfacenti e
invogliano a rivolgersi ad altri strumenti che invece restituiscono al primo impatto
contenuti più pertinenti.
3.3.3 Una piattaforma di crowdsourcing. Europeana 1914-18
Accanto alla sua struttura generale, Europeana presenta, nell’ambito più ristretto della
Digital History, un progetto interessante legato al centenario della Grande Guerra,
Europeana 1914-1918 – Untold Stories & Official Histories of WW1192. Come si evince
titolo, vengono proposti due approcci per la conservazione di documenti digitali inerenti
alla Prima guerra mondiale: da un lato quello di esporre i materiali aggiunti dalle varie
istituzioni nazionali; dall’altro Europeana si propone come piattaforma per conservare le
riproduzioni digitali dei cimeli di guerra che sono custoditi nelle case dei cittadini.
185 Europeana Art, <http://www.europeana.eu/portal/it/collections/art>.
186 Europeana Music, <http://www.europeana.eu/portal/it/collections/music>.
187 Europeana Fashion, <http://www.europeana.eu/portal/it/collections/fashion >.
188 Europeana 280, <http://www.europeana.eu/portal/it/collections/art-history/Europeana280.html>.
189 Faces of Europe, <http://www.europeana.eu/portal/en/exhibitions/faces-of-europe>.
190 Prima di formulare la ricerca si è provato con altri termini e le pertinenze dei risultati migliora, di
molto, se si inseriscono cognomi di pittori o musicisti; per esempio cercando "Caravaggio" il rumore
informativo è molto minore e vengono subito mostrati i quadri più famosi del pittore lombardo.
191 <http://www.europeana.eu/portal/it/search?f%5BLANGUAGE%5D%5B%5D=fr&q=rousseau>.
192 Europeana 1914-1918, <http://www.europeana1914-1918.eu/it/about>.
113
Chiunque può caricare sul sito fotografie, onorificenze, lettere di congedo, ecc.,
appartenute a parenti o conoscenti che combatterono nella Grande Guerra; inoltre si
possono trasmettere le storie legate all’oggetto digitalizzato 193. Dopo essere state
sottoposte al vaglio istituzionale (di Europeana o dei partner affiliati)194, le risorse
vengono, metadatate, arricchite di significato semantico e, potenzialmente, conservate
per sempre in rete; si tratta di un modo utile per dare la possibilità a studiosi e appassionati
di confrontarsi con una documentazione che altrimenti resterebbe difficilmente
accessibile. La maschera di ricerca di Europeana 1914-1918 consente di navigare i
contenuti in maniera efficace (pur ricalcando quella del motore generalista) ed è possibile
scegliere se fare una ricerca su tutto il materiale o soltanto su quello pubblicato tramite
crowdsourcing; l’indagine può anche essere geografica, tematica, per tipo di fonte e
argomento trattato. Un’altra funzione molto interessante è quella di poter navigare non
solo sulle risorse provenienti dall’Europa, ma anche da quelle che sono fornite da
istituzioni statunitensi, canadesi, australiane e neozelandesi (ad esempio quelle della
Digital Public Library of America195 che con Europeana condivide lo stesso modello di
metadazione)196. Dalle statistiche si evince che i soggetti istituzionali hanno contribuito
alla conservazione di circa 750.000 documenti, mentre circa di 230.000 oggetti è stato
l’apporto da parte degli utenti197.
Europeana 1914-1918 è dunque al tempo stesso una piattaforma classica per la
conservazione dei contenuti digitali, una forma di crowdsourcing e un progetto di Digital
Public History; gli utenti possono contribuire non solo caricando i propri cimeli, ma
anche annotando, trascrivendo, traducendo, "taggando", metadatando, condividendo,
collegando tra loro tutti gli oggetti conservati. Si può conoscere la storia di intere
famiglie, si possono seguire le vicissitudini belliche dei singoli individui, ricostruire una
storia dal basso di una battaglia, indagare le condizioni di vita nelle trincee, ecc. Gli stessi
193 Nel 2011-13 sono state organizzate in tutt’Europa delle giornate di raccolta di materiali e testimonianze
che hanno portato ad ottenere circa 50.000 oggetti digitalizzati, ma è ancora possibile caricarli anche
privatamente accedendo alla sezione "Aggiungi". Cfr. S. DI GIORGIO, Europeana 1914-1918. La
Grande Guerra raccontata dalla gente comune, in «DigItalia Web. Rivista digitale nei Beni
Culturali», 1 (2013), <http://digitalia.sbn.it/article/view/728/503>, pp. 157-160.
194 L'iniziativa è stata promossa da Europeana e dall’Università di Oxford. In Italia coinvolge il Ministero
per i Beni e le Attività Culturali e del Turismo, tramite l’ICCU e altri istituti come la Biblioteca
Nazionale Centrale di Roma (BNCR), il Museo Centrale del Risorgimento di Roma e la Fondazione
del Museo storico del Trentino; cfr. Ivi, p. 157.
195 DPLA, <https://dp.la>.
196 I due cataloghi sono infatti, in fase sperimentale, parzialmente interrogabili da una piattaforma
comune, WUD; <http://www.unifr.ch/mh/wud>.
197 <http://www.europeana1914-1918.eu/it/statistics>.
114
contenuti vengono rielaborati da Europeana in esposizioni temporanee, come quella fatta
in concomitanza con le vacanze natalizie198, o in percorsi divulgativi a carattere
interattivo come il corso World War I. A Battle of Perspectives disponibile su iTunes U199;
inoltre, le risorse possono essere liberamente riutilizzate ad esempio in lavori accademici
e divulgativi, così come nella costruzione di siti web. Insomma, tra le tante speranze
disattese da Europeana come luogo virtuale unico per l’eredità culturale europea, il
progetto 1914-1918 appare un buon modo di conservare in rete la memoria storica
collettiva della Prima guerra mondiale garantendo un accesso stabile e interattivo alle
risorse.
3.3.4 L’organizzazione di risorse eterogenee attraverso i Linked Open Data: la CDEC
Digital Library
Europeana è, tra le piattaforme di conservazione dell’eredità culturale nel digitale, una
delle poche che adotta una struttura semantica e apre alcune sezioni alla collaborazione
degli utenti; nonostante abbia degli evidenti limiti rispetto alle iniziative private come
Google o Internet Archive, Europeana presenta il grande vantaggio di consentire il riuso
dei suoi contenuti liberi da copyright e un’ontologia pubblica di organizzazione dei
metadati. Indagando in maniera più dettagliata nel campo di iniziative con obiettivi
meno generali, si scopre una grande varietà di piattaforme utili alla ricerca storica e
documentaria, che adottano un approccio collaborativo. È il caso per esempio dei progetti
Transcribe Bentham dell’University College di Londra200 e Emigrant City della New York
Public Library201; nel primo caso viene chiesto agli utenti di collaborare alla trascrizione
delle opere manoscritte del filosofo Jeremy Bentham attraverso l’uso di un software di
text encoding. Nel caso della biblioteca di New York il progetto riguarda la metadatazione
e la trascrizione delle schede prodotte dalla Emigrant Saving Bank, la cassa di risparmio
newyorkese che finanziava gli emigrati; tramite il crowdsourcing l’obiettivo è quello di
ricostruire una storia sociale dell’immigrazione nella Grande Mela, favorito anche da un
software pratico e intuitivo202 alla portata di tutti.
198 <http://www.europeana.eu/portal/en/exhibitions/sausages-and-cigars-for-christmas>.
199 M. POPOVA, Europeana launches Multi-Touch Book and iTunes U course on the First World War, in
Europeana Pro, 13 ottobre 2015 [blog post], <http://pro.europeana.eu/blogpost/europeana-launchesmulti-touch-book-and-itunes-u-course-on-the-first-world-war>.
200 Transcrive Bentham, <http://blogs.ucl.ac.uk/transcribe-bentham>.
201 Emigrant City, <http://emigrantcity.nypl.org/#>.
202 Un’approccio simile, in entrambi i casi a Wiki Source.
115
Molte sono anche le iniziative che sfruttano le tecnologie del Web semantico per
l’organizzazione, la conservazione, la fruizione e il riutilizzo di informazioni e risorse
utili alla ricerca storica. Senza aprire, in questa sede, un’analisi su quei progetti che si
occupano di estrarre informazioni da un corpu di dati (per esempio un fondo
archivistico)203, ci si può concentrare su quelli che usano i Linked Open Data in ambito
culturale204. Tra le varie iniziative di cui si può rendere conto, per esempio quelle che
cercano di tradurre in linguaggio semantico i cataloghi bibliotecari o che cercano di
organizzare ontologicamente i contenuti di un archivio 205, ci si concentrerà su quella
avviata dalla Fondazione CDEC (Centro di Documentazione Ebraica Contemporanea)
di Milano. Il progetto va contestualizzato nel diffuso interesse che i Linked Open Data
hanno suscitato nel nostro Paese206.
All’interno di un più ampio disegno per la valorizzazione e la fruizione del proprio
patrimonio documentario, finanziato nel 2009 con una legge dello Stato, la Fondazione
ha avviato, dal 2012, la sistemazione dei materiali conservati nel Centro di
Documentazione ai fini della costituzione della CDEC Digital Library. La biblioteca
digitale, inaugurata nel 2015, è stata realizzata in partnership con il MIBACT e la società
Regesta.exe che ne cura gli aspetti informatici; data la vastità dei documenti conservati al
CDEC, attivo dal 1955 come «Istituto per la raccolta e la conservazione dei documenti
dell’ebraismo italiano dall’età dell’Emancipazione ai giorni nostri» 207, il focus su cui si
sono concentrati gli sforzi della riorganizzazione documentaria è stato quello della
Shoah e della Resistenza. Come ricordano Silvia Mazzini e Laura Brazzo, curatrici del
progetto, i materiali cui ci si è dovuti approcciare sono di natura eterogenea: «300.000
documenti comuni; 27.000 volumi; 40.000 fotografie (analogiche e digitali); 2.200
203 Ad esempio i progetti STECH e Harlock avviati dal Dipartimento di Informatica dell’Università di
Torino
in
collaborazione
col
Polo
del
‘900,
<http://beta.di.unito.it/index.php/english/research/groups/intelligent-semantic-technologies-humanand-artificial-agents-collaboration/projects/stech>.
204 Ci si può rendere idea della vitalità delle iniziative che ruotano intorno a questi temi visitando il sito
LODLAM (Linked Open Data in Libraries, Archives, and Museums <http://lodlam.net>) all’interno
del quale si può trovare il progetto Linked Jazz (<https://linkedjazz.org/network>), una rete semantica
per la storia della musica jazz. Cfr. Linked data for cultural heritage, ed. by E. JONES and M. SEIKEL,
Facet Publishing, London 2016, pp. 8-20.
205 Cfr. Ivi, § 6 e M. GUERRINI – T. POSSEMATO, Linked data per biblioteche, archivi e musei, cit., § 8.
206 Oltre Cultura Italia, tra le istituzioni che hanno reso disponibili i propri dati segnaliamo, a titolo
esemplificativo, il CNR (<http://data.cnr.it/site/>) e la Camera dei Deputati <http://dati.camera.it/it/>.
207 CDEC Digital Library. Linked Open Data per l’organizzazione del patrimonio informativo sugli ebrei
in Italia, a cura di L. BRAZZO e S. MAZZINI [slide presentate al seminario Lavorare coi Linked Data,
Torino
16
giugno
2016],
<http://www.mabitalia.org/index.php/comitatati/piemonte/item/download/243_d5c36de7abb91ad7db3d8a69a525e69a>.
116
collezioni di riviste; 1.200 registrazioni video 700 registrazioni audio» 208, catalogati con
sistemi differenti e con diverse piattaforme; oltre a questa massa documentaria va
aggiunto il database del CDEC che contiene circa 9.000 nomi di vittime cui si riferiscono
svariate informazioni (familiari, luogo di deportazione, convoglio, ecc.).
Integrando questi dati con quelli provenienti dalla banca dati delle vittime della Shoah in
Italia, espressa in formato tabellare, è stato deciso di organizzare i contenuti documentari
usando come fil rouge proprio le persone. Partendo da una ontologia FOAF si è quindi
passato a costruire un’"ontologia della persecuzione" 209 che avesse come focus i due
momenti dell’arresto e della deportazione delle vittime (vi sono connessi dati relativi ai
luoghi, ai convogli ferroviari, al campo di concentramento, ecc.; figg. 38 39, 40). La prima
fase del progetto, dopo l’organizzazione dei materiali e la parziale digitalizzazione, è
stata quella di organizzare i metadati provenienti dai vari sistemi descrittivi in una
piattaforma che non ne stravolgesse la natura; la seconda fase è stata quella di organizzare
i dati in forma semantica secondo gli standard del W3C 210. Per compiere queste operazioni
sono state usati due sistemi DAM (Digital Asset Management), xDams per organizzare i
materiali in locale211 e Open Dams per la trasformazione del dato in triple RDF e per la
pubblicazione sul Web. Organizzando i dati contenuti nei database secondo l’ontologia si
è quindi avviata la terza fase, cioè quella della riconciliazione dei nomi interna a dataset,
per armonizzare le varianti di un singolo nome, e di reasoning, cioè il collegamento tra i
dati espressi in Open Dams e xDams con quelli del fondo documentario e, quando è stato
possibile, coi documenti digitalizzati. Esprimere i contenuti documentari attraverso i
Linked Open Data permette di connettere il dataset del CDEC con altri resi pubblici, per
esempio Geonames, e quindi di inserire la Shoah Victim Names nel reticolo della
LodCloud (fig. 41).
A livello di usabilità la CDEC Digital Library è strutturata in modo agevole per tutte le
tipologie di utenti (sono pensati anche in questo caso percorsi divulgativi), ma si
percepisce come la finalità ultima sia quella dell’attività di ricerca; i risultati di una query
possono essere filtrati facilmente e navigati seguendo le collezioni documentarie presenti
sulla piattaforma, dai quali si può accedere al dettaglio della descrizione documentaria e,
se presente, alla riproduzione digitale del documento cui si è interessati. La natura di
questa piattaforma è quindi ibrida perché integra informazioni di tipo diverso
(bibliotecarie, archivistiche, ipertestuali), ma riesce a restituire i risultati in maniera
precisa e con una logica corrispondente alle aspettative. Ad un livello più profondo i dati
208
209
210
211
Ibidem.
Shoah Vocabulary Specifications, <http://dati.cdec.it/lod/shoah/reference-document.html>.
Cfr. supra §2.3.1.
xDams, <http://www.xdams.org>.
117
organizzati dal CDEC sono interrogabili e visualizzabili usando gli strumenti del Web
Semantico; si può fare una richiesta dallo SPARQL endpoint212 oppure visualizzare la
descrizione ontologica di un singolo elemento attraverso LodView 213. Ma la possibilità
veramente innovativa è quella usare LodLive 214 per costruire una rete semantica: partendo
dal nome di una vittima è possibile scoprire in maniera interattiva i legami familiari, date
e luoghi degli arresti, giorno della liberazione, ecc. In questo modo non solo è più facile
visualizzare in maniera dinamica i dati altrimenti fruibili solo da un database realzionale,
creando percorsi di ricerca o didattici (fig. 42).
§§§
Il confronto tra CDEC e Europeana, pur tenendo presente le debite differenze, volge
nettamente a sfavore della seconda; non solo nella piattaforma europea i risultati di
ricerca sono, come visto, piuttosto inadeguati (ad esempio cercando "Primo Levi"
compare come primo risultato un programma da sala di un concerto di un’associazione
musicale ginevrina)215, ma è anche lontana anche l’ipotesi di visualizzare la rete semantica
che è in back end rispetto ai risultati proposti dalla piattaforma. In entrambi i casi lo stato
attuale dello sviluppo è ben lungi dall’essere completato ed ambedue le iniziative, nella
loro diversità, sono un passo in avanti nell’ottica di una migliore organizzazione e di un
miglior sistema di reperimento dei dati digitali, nella prospettiva di trasformare il Web
nel Global Giant Graph216. Il caso del CDEC è particolarmente significativo, non a caso il
progetto è stato insignito del "Grand Prize" nella Lodlam Challenge del 2015 217, e può
essere preso dagli enti culturali medio-piccoli come modello di organizzazione di un
complesso documentario eterogeneo e frastagliato, frutto della stratificazione di politiche
di digitalizzazione di documenti e cataloghi non sempre svolte in maniera coerente.
212 Virtuoso SPARQL Query Editor, <http://lod.xdams.org/sparql>.
213
214
215
216
217
CDEC Linked Open Data, <http://dati.cdec.it/lod/shoah/website/html>.
LodLive, <http://dati.cdec.it/lodlive/?http://dati.cdec.it/lod/shoah/person/4919>.
<http://www.europeana.eu/portal/it/search?q=primo+levi&view=grid>.
Cfr. supra § 2.3.1.
<http://www.cdec.it/home2_2.asp?idtesto1=1569&idtesto=940&son=1>.
118
Illustrazioni §3.3
Figura 38. Schema ontologico FOAF (CDEC Digital Figura 39. Visualizzazione dei dettagli di un
convoglio ferroviario diretto ad Auschwitz (Ibidem).
Library. Linked Open Data).
Figura 40. Modello ontologico della deportazione (Ibidem).
119
Figura 41. La Shoah Victim Names nel reticolo della Lod Cloud (<http://lod-cloud.net/versions/2017-0220/lod.svg>).
Figura 42. Esempio di visualizzazione semantica dell’entità "Primo Levi" con l’applicazione Lod Live
(<http://dati.cdec.it/lodlive/?http://dati.cdec.it/lod/shoah/person/5002>).
120