Descrizioni archivistiche e web
semantico: un connubio possibile?
Salvatore Vassallo
Introduzione
Il presente articolo è incentrato sulla valutazione delle possibilità,
dei vantaggi e delle problematiche nell’esprimere le descrizione
archivistiche direttamente nel web semantico. Una riflessione in
questo ambito non ha tentativi precedenti almeno per quanto concerne lo specifico del mondo archivistico, mentre recentemente una
simile riflessione è stata condotta da Martha Yee, con una ricerca
volta a indagare se (e con quali caratteristiche) i dati bibliografici
possano sopravvivere direttamente nel web semantico (Yee 2009).
Per verificare se le descrizioni archivistiche possano sopravvivere
direttamente nel web semantico è necessario valutare in che modo rendere ogni singola regola e esigenza prevista dagli standard
archivistici, traducendoli negli specifici costrutti della tecnologia
scelta (nel caso in oggetto le Topic Maps, standard International Organization for Standardization (ISO) 13250). Una volta assicurato
il rispetto delle regole previste dagli standard è, però, necessario
valutare quali conseguenze e quali scenari di utilizzo possano aprirsi
nella diffusione di informazione così codificata.
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010), p. 169–193.
DOI: 10.4403/jlis.it-27
S. Vassallo, Descrizioni archivistiche e web semantico
Gli strumenti usati: le Topic Maps
Topic Maps e RDF
Martha Yee, nelle sue ricerche e nel saggio citato in precedenza,
costruisce un modello basato su Resource Description Framework
(RDF) per esprimere e vincolare le regole di catalogazione, guidando,
in questo modo, la pubblicazione dei dati catalografici direttamente
nel web semantico. Le riflessioni alla base di questo articolo saranno
rivolte invece all’espressione di descrizioni archivistiche utilizzando
le Topic Maps, una tecnologia codificata dalla famiglia di standard
ISO 13250. Lo standard ISO 13250 è infatti uno standard a più livelli
(parti) che definisce la tecnologia delle Topic Maps, in particolare si
compone di:
• 13250-1 Topic Maps - Overview and Basic Concepts: un’introduzione discorsiva alle Topic Maps
• 13250-2 Topic Maps Data Model: il modello di dati delle Topic
Maps
• 13250-3 Topic Maps - XML Syntax: una sintassi XML per la
serializzazione di Topic Maps
• 13250-4 Topic Maps - Canonicalization Canonicalization XML
Topic Maps (CXTM): è anch’essa una sintassi XML, a differenza
della precedente non orientata all’interscambio e alla comunicazione delle informazioni, ma finalizzata alla verifica della
conformità dei software nel supportare i diversi linguaggi di
serializzazione
• 13250-5 Topic Maps Reference Model: un modello di riferimento più astratto del TMDM che, pur con un’indubbia utilità, identifica in parte arbitrariamente costrutti come topics,
occurrences, names e associations.
170
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
• 13250-6 Topic Maps - Compact Syntax: una sintassi per serializzare Topic Maps meno verbosa e prolissa di XTM
• 13250-7 Topic Maps - Graphical Notation: nasce per rispondere
all’esigenza di una notazione grafica utile sia per documentare e rappresentare in esempi Topic Maps,sia per descrivere
l’ontologia e il modello
A questi vanno aggiunti gli standard:
• ISO 18048 Topic Map Query Language: un linguaggio di interrogazione specifico per questa tecnologia
• ISO 19756 Topic Maps Constraint Language: un linguaggio per
esprimere schemi di validazione
• ISO 29111 Topic Maps - Expressing Dublin Core Metadata using
Topic Maps: una mappatura volta a definire come esprimere
metadata Dublin Core in Topic Maps.
Entrambe le tecnologie, Topic Maps e RDF, sono cardini nella lunga
strada verso il web semantico e condividono aspetti e potenzialità
di utilizzo, pur prefigurando scenari di utilizzo differenti (Pepper
2008b). In passato, fin dai primi anni del 2000 agli albori di entrambe
le tecnologie, si è spesso riflettuto sulla necessità e profitto nell’esistenza di due distinte tecnologie e le prime valutazioni a riguardo
sono volte a stabilire i legami esistenti fra le Topic Maps e gli altri
modelli, schemi e sintassi legati al web semantico e a vagliare la possibilità di fusione fra questi linguaggi (Garshol 2001; Pepper 2002).
Tuttavia, lo stesso Garshol (2003) ha in seguito concluso che una
vera e propria fusione degli standard (in particolare delle Topic Maps
e di RDF) non sembra essere possibile né desiderabile e le discussioni si sono orientate verso vocabolari di mapping che permettano
un interscambio di dati tra le due tecnologie e i differenti formati
(Pepper et al. 2006a,b; Presutti et al. 2005).
171
S. Vassallo, Descrizioni archivistiche e web semantico
Aldilà delle differenze implementative, degli strumenti di sviluppo e dei differenti scenari di utilizzo delle due tecnologie, la scelta
di utilizzare le Topic Maps come strumento per esprimere nel web
semantico descrizioni archivistiche conformi agli standard descrittivi è dettata dalla possibilità di utilizzare il Topic Maps Constraint
Language (TMCL), standard ISO 19756 giunto allo stadio di Final
Committee Draft (FCD) (ISO/IEC FCD 19756 2010), per esprimere
vincoli e obbligatorietà nelle descrizioni. Il TMCL è dunque un
linguaggio vincolato per creare schemi di validazione per le Topic
Maps1 Utilizzando il TMCL è possibile esprimere obbligatorietà e
ripetibilità degli elementi e dei costrutti previsti all’interno del Topic
Maps Data Model (TMDM) (ISO/IEC 13250-2:2006 2006) o vincolare (anche tramite regular expression) il valore che questi possono
assumere. Per quanto concerne l’aspetto della validazione, questo
linguaggio vincolato per Topic Maps risulta superiore all’accoppiata
RDF e Ontology Web Language (OWL), seppur anche quest’ultimi
possano esprimere diversi vincoli, ma rimanendo in ogni caso strumenti orientati e strutturati per l’inferenza e per una ”semantica del
ragionamento” rispetto a una validazione vincolante (Garshol 2006).
Per perseguire l’obiettivo di verificare se e in che misura le regole di descrizione archivistica possano essere espresse nel semantic
web, risulta maggiormente pratico l’utilizzo di una tecnologia con
specifici standard preposti alla validazione.
Breve introduzione alle Topic Maps
Le Topic Maps sono una tecnologia per la rappresentazione e l’interscambio della conoscenza. Nonostante il nome della tecnologia e
le differenti traduzioni ormai stratificate e diffusesi nella letteratura
1 Sostanzialmente
è possibile paragonare il TMCL a ciò che rappresentano XML
Schema e Document Type Definition (DTD) nel caso dei documenti XML.
172
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
italiana sull’argomento (Meschini 2005; Vassallo 2007; Vivanet 2007;
Weston 2002), le Topic Maps non sono né mappe di navigazione,2 né
mappe grafiche, 3 né mappe mentali o concettuali (Garrido e Tramullas 2004). Infine, ciò è essenziale nel prosieguo e nello sviluppo
della discussione, non devono essere identificate necessariamente
con eXtensible Markup Language (XML): XML Topic Maps (XTM)
è solo uno dei possibili formati di serializzazione, ma una topic
map può essere immagazzinata anche all’interno di un database
relazionale o di altri lignuaggi di serializzazione (Garshol 2005). La
flessibilità di questa tecnologia, evolutasi dal contesto di creazione e
fusione di indici analitici di manuali tecnici entro cui era nata con
il nome di Navigation Maps (Pepper 1999), offre alcuni strumenti
che possono renderla appetibile anche per la gestione e fusione di
metadati descrittivi differenti (Garshol 2004). Il modello di dati delle
Topic Maps definisce infatti alcuni elementi (costrutti nel lessico delle
Topic Maps) che combinati fra di loro permettono di esprimere e
codificare una gamma illimitata di descrizioni e relazioni e che, per
tornare allo scopo originario della tecnologia, permettono di gestire
agevolmente indici multipli fondendoli e disambiguando i differenti
termini. Senza illustrare nel dettaglio i singoli costrutti che costituiscono questa tecnologia, si possono evidenziare quattro elementi
fondamentali che è necessario prendere in esame per sottolineare
il grado di flessibilità che è possibile raggiungere con applicazioni
basate su Topic Maps.
2 Tuttavia
è possibile utilizzare le Topic Maps per emulare mappe di navigazioni,
come avviene per il software xSiteable http://xsiteable.sourceforge.net/.
3 Per visualizzare Topic Maps è possibile utilizzare librerie grafiche come Hypergraph http://hypergraph.sourceforge.net/, Touchgraph
http://sourceforge.net/projects/touchgraph/ o il modulo Vizigator all’interno della suite Ontopia http://code.google.com/p/ontopia/, per visualizzarle sotto
forma di grafo, utile ad esempio per navigare ontologie.
173
S. Vassallo, Descrizioni archivistiche e web semantico
Figura 1: Esempio di Topic Maps espresso nella notazione grafica GTMalpha, una
proposta di schema grafico per la produzioni di esempi di istanze di topic
map (Thomas et al. 2008)
174
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
Topics
Il topic è la rappresentazione univoca di un qualunque ‘’soggetto”’, intendendo per soggetto qualunque elemento del discorso su
cui l’autore della topic map intenda parlare. Topics e subjects sono
dunque gli ideali componenti di un triangolo semiotico: rappresentano rispettivamente il simbolo e il referente (Eco 1973; Ogden
e Richards 1923). Tra il topic e il subject esiste una relazione uno a
uno, in cui ogni soggetto viene rappresentato da un solo topic e ogni
topic può rappresentare un unico soggetto. Questo principio (detto
collocation objective, ‘’collocazione oggettiva”) assicura che tutto ciò
che si conosce (all’interno di un dato sistema) su un determinato
soggetto sia accessibile univocamente da un punto d’accesso, dato
che quel soggetto è rappresentato da solo un topic (Sigel 2003).
Ad esempio sono topics ”JLIS”, ”Salvatore Vassallo”, ”Descrizioni archivistiche e web semantico un connubio possibile?” etc. Il
topic può essere caratterizzato tipologicamente, topic type (tipo di
argomento), sia per favorire l’aumento delle informazioni (si riconduce un’istanza a una determinata classe), sia per la risoluzione di
omonimie: si pensi a Vassallo (topic type: persona) rispetto a Vassallo (topic type: feudatario) e a tutti gli stratagemmi anche grafici
utilizzati per disambiguare i due termini nella creazione di indici (si
tratta ancora una volta di dover gestire stesse stringhe di testo che
identifichino soggetti differenti). Continuando l’esempio precedente
topic types potrebbero essere ”Rivista”, ”Persona”, ”Articolo”; è
essenziale considerare che i topic types saranno a loro volta topics:
sarà necessario, ad esempio, dichiarare esplicitamente4 ”Rivista”,
4 In realtà la nuova proposta di formato di scambio XML, XTM 2.1, permette di
indicare il tipo di argomento anche facendo riferimento direttamente a un subject
identifier o a un subject locator, ossia a un Uniform Resource Identifier (URI) con
funzione di identificativo, senza doverlo necessariamente includere formalmente
come topic all’interno della topic map.
175
S. Vassallo, Descrizioni archivistiche e web semantico
Figura 2: I topics sono surrogati (o proxies) nel mondo dei computer per gli
altrimenti ineffabili soggetti di cui si intende discutere.
176
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
”Persona”, ”Articolo”, come topics nella propria topic map per poterli
associare come tipi delle istanze del nostro sistema. Ogni topic può
avere diversi nomi, anche questi caratterizzabili tipologicamente
attraverso il topic name type (il tipo di nome dell’argomento). Nell’esempio di 1 si indica, ad esempio, un topic di tipo persona, che ha un
nome di tipo ”Nome formale” e topic name ”Vassallo, Salvatore”.
Associations
Un’associazione è un costrutto delle Topic Maps per rappresentare una relazione fra due o più topics (definiti role players, ‘’attori
dell’associazione’).
Tipicamente le relazioni (e dunque la loro rappresentazione in
un’associazione) sono binarie, ma è possibile instaurare associazione
tra più topics (3-ary o n-ary se fra un numero illimitato di soggetti)
come ad esempio nel caso ”Il complesso archivistico X, prodotto
da Y è conservato presso Z”5 (Ahmed 2003; Bry et al. 2006; Pepper
2000). L’associazione viene definita da un association type (tipo di
associazione) che permette di esprimere una semantica della relazione indicandone la tipologia. Si noti che anche i tipi di associazione,
come la maggior parte dei costrutti delle Topic Maps, sono a loro volta topics (questa considerazione risulterà fondamentale quando, nel
corso della ricerca, si cercheranno di evidenziare le caratteristiche di
flessibilità di questa tecnologia). L’associazione inoltre può essere
orientata in modo da determinare l’esatto ruolo che il topic assume
nell’associazione (member role, ruolo dell’attore) con la possibilità,
dal punto di vista dell’interfaccia utente, di determinare il verso delle associazioni per evitare paradossi come ”Descrizioni archivistiche
e web semantico scrive Salvatore Vassallo”, ma anche per chiarire
5 L’esempio ricalca una delle relazioni previste nella sezione dei collegamenti
fra descrizioni dello standard archivistico International Standard for Describing
Institutions with Archival Holdings (ISDIAH).
177
S. Vassallo, Descrizioni archivistiche e web semantico
il ruolo dei singoli topics in una relazione del tipo ”Y è padre di X”
o in una relazione gerarchica di intero/parte. Nell’esempio grafico
proposto in apertura di sezione, si rappresenta un’associazione di
tipo ”Scrive/È scritto da” tra il topic ”Vassallo, Salvatore” che recita il ruolo di ”scrittore” e il topic ”Descrizioni archivistiche e web
semantico” che ha il ruolo di ”scritto”6 .
Occurrences
Le occorrenze possono essere viste come associazioni interne
al topic stesso: sono, a tutti gli effetti, una rappresentazione di
una relazione tra un soggetto e una risorsa informativa (ovvero la
rappresentazione di qualunque sequenza di byte, eventualmente
recuperabile in rete). Questa considerazione deve essere valutata
con attenzione nella fase di modellazione del proprio sistema: in
alcuni casi l’utilizzo di occorrenze per esprimere quelle che in realtà
sono associazioni binarie può essere visto come una forzatura ().
Le occorrenze possono essere intese come i campi descrittivi di un
topic e anche queste sono caratterizzate da uno specifico occurrence
type che ne determini la natura: nell’esempio proposto è presente
un’occorrenza, all’interno del topic ”Descrizioni archivistiche e web
semantico” di tipo ”abstract”.
Scope
Il modello delle topic map permette di fornire tre tipi di asserzioni (definite complessivamente come le caratteristiche del topic,
o topic characteristics) su un topic: il suo nome, le sue occorrenze e
6 In realtà il tipo di associazione, a propria volta un topic, potrebbe avere due
differenti topic name (”scrive” e ”è scritto da”) che potrebbero essere utilizzati dall’interfaccia in fase di visualizzazione a seconda del ”verso” della relazione e quindi
del ruolo del topic coinvolto.
178
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
le associazioni in cui è coinvolto; la specificazione di una caratteristica avviene, tuttavia, esclusivamente all’interno di uno specifico
contesto (il problema del contesto del resto riveste un ruolo chiave
nel mondo archivistico e nella descrizione della documentazione).
Scope (”àmbito”) è appunto un costrutto delle Topic Maps definito nel
modello dei dati con la funzione di permettere di limitare l’ambito di
validità di un’asserzione, in questo senso una dichiarazione priva di
un ambito specificato formalmente è definita ’unconstrained’ ovvero
illimitata (non dipendente da un determinato e specifico contesto).
Nel grafico di Figura 1, ad esempio, si limita l’occorrenza di tipo
abstract qualificandola linguisticamente. Il costrutto di scope può
essere dunque utilizzato per limitare un’asserzione da diversi punti
di vista: questo costrutto rappresenta un elemento fondamentale
usato in casi che spaziano dal multilinguismo all’espressione dei
limiti temporali di un’asserzione. Nel passato soltanto Marc De
Graauw, Steve Pepper e Geir Ove Grønmo hanno evidenziato alcuni
spunti di discussione sull’utilizzo del costrutto scope (De Graauw
2002a,b; Groenmo e Pepper 2001), mentre recentemente Lars Marius Garshol ha sollecitato una riflessione sulla definizione della
semantica di scope, sulla sua traduzione pratica, sugli effetti sulle
interfacce, sulle possibilità offerte di filtraggio e, dal punto di vista
informatico, sull’impatto sui linguaggi di interrogazione (Garshol
2008). In estrema sintesi, sulla scorta della riflessione di Garshol, è
possibile evidenziare, senza pretese di esaustività, alcuni settori di
applicabilità del costrutto di scope come:
• multilinguismo: un nome o un’occorrenza possono essere limitati dal punto di vista linguistico o segnalando una variante
dialettale o regionale. Questa possibilità, nel caso, dei nomi, è
amplificata dall’opportunità di specificare diversi topic name
type (tipo di nome dell’argomento) e variant (variante). Dal lato dell’ interfaccia ciò si dovrebbe tradurre con la navigazione
179
S. Vassallo, Descrizioni archivistiche e web semantico
di ontologie multilingue, passando da un linguaggio all’altro,
escludendo specifiche lingue etc;
• provenienza: è possibile indicare la fonte di una determinata
dichiarazione; ciò riveste particolare importanza, ad esempio,
nel caso di datazioni di un documento, laddove le informazioni sulla data (cronologica e topica) siano provenienti da fonti
differenti (eventualmente in contrasto fra di loro);
• autorità – opinione: è possibile segnalare che un’asserzione è
valida in accordo con una determinata autorità o è una opinione di una determinata persona. Questo da un lato è essenziale
per la costruzione di authority files, permettendo, ad esempio,
di indicare quali regole di catalogazione o indicizzazione determini l’intestazione. L’utilizzo di scope per limitare un’asserzione a un’opinione personale, apre la possibilità a modifiche
della struttura e dell’ontologia personali, valide esclusivamente per un singolo o per un gruppo - cluster - di utenti con simili
interessi (Vassallo e Weston 2007);
• tempo: i limiti temporali di validità di un’asserzione sono essenziali per esprimere l’evoluzione diacronica di un termine,
di una denominazione, di un’associazione; ad esempio in questo modo è possibile limitare cronologicamente (per il periodo
di durata della collaborazione) l’associazione fra una persona
e un’organizzazione etc.;
• pubblico: la possibilità di indicare il destinatario di un’asserzione è di estrema importanza, soprattutto laddove si voglia
strutturare descrizioni pensate per target differenti. Dal punto
di vista della resa per l’utente questo può avere diverse implicazioni: da filtri e esclusione di termini e istanze a seconda del
pubblico fino a proporre descrizioni e occorrenze differenti a
seconda dei diversi utenti.
180
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
Esprimere descrizioni archivistiche in Topic
Maps
L’obiettivo di verificare i vantaggi e le criticità nell’immettere e
gestire le descrizioni archivistiche direttamente nel web semantico
richiede una solida base che confermi che qualunque esigenza o
regola di descrizione prevista dagli standard archivistici sia gestibile con sufficiente granularità. Pertanto è necessario mappare gli
standard descrittivi archivistici, nello specifico General International
Standard Archival Description (ISAD(G)), International Standard Archival Authority Record for Corporate Bodies, Persons, and Families
(ISAAR(CPF)), International Standard for Describing Institutions
with Archival Holdings (ISDIAH) e International Standard for Describing Functions (ISDF), con il modello dei dati delle Topic Maps in
maniera tale da fornire indicazioni su come esprimere le differenti
esigenze evidenziate dagli standard archivistici con i costrutti delle
Topic Maps. All’interno del presente articolo non si potrà fornire una
disamina dettagliata di ogni singolo elemento, ma ci si limiterà a
tratteggiare i capisaldi per una simile ricerca e a fornire alcuni esempi, volti a dimostrare la flessibilità dello strumento scelto. Come
già accennato in precedenza una simile ricerca non ha in letteratura
omologhi. I punti di partenza del lavoro saranno dunque:
• il citato studio di Martha Yee che, pur utilizzando una tecnologia differente (RDF) e rivolgendosi a un altro mondo (i
dati bibliografici), evidenzia i passaggi metodologicamente
necessari in un approccio di questo genere (da questo punto
di vista, la mappatura tra standard archivistici e il data model
delle Topic Maps può essere vista come un omologo del modello RDF7 che Martha Yee costruisce per esprimere le regole di
7 Si
veda http://myee.bol.ucla.edu/rdfmodelintro.html.
181
S. Vassallo, Descrizioni archivistiche e web semantico
catalogazione);
• le ricerche del gruppo di lavoro del professor Sam Oh, incentrate sulla possibilità di esprimere le relazioni previste dal rapporto Functional Requirements for Bibliographic Records (FRBR)
in Topic Maps e di convertire direttamente record MARCXML
(Lee, Jeon e Han 2006; Oh 2008);
• il tentativo di definire linee guida per esprimere metadati
Dublin Core in Topic Maps poi confluito nella definizione dello
standard ISO/IEC CD 29111 2009.
In particolare il terzo caso riveste grande importanza per il presente lavoro di ricerca in quanto traccia chiaramente i requisiti e le
difficoltà di simili approcci (Maicher 2008; Pepper 2008a). Nel caso
del Dublin Core si è trattato di definire le modalità e i costrutti idonei
per gestire il set base di 15 elementi8 (in seguito esteso a tutti gli elementi previsti da DCTERMS9 ) spaziando da soluzioni minimaliste
(una serie di coppie chiave/valore rappresentate in occorrenze) a
soluzioni, poi adottate, maggiormente strutturate con la definizione di associazioni per rappresentare le varie relazioni implicite a
un record Dublin Core (autore, lingua, editore etc.). L’importanza,
sottolineata in questo articolo in più occasioni, di utilizzare schemi di validazione per quanto sommaria è stata più volte ribadita e
calendarizzata all’interno del gruppo di lavoro sullo standard ISO
29111.10
8 Si
veda http://myee.bol.ucla.edu/rdfmodelintro.html>.
Metadata Terms http://dublincore.org/documents/dcmi-terms/>.
10 Si veda Support #1342: Investigate if we should use TMCL to define constraints
on DC all’indirizzo http://projects.topicmapslab.de/issues/1342.
9 DCMI
182
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
Un esempio di mappatura fra il modello di
dati delle Topic Maps e gli standard
archivistici
Il seguente (Figura 3) è un semplice esempio di schema, presupposto necessario per mappare i diversi elementi previsti dagli standard archivistici nel data model delle Topic Maps. Si tratta dell’area
dell’identificazione prevista da ISAAR(CPF).
Nello specifico si definisce innanzitutto il tipo di topic ”Agente”,
che è un abstract ovvero non potrà avere istanze direttamente collegate, ma queste saranno legate alle sue sottoclassi ”Ente”, ”Persona”,
”Famiglia”. Le forme autorizzate del nome, le forme parallele del
nome, le forme del nome autorizzate secondo altre regole e le altre
forme del nome, saranno tutte tipi di nomi del topic, che possono
essere ripetute a piacere con l’obbligo che sia presente almeno un
topic name di tipo forma autorizzata del nome. Si stabilisce inoltre che questi topic names possano essere qualificati da scope notes
di tipo data, periodo, qualificazione, lingua (nel caso delle forme
parallele), norma (nel caso delle forme autorizzate secondo altra
regola). Infine si definisce che i topics di tipo ”Ente” possano avere un’occorrenza di tipo ”Codice identificativo dell’ente”, che sia
univoca (cioè che assuma sempre valore diverso), limitando il tipo
di dato accettato per il valore dell’occorrenza a NMTOKEN11 . Tutti
questi vincoli possono essere poi codificati e espressi in una sintassi
CTM (un linguaggio di serializzazione compatto per Topic Maps, ad
esempio:
isaar-tm:agente isa tmcl:topic-type;
- ’Agente’;
is-astract();
11 http://www.w3.org/TR/xmlschema-2/#NMTOKEN.
183
S. Vassallo, Descrizioni archivistiche e web semantico
Figura 3: Esempio di modellazione dell’area dell’identificazione delle ISAAR(CPF),
espresso in una notazione grafica simil Unified Modeling Language (UML)
utilizzando Onotoa, un software per la creazione grafica di schemi TMCL.
184
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
has-name(isaar-tm:forma-autorizzata, 1, *).
isaar-tm:forma-autorizzata isa tmdm:topic-name-type;
- ’Forma autorizzata del nome
http://gilgamesh.unipv.it/psi/isaar/#isaar512>.
isaar-tm:persona isa tmcl:topic-type;
- ’Persona’;
ako isaar-tm:agente.
isaar-tm:famiglia isa tmcl:topic-type;
- ’Famiglia’;
ako isaar-tm:agente.
isaar-tm:ente isa tmcl:topic-type;
- ’Ente’;
ako isaar-tm:agente;
has-occurrence(isaar-tm:codice-identificativo-ente, 0, *).
isaar-tm:codice-identificativo-ente isa tmcl:occurrence-ty
- ’Codice identificativo dell\’ente’
http://gilgamesh.unipv.it/psi/isaar/#isaar512>
has-datatype(xsd:NMTOKEN);
is -unique().
In questo estratto di codice si definiscono il tipo di topic ”Agente” (
abstract) e le sue sottoclassi ”Ente”, ”Persona”, ”Famiglia” (sottotipi,
As Kind Of di ”Agente”). Si indica che i topics di tipo ”Agente”
dovranno avere almeno un topic name di tipo ”Forma autorizzata del
nome” (definito anche attraverso un subject identifier). Infine si indica
che i topics di tipo ”Ente” potranno avere una o più occorrenze di
tipo ”Codice identificativo dell’ente” e che queste avranno come
tipo di dato NMTOKEN e dovranno contenere valori univoci.
185
S. Vassallo, Descrizioni archivistiche e web semantico
Risultati e casi di utilizzo
Il semantic web è, al momento attuale, ancora una terra promessa da raggiungere attraverso un lungo cammino12 . Come spesso
accade, è piuttosto difficile valutare il grado di maturità di una tecnologia mentre questa sta ancora maturando. L’idea di fondo è quella
di sostituire l’attuale web, basato su documenti HyperText Markup Language (HTML) interrelati (con collegamenti esclusivamente
monodirezionali), con una rete semantica di classi, con proprie caratteristiche e relazioni (nel linguaggio delle Topic Maps parleremmo
di soggetti rappresentati da topics con specifiche caratteristiche, come nomi, occorrenze e associazioni). L’utilizzo degli strumenti e
delle tecnologie del semantic web potrebbe consentire una maggior
integrazione dei dati e delle descrizioni archivistiche e dei servizi
collegati, in particolar modo nel caso delle pubblicazioni di fonti in
rete. Estendendo la dimostrazione presentata in precedenza a tutti
gli elementi degli standard descrittivi archivistici è possibile dimostrare come sia attuabile una gestione delle descrizioni archivistiche
direttamente nel web semantico con una sufficiente granularità. Una
volta appurato che le descrizioni archivistiche possono essere gestite
direttamente nei termini del web semantico, occorre interrogarsi su
quali strumenti sia possibile costruire su queste basi e se un simile
approccio comporti benefici in termini di gestione, ricerca e presentazione dei dati. Ad esempio un sistema che permetta di gestire
relazioni (associazioni) multiple (ognuna valida in un determinato
ambito, ad esempio di autorità), garantisce la possibilità di fondere strumenti generalmente irrimediabilmente separati o di operare
12 Già ora si inizia a parlare di Web 3.0 (Moore 2009), ovvero un ulteriore tassello
verso il web semantico ipotizzato da Tim Berners Lee (Berners-Lee, Hendler e Lassila
2001; Shadbolt, Berners-Lee e Hall 2006) e quindi forse da intendere come 0.3 (Grimes
2007; Walsh 2009), ad indicare un passaggio verso un punto di arrivo ancora ben
distante.
186
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
facilmente ricostruzioni virtuali sulla carta. La possibilità di creare
un numero arbitrario di alberi archivistici può essere utilizzata in
diversi contesti: dalla possibilità per i ricercatori di riorganizzare la
documentazione sulla propria scrivania virtuale di lavoro (Virtual
Desktop Environment), fino alla possibilità di memorizzare un log
dei cambiamenti in un lavoro in progress eventualmente condiviso (permettendo così di ripristinare stadi precedenti di lavoro etc.).
Un esempio maggiormente immediato potrebbe essere visto nella
possibilità di gestione parallela di campi descrittivi (ad esempio
degli ambiti e del contenuto, per utilizzare la casistica prevista dagli standard internazionali) con differenti scope notes dal punto di
vista della lingua (per gestire descrizioni multilingue) o dal punto
di vista del target (per, eventualmente, fornire una descrizione scolastica o destinata ai ragazzi (Nanni 2005)). Ma i dati strutturati in
questa maniera e con una tale granularità di informazione portano
ad ulteriori prospettive a cui è necessario dedicare quantomeno un
rapido accenno. Strutturare le regole di descrizione sotto forma
di vincoli (espressi attraverso il linguaggio vincolato TMCL) permette di costruire facilmente interfacce software flessibili, di facile
creazione e modifica: ogni motore Topic Maps che gestisca schemi
TMCL13 potrebbe automaticamente generare un’interfaccia di inserimento dati che rispetti i vincoli indicati. In tal senso sarebbe
sufficiente cambiare un vincolo per modificare l’interfaccia senza
dover operare su codice, base di dati o altro (Vassallo 2010). Infine
Topic Maps così strutturate potrebbero essere usate come formato
neutro di interscambio fra sistemi archivistici; del resto bisogna ricordare come le Topic Maps nascano proprio come strumento per
fondere indici di manuali tecnici, per cui le procedure di fusione,
importazione e esportazione sono essenziali fin dalle origini della
13 Allo stato dell’arte, l’unico software che offra un supporto a schemi TMCL
è Topincs http://www.cerny-online.com/topincs/, sviluppato da Robert Cerny
http://www.topicmapslab.de/people/Robert_Cerny.
187
S. Vassallo, Descrizioni archivistiche e web semantico
tecnologia. Nel mondo degli archivi l’esigenza di un formato condiviso e di procedure collaudate di esportazione diventa pressante nel
caso della comunicazione dei dati verso i vari aggregatori di banche
dati come PLAIN (ora Lombardia Beni Culturali Archivi), SIUSA,
SIAS e soprattutto verso il nuovo Portale Archivistico Nazionale
all’interno del Sistema Archivistico Nazionale. L’approccio finora
proposto per ovviare al problema del flusso dei dati è un approccio rigidamente record centrico che offre, è necessario sottolinearlo,
comunque numerosi vantaggi, in particolar modo per ciò che concerne le procedure di verifica e recupero degli aggiornamenti. Le
Topic Maps invece considerano (o, meglio, possono considerare) il
sistema nella sua interezza, inoltre bisogna ricordare come uno dei
costrutti fondamentali è proprio l’associazione, pertanto le relazioni
sarebbero immagazzinate in maniera distinta, autonoma e sarebbe
addirittura possibile importare, ad esempio per fini di aggiornamento, una singola relazione. L’idea essenziale è che non è necessario,
in nessun caso e in special modo laddove entrino in gioco la cooperazione e la condivisione delle informazioni, manipolare l’intero
sistema espresso in una topic map, ma è possibile importare, fondere, riferirsi etc. anche solo a un estratto dell’intero sistema, un
frammento che per sua natura può essere facilmente integrato anche
dinamicamente, just in time. Quest’ultima considerazione apre le
porte a un ulteriore ambito di applicabilità delle Topic Maps, tipico
peraltro delle tecnologie del web semantico, ovvero il linked data:
un sistema archivistico al proprio interno potrebbe, ad esempio,
collegare un complesso archivistico a un soggetto produttore, senza
descrivere quest’ultimo né includerlo come topic, ma semplicemente
indicando nell’associazione un URI o, in ogni caso, un identificativo
di soggetto (auspicalmente esposti da un’ autorità come il Sistema
Archivistico Nazionale). La risoluzione dell’identificativo potrebbe
essere proprio un frammento di topic map che potrebbe essere letto e
188
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
caricato dinamicamente completando il puzzle delle informazioni
così costituito.
Conclusioni
In conclusione questi spunti di riflessione sono da intendersi
come un privo tentativo di discutere e sviscerare le possibilità di
applicare una specifica tecnologia, le Topic Maps, nel campo della
descrizione archivistica, evidenziandone i vantaggi e le potenzialità.
Attraverso l’uso del TMCL, il linguaggio vincolato per esprimere
schemi di validazione di Topic Maps, si è cercato di dimostrare come
sia possibile (in linea teorica e presentando un breve esempio tratto
dalle regole previste dallo standard ISAAR(CPF)) esprimere gli elementi previsti dagli standard archivistici in Topic Maps. Infine si sono
evidenziate le opportunità offerte da un simile approccio in campi
affini, ma non limitati alla descrizione, il riordino e l’inventariazione
di un complesso archivistico, verificando e proponendo soluzioni da
adottare per lo scambio di dati all’interno di sistemi archivistici (con
particolare riferimento ad aggregatori come il neonato Portale Archivistico Nazionale all’interno del Sistema Archivistico Nazionale)
e per la costruzione di interfacce flessibili e modulari.
Riferimenti bibliografici
A HMED, K AL (2003), «Hierarchical Classification Systems», http://www.
techquila.com/tmsinia4.html.
B ERNERS -L EE, T IM, J AMES H ENDLER e O RA L ASSILA (2001), «The Semantic Web», Scientific American, 284, 5, pp. 34–43, http://www.scientificamerican.com/
article.cfm?id=the-semantic-web.
189
S. Vassallo, Descrizioni archivistiche e web semantico
B RY, F RANÇOIS et al. (2006), «Efficient evaluation of n-ary conjunctive queries
over trees and graphs», in WIDM ’06: Proceedings of the 8th annual ACM international workshop on Web information and data management, NewYork: ACM,
pp. 11–18, http://rewerse.net/publications/download/REWERSERP-2006-130.pdf.
D E G RAAUW, M ARC (2002a), «Structuring Scope», http://www.marcdegraauw.
com/files/structuring_scope.htm.
— (2002b), «Survey of Actual Scope Use in Topic Maps», http://www.
marcdegraauw.com/files/scope_survey.htm.
E CO, U MBERTO (1973), Il segno, Milano: Isedi.
G ARRIDO, P IEDAD e J ESÙS T RAMULLAS (2004), «Topic Maps an alternative or a
complement to concept maps?», in Concept Maps: Theory, Methodology, Technology
Proceedings of the First Int. Conference on Concept Mapping, Pamplona 2004, http:
//cmc.ihmc.us/papers/cmc2004-226.pdf.
G ARSHOL, L ARS M ARIUS (2001), «Topic maps, RDF, DAML, OIL: a comparison»,
http://www.ontopia.net/topicmaps/materials/tmrdfoildaml.
html.
— (2003), «Living with topic maps and RDF», http://www.ontopia.net/
topicmaps/materials/tmrdf.html.
— (2004), «Metadata? Thesauri? Taxonomies? Topic Maps! Making Sense of it all»,
Journal of Information Science, 30, 4, pp. 378–391, http://www.ontopia.net/
topicmaps/materials/tm-vs-thesauri.html.
— (2005), «XTM is not Topic Maps», http://www.garshol.priv.no/blog/7.
html.
— (2006), «Ontologies: validation or reasoning», http://www.garshol.priv.
no/blog/76.html.
— (2008), «A Theory of Scope», in Scaling Topic Maps. Third International Conference
on Topic Maps Research and Applications, TMRA 2007 Leipzig, Germany, October
11-12, 2007 Revised Selected Papers, a cura di Lutz Maicher e Lars Marius Garshol,
Berlino: Springer-Verlag, pp. 74–85.
G RIMES, S ETH (2007), «Tableau does Web 0.2... but that’s just a first step»,
http://intelligententerprise.informationweek.com/blog/
archives/2007/11/tableau_does_we.html.
G ROENMO, G EIR O VE e S TEVE P EPPER (2001), «Towards a General Theory of Scope», in Proceedings of Extreme Markup Languages 2001, http:
//conferences.idealliance.org/extreme/html/2001/Pepper01/
EML2001Pepper01.html.
ISO/IEC 13250-2:2006 (2006), Information Technology - Document Description and
Processing Languages - Topic Maps - Data Model, Geneve: International Organization
for Standardization, http://www.isotopicmaps.org/sam/sam-model/.
190
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
ISO/IEC CD 29111 (2009), Information Technology - Topic Maps - Expressing
Dublin Core Metadata using Topic Maps, Geneva: International Organization for
Standardization, http://www.jtc1sc34.org/repository/0883.htm.
ISO/IEC FCD 19756 (2010), Information Technology - Document Description and Processing Languages - Topic Maps - Data Model, Geneve: International Organization
for Standardization, http://www.isotopicmaps.org/tmcl/tmcl.html.
L EE, H YUN -S IL, YANG -S EUNG J EON e S UNG -K OOK H AN (2006), «MARCXTM: Topic
Maps Modeling of MARC Bibliographic Information», in Charting the Topic Maps
Research and Applications Landscape, First International Workshop on Topic Maps
Research and Applications, TMRA 2005, Leipzig, Germany, October 6-7, 2005, Revised
Selected Papers, a cura di Lutz Maicher e Alexander Sigel, Berlino: Springer-Verlag,
pp. 241–252.
M AICHER, L UTZ (2008), «Mapping between the Dublin Core Abstract Model DCAM
and the TMDM», in Scaling Topic Maps, Third International Conference on Topic
Maps Research and Applications, TMRA 2007, Leipzig, Germany, October 11-12, 2007,
Revised Selected Papers, a cura di Lutz Maicher e Lars Marius Garshol, Berlino:
Springer-Verlag, pp. 198–213, http://www.informatik.uni-leipzig.de/
\~maicher/publications/DCAMandTMDM_latest.pdf.
M ESCHINI, F EDERICO (2005), «Le mappe topiche: come imparai a non preoccuparmi
e ad amare i metadati», Bollettino AIB, 45, 1, pp. 59–72, http://www.aib.it/
aib/boll/2005/0501059.htm.
M OORE, G RAHAM (2009), «Topic Maps fits in very well with Web 3.0 and Linked
Data», http://www.semantic-web.at/1.36.resource.293.grahammoore-x22-topic-maps-fits-in-very-well-with-web-3-0-andlinked-data-x22.htm.
N ANNI, G IANCARO (2005), L’archivio storico spiegato ai ragazzi, San Miniato: Titivillus,
p. 98.
O GDEN, C HARLES K EY e I VOR A RMSTRONG R ICHARDS (1923), The Meaning of Meaning: A Study of the Influence of Language Upon Thought and of the Science of Symbolism,
London: Routledge & Kegan Paul.
O H, S AM G YUN (2008), «MARC, FRBR and RDA: The Topic Maps Perspective», in
Topic Maps 2008, http://www.topicmaps.com/tm2008/oh.pdf.
P EPPER, S TEVE (1999), «Navigating haystacks and discovering needles: introducing
the new topic map standard», Markup Language, 1, 4, pp. 47–74.
— (2000), «The TAO of topic maps: finding the way in the age of
infoglut», in Proceedings of XML Europe, http://www.sil.org/sgml/
pepperTAOofTopicMaps.pdf.
— (2002), «Ten Theses on Topic Maps and RDF», http://www.ontopia.net/
topicmaps/materials/rdf.html.
191
S. Vassallo, Descrizioni archivistiche e web semantico
P EPPER, S TEVE (2008a), «Expressing Dublin Core in Topic Maps», in Scaling Topic
Maps. Third International Conference on Topic Maps Research and Applications, TMRA
2007 Leipzig, Germany, October 11-12, 2007 Revised Selected Papers, a cura di Lutz
Maicher e Lars Marius Garshol, Berlino: Springer-Verlag, pp. 186–197, http:
//www.ontopedia.net/pepper/papers/DCinTopicMaps.pdf.
— (2008b), «Topic Maps and the Semantic Web», http://topicmaps.
wordpress.com/2008/05/11/topic-maps-and-the-semanticweb/TopicMapsandtheSemanticWeb.
P EPPER, S TEVE et al. (2006a), «A Survey of RDF/Topic Maps Interoperability
Proposals», http://www.w3.org/TR/rdftm-survey/.
P EPPER, S TEVE et al. (2006b), «Guidelines for RDF/Topic Maps Interoperability»,
http://www.ontopia.net/work/guidelines.html.
P RESUTTI, VALENTINA et al. (2005), «Towards the definition of guidelines for
RDF and Topic Maps interoperability», in Proceedings of the 5th International
Workshop on Knowledge Markup and Semantic annotation (SemAnnot 2005)
located at the 4rd International Semantic Web Conference (ISWC 2005), http:
//sunsite.informatik.rwth-aachen.de/Publications/CEURWS/Vol-185/semAnnot05-08.pdf.
S HADBOLT, N IGEL, T IM B ERNERS -L EE e W ENDY H ALL (2006), «The Semantic Web Revisited», IEEE Intelligent Systems, 21, pp. 96–101, http://doi.
ieeecomputersociety.org/10.1109/MIS.2006.62.
S IGEL, A LEXANDER (2003), «Topic Maps in Knowledge Organization», in XML Topic
Maps: creating and using topic maps for the web, a cura di Jack Park e Sam Hunting,
Boston: Addison-Wesley, pp. 383–476.
T HOMAS, H ENDRIK et al. (2008), «GTMalpha - Towards a Graphical Notation for
Topic Maps», in Subject-centric Computing: Fourth International Conference on Topic
Maps Research and Applications, TMRA 2008 Leipzig, Germany, October 16-17, 2008.
Revised Selected Papers, a cura di Lutz Maicher e Lars Marius Garshol, Leipzig:
Leipzig Univeristy Press, pp. 113–128.
VASSALLO, S ALVATORE, in Workshop Teca del Mediterraneo XI. L’organizzazione della
conoscenza fra identità e multiculturalità, a cura di Maria Abenante.
— (2007), «Le mappe topiche come un ponte tra beni culturali diversi», Culture
del testo e del documento: le discipline del libro nelle biblioteche e negli archivi, 22,
pp. 97–109.
— (2010), «Topincs 4, awesome», http://culturalheritage.wordpress.
com/2010/03/30/topincs-4-awesome/.
VASSALLO, S ALVATORE e PAUL G ABRIELE W ESTON (2007), «...e il navigar m’è dolce in
questo mare: linee di sviluppo e personalizzazione dei cataloghi», in La biblioteca
su misura: verso la personalizzazione del servizio, a cura di Claudio Gamba e Maria
Laura Trapletti, Milano: Editrice Bibliografica, pp. 130–167.
192
JLIS.it. Vol. 1, n. 1 (Giugno/June 2010)
V IVANET, G IULIANO (2007), «Topic Maps e XTM per l’e-learning», Journal of e-Learning
and Knowledge Society, 3.
WALSH, D AVID (2009), «Web 0.2 in the Web 2.0 World», http://davidwalsh.
name/web-02-web-20-world.
W ESTON, PAUL G ABRIELE (2002), «Dal controllo bibliografico alle reti documentarie. Il catalogo elettronico nella prospettiva dell’interoperabilità fra sistemi
eterogenei», Biblioteche Oggi, 5, pp. 44–56.
Y EE, M ARTHA M. (2009), «Can Bibliographic Data Be Put Directly Onto the Semantic Web?», Information Technology and Libraries, 28, 2, pp. 55–80, http://
repositories.cdlib.org/postprints/3369/.
Informazioni
L’autore
Salvatore Vassallo
Università degli Studi di Pavia
Email:
[email protected]
Web: http://culturalheritage.wordpress.com
Il saggio
Data di submission: 2010-04-20
Data di accettazione: 2010-05-19
Ultima verifica dei link: 2010-05-21
Data di pubblicazione: 2010-06-15
193