Article JFIM2016 SIFR Jonquet
Article JFIM2016 SIFR Jonquet
Article JFIM2016 SIFR Jonquet
Résumé
Contexte – En dépit d'une large adoption de l'anglais, une quantité significative des données
en biomédecine est en français. Outre l'existence de nombreuses ressources en anglais, il y
a beaucoup moins de terminologies et d’ontologies en français et il manque crucialement
d'outils et de services pour les exploiter. Cette lacune contraste avec le montant considérable
de données biomédicales produites en français, particulièrement dans le monde clinique
(e.g., dossiers médicaux électroniques). Methode & Résultats – Nous présentons le SIFR
BioPortal, une plateforme ouverte et générique pour l’hébergement d’ontologies et de ter-
minologies biomédicales françaises, basée sur la technologie du National Center for Biome-
dical Ontology. Le portail facilite l’usage et la diffusion des ontologies du domaine en of-
frant un ensemble de services (recherche, alignements, métadonnées, versionnement, visua-
lisation, recommandation) y inclus pour l’annotation sémantique. En effet, le SIFR Annota-
tor est un outil pour traiter des données textuelles en français. Une évaluation préliminaire,
montre que le service web obtient des résultats équivalents à ceux reportés précédemment,
tout en étant public, fonctionnel et tourné vers les standards du web sémantique. Nous pré-
sentons également de nouvelles fonctionnalités de la plateforme.
Abstract
Background – Despite a large adoption of English in science, a significant quantity of bio-
medical data uses the French language. Besides the existence of various English tools, there
are considerably less terminologies and ontologies available in French and there is a strong
lack of related tools and services to exploit them. This lack does not match the huge amount
of biomedical data produced in French, especially in the clinical world (e.g., electronic
health records). Method & Results – We present the SIFR BioPortal, an open platform to
host French biomedical ontologies and terminologies based on the technology developed by
the National Center for Biomedical Ontology. The portal facilitates use and fostering of
ontologies by offering a set of services (search, mappings, metadata, versioning, visualiza-
tion, recommendation), including for annotation purposes. Indeed, the SIFR Annotator is a
2 C. Jonquet, A. Annane, K. Bouarech, V. Emonet, S. Melzi
publicly accessible ontology-based annotation tool to process text data in French. A prelim-
inary evaluation shows the web service matches previously reported work in French in per-
formance, while being public, functional and turned toward the semantic web standards. We
also present new improvements of the platform.
Mots clés : Ontologies/terminologies biomédicales, portail d’ontologies, annotation
sémantique, web sémantique, fouille de texte, BioPortal.
Keywords: Biomedical ontologies/terminologies, ontology portal, semantic annotation,
semantic web, text mining, BioPortal.
1 Introduction
Le volume de données en biomédecine ne cesse de croître [1]. En dépit d'une large adoption
de l'anglais, une quantité significative de ces données est en français [2]. En général, le con-
tenu textuel de ces ressources est indexé par mots-clés pour permettre une recherche efficace
mais avec des limites évidentes : synonymie, polysémie, utilisation des connaissances du
domaine. L'intégration de données biomédicales et l'interopérabilité sémantique sont indis-
pensables pour permettre de nouvelles découvertes scientifiques qui pourraient émerger du
rapprochement des différentes données disponibles. Les terminologies et les ontologies 1
jouent un rôle central en sciences de la vie pour structurer les données médicales et les rendre
interopérables [3]. En particulier, la communauté les utilise pour créer des index séman-
tiques, destinés à améliorer la recherche et la fouille de données grâce aux connaissances
médicales que ces ontologies formalisent. Cependant, outre l'existence de nombreuses res-
sources en anglais, il y a beaucoup moins d'ontologies en français et il manque crucialement
d'outils et de services pour les exploiter. Cette lacune contraste avec le montant considérable
de données biomédicales produites en français, particulièrement dans le monde clinique
(e.g., dossiers médicaux électroniques). En outre, lorsqu’il s’agit d’utiliser des ontologies
dans le domaine de la santé, plusieurs questions se posent, par exemple : (i) si j’ai développé
une ontologie, comment je la met à disposition des autres à moindre coût ? (ii) si j’ai besoin
d’une ontologie, où est-ce que je la récupère dans le format de mon choix ? (iii) s’il existe
plusieurs possibilités, comment savoir qu’elle ontologie utiliser, laquelle est la plus appro-
priée pour ma tâche ? (iv) comment est-ce que je peux utiliser les ontologies pour lier/anno-
ter mes données ? Globalement, nous pouvons dire, qu’il existe un véritable besoin d’utiliser
des ontologies sans avoir à les gérer : il faut permettre aux experts du domaine de se focaliser
sur la science biomédicale, et ne pas avoir à se soucier des questions d’ingénierie des con-
naissances liées à une utilisation avancée des ontologies. Dans cet article, nous proposons
des solutions nouvelles pour ces deux enjeux majeurs (mise à disposition des ontologies et
annotation sémantique) pour la gestion des données biomédicales.
Le projet SIFR (Indexation sémantique de ressources biomédicales francophones -
www.lirmm.fr/sifr), a pour objectif de résoudre les défis scientifiques et techniques pour
exploiter les ontologies dans la construction de services d'indexation, de fouille, et de re-
cherche de données pour les ressources biomédicales françaises. En collaboration avec le
NCBO (National Center for Biomedical Ontology - www.bioontology.org) de l’Université
de Stanford qui développe un portail d’ontologies biomédicales (le NCBO BioPortal [4]),
nous avons développé un service d’annotation sémantique basé sur les ontologies biomédi-
cales françaises similaire à celui qui existe pour les ressources anglaises [5], mais spécialisé
1
Ci-après, nous utilisons seulement le mot « ontologie » y inclus pour terminologie et vocabulaire.
SIFR BioPortal 3
2 Etat de l’art
2.1 Portails d’ontologies/terminologies biomédicales
En France, dans le domaine de la santé, le besoin de lister et intégrer les ontologies en
langues françaises a été identifié depuis les années 2000, plus particulièrement au sein des
initiatives UMLF (Unified Medical Language for French) [8], et VUMeF (Vocabulaire Uni-
fié Médical Francophone) [9], qui avaient pour objectif de reproduire ou de se rapprocher
des solutions de la US National Library of Medicine telle que la ressource UMLS [10]. Le
projet InterSTIS (2007-2010) a donné lieu aux derniers résultats sur ce sujet. Le besoin d’of-
frir une base de terminologies unifiées et inter-reliées les unes les autres dans un format pivot
avait été identifié par ce projet. Ce besoin devait servir la problématique d’annotation sé-
mantique de données (également appelé indexation sémantique) [11]. Les principaux résul-
tats de ce projet en termes de ressource multi-terminologiques ont été :
Le portail SMTS basé entre autre sur la technologie ITM développée par la société Mon-
deca [7]. Si SMTS n’est plus maintenu aujourd’hui, la technologie ITM existe toujours
et elle est déployée par la société pour ses clients, dans le domaine de la santé ou autre.
Le portail HMTP [12] (Multiple Terminologies in a Health Portal) développé par le
groupe CISMeF, qui est plus tard devenu HeTOP (Health Terminology/Ontology Portal
- www.hetop.eu) [6]. HeTOP est un portail multi-terminologique et multilingue qui in-
tègre près de 70 terminologies/ontologies telle que MeSH, la CIM-10, la CCAM,
SNOMED-International, etc. Il permet de chercher des termes et d’accéder à leurs tra-
ductions, d’identifier les liens entre ontologies et tout particulièrement d’accéder aux
données indexées par le CISMeF dans des plateformes telles que DocCISMeF [13]. La
valeur ajoutée du portail vient clairement de l’expertise médicale de ses développeurs,
qui intègrent les ontologies méthodiquement une par une, produisent des traductions des
termes et indexent (souvent manuellement) les ressources de données du domaine.
Parallèlement à ces initiatives françaises, la communauté internationale a développé des pla-
teformes similaires dont l’écho est parfois multiplié car la communauté adressée est bien
plus grande (anglaise) et inclue bien souvent aussi les biologistes. En complément
4 C. Jonquet, A. Annane, K. Bouarech, V. Emonet, S. Melzi
d’UMLS [10], nous pouvons citer l’OBO Foundry [14], l’Ontology Lookup Service [15] et
le NCBO BioPortal [4]. Ce dernier est devenu une plateforme de référence pour la publica-
tion et la mise à disposition d’ontologie en biomédecine. Le NCBO BioPortal permet d’ac-
céder, visualiser, rechercher et commenter plus de 400 ontologies ou terminologies (princi-
palement en anglais) de différent domaine en biologie ou médecine. Les ontologies peuvent
être utilisées pour annoter automatiquement des données textuelles [5] et le portail offre
également un index sémantique de plusieurs jeux de données biomédicales annotées avec
les ontologies du portail [16]. La plateforme est tournée vers le web sémantique, et les utili-
sateurs ont accès soit via une application Web, une API REST, ou un SPARQL endpoint.
Les philosophies des deux portails HeTOP et NCBO BioPortal sont différentes même
s’ils sont sur les mêmes créneaux. La vision d’HeTOP, semblable à celle d’UMLS, est de
construire un « metathesaurus » où chaque ontologie source est intégrée dans un modèle
spécifique (et propriétaire) et où elles sont manuellement inspectées, traduites, et alignées.
Bien entendu, ce travail fastidieux a pour valeur ajoutée une grande richesse et confiance
dans les données ci-intégrées, mais cela vient au prix d’un processus humain complexe et
long qui ne passe pas à l’échelle du nombre d’ontologies produites pour le domaine de la
santé aujourd’hui (même la NLM ne peut pas suivre le rythme de production d’ontologies
biomédicales pour l’intégration dans UMLS). En outre, ce contenu est difficilement expor-
table du système d’information d’HeTOP, qui ne propose pas publiquement d’API et/ou de
format standard et interopérable pour les récupérer facilement (bien que dans le cadre de ce
travail plusieurs ontologies nous ont été données par CISMeF au format OWL). La vision
de BioPortal est différente, elle consiste à offrir une plateforme ouverte, basée sur les stan-
dards du web sémantique sans intégrer les ontologies une à une dans un méta modèle. La
plateforme supporte des mécanismes de production et stockage d’alignements et d’annota-
tions, mais ne crée pas de nouveau contenu. Le portail n’est pas multilingue, mais il offre
une variété de services aux utilisateurs qui veulent eux-mêmes déposer leurs ontologies ou
seulement réutiliser certaines déjà stockées dans la plateforme. Pour une comparaison ex-
haustive des deux portails et des outils d’annotation, nous renvoyons le lecteur vers [17].
assez générale, la connaissance représentée dans les ontologies est rarement utilisée pour
l’expansion d’annotations et les outils ne sont pas facilement accessibles (e.g., web service)
et il est souvent difficile de les utiliser avec une nouvelle ontologie. La plupart de ces outils
sont limités à UMLS ou à un petit nombre d’autres ontologies. Ne pas avoir ces limites a été
rapporté comme un avantage du NCBO Annotator [5] que nous réutilisons dans nos travaux.
Cependant, là encore, les solutions pour traiter les données en langue française sont très
limitées e.g., [29]. Nous pouvons mentionner : F-MTI (French Multi-Terminology Indexer)
[30, 31] développé au CISMeF et désormais la propriété de la société Vidal et son succes-
seur, ECMT (Extracteur de Concepts Multi-Terminologique – http://ecmt.chu-rouen.fr), qui
est un web service également proposé plus récemment par CISMeF et qui est lui aussi dé-
sormais transféré au domaine privé auprès de la société Alicante. L’avantage principal de
ces outils est qu’ils utilisaient partiellement les techniques du traitement du langage naturel
telles qu’une approche sac de mots et un outil de racinisation spécifique pour le français.
Cependant, F-MTI n’est pas accessible au public. Et depuis très récemment, ECMT non plus,
même si le produit évolue toujours (il est désormais utilisé au sein de divers projets com-
merciaux pour indexer des comptes rendus médicaux). Dans leur version précédentes, ces
outils n’étaient pas réellement « orientés service » (peu flexible et peu de paramètres) ni
n’utilisaient d’URI ; ainsi leurs résultats étaient difficilement interopérables avec le web de
données. Même si ces aspects pratiques sont moins importants que bien entendu la qualité
des annotations générées, il s’avère que ce sont des critères de choix pour favoriser l’adop-
tion des outils d’annotation sémantique au-delà du cercle restreint des experts du traitement
de la langue. Par conséquent, le besoin d’un véritable service d’annotation sémantique pour
la communauté biomédicale française est toujours bien d’actualité.
En outre, le travail sur les workflow d’annotation sémantique n’est jamais très éloigné
de celui sur les plateformes d’ontologies. Chaque fois qu’un groupe développe une plate-
forme, il développe en général un outil d’annotation qui va avec : MetaMap [21] pour
l’UMLS, Whatizit [32] pour l’OLS, le NCBO Annotator [5] pour BioPortal et ECMT/F-MTI
[30] pour le CISMeF. Ainsi, notre choix de réutilisation de la technologie du NCBO nous
permet d’adresser les deux besoins mentionnés en introduction et pour lesquels, comme nous
venons de le voir, les travaux précédents sont insuffisants ou pas satisfaisants.
par CISMeF, suite au développement d’un export OWL pour la plateforme HeTOP. La liste
des ontologies actuellement dans le portail est donnée dans le Tableau 1. Les ontologies
d’accès restreint peuvent être stockées en mode private (c’est-à-dire accessibles seulement
aux ayant droits). Pour le moment, nous n’avons pas encore déterminé les restrictions d’ac-
cès pour toutes les ontologies avec leurs éditeurs, ainsi la plupart ne peuvent pas être télé-
chargées via le portail (mais peuvent être utilisée). Comme la plateforme d’origine, le SIFR
BioPortal permet de :
Stocker des ontologies et leurs métadonnées (pour plusieurs versions),
Rechercher dans les ontologies,
Gérer les versions de chaque ontologies et télécharger les fichiers,
Stocker et rendre des alignements entre les ontologies,
Générer des alignements automatiques simples (même identifiant ou lexicaux),
Visualiser le contenu d’une ontologie,
Laisser des commentaires sur une ontologie, une classe ou un alignement,
S’abonner au flux de notifications pour une ontologie,
Annoter des données textuelles avec des concepts (cf. section 4.2),
Obtenir une recommandation d’ontologie pour un corpus de texte ou des mots clés,
Stocker des projets qui utilisent des ontologies.
Dictionnaire médical pour les activités règlementaires en matière de MDRFRE UMLS 66378
médicaments
Medical Subject Headings, version francaise MSHFRE UMLS 27455
Classification Internationale des Soins Primaires, 2è édition (private) CISP2 CISMeF 745
plateforme que les ontologies qu’ils relient. Un point fort de notre plateforme pour l’intero-
pérabilité est qu’elle fournit des URIs pour les ontologies qui n’ont pas été développées dans
un format standard web sémantique e.g., OWL ou SKOS. Par exemple, MSHFRE et MDR-
FRE qui sont exportées de l’UMLS ne possédaient pas d’URI. Grace à leur inclusion, chaque
terme de ces ontologies francophones possède une URI par exemple :
http://purl.lirmm.fr/ontology/MDRFRE/10007635 pour Cardiomyopathies
Dans le cas des ontologies fournies par CISMeF en OWL, les URIs utilisés sont ceux crées
par le CISMeF, par exemple : http://chu-rouen.fr/cismef/MedlinePlus#T190 pour colosco-
pie. Cependant, les URIs de CISMeF ne sont pas pour le moment déréférencables, c’est-à-
dire qu’elles ne renvoient pas automatiquement vers une page web contenant de l’informa-
tion sur ce terme, tandis que les URI crées par le SIFR BioPortal le sont.
L’ensemble du contenu de la plateforme est accessible via une API de service web REST
qui retourne du JSON-LD (http://data.bioportal.lirmm.fr/documentation) ou via un
SIFR BioPortal 9
chaque couple d’ontologie les bonnes propriétés à utiliser pour faire les alignements (e.g.,
code, CUI, URI ou autre identifiant) et gérer tous les cas spécifiques car les versions fran-
çaises ne sont que rarement l’image exacte des versions anglaises. Nous avons explicitement
représenté ces mappings à l’aide des propriétés de SKOS et GOLD et les avons rendus dis-
ponibles dans notre portail : http://bioportal.lirmm.fr/mappings. Pour cela nous avons dû
modifier significativement les mécanismes de représentation et d’hébergement des map-
pings pour stocker des alignements qui n’ont qu’une partie dans le SIFR BioPortal.
Au cours de ce travail nous avons constaté quelques anomalies dans certains couples
d’ontologies que nous avons transmis aux traducteurs afin de les vérifier et éventuellement
les rectifier (par exemple, des codes dans la version française de MeSH inexistants dans la
version anglaise, ou des erreurs de choix de CUI pour MedlinePlus). Ainsi l’interconnexion
entre les deux portails est désormais assurée. Ces mappings vont aussi offrir la possibilité de
faire de l’indexations, de la recherche et de l’intégration de données multilingues.
est utilisée, mais seulement la mesure sous-jacente qui permet de donner plus d’importance
aux termes multi-mots (e.g., cancer du sein) en tenant compte dans le calcul des fréquences
des termes imbriqués (e.g., cancer).
En outre, comme ces changements ne sont pas spécifiques au SIFR Annotator, nous avons
développé un service proxy pour le NCBO Annotator (http://bioportal.lirmm.fr/ncbo_anno-
tatorplus). Ainsi, nos améliorations ne sont pas limitées au SIFR Annotator mais sont aussi
utilisables par le NCBO Annotator. Plus récemment, nous avons entamé des modifications
au niveau du stockage des métadonnées sur les ontologies dans le SIFR BioPortal de façon
à permettre le stockage de plus de métadonnées, décrites à l’aide des vocabulaires standards
tels que le DublinCore, l’Ontology Metadata Vocabulary, VOID et d’autres.
Dans les deux évaluations, les chiffres relativement bas par rapport au gold standard, en
particulier en terme de rappel, s’expliquent clairement par le fait que les indexeurs de la
NLM utilisent non seulement le titre, mais aussi le résumé et parfois le papier complet pour
identifier les annotations. Ainsi, il est parfaitement normal que des outils automatiques qui
ne traitent seulement le titre ne rivalisent pas. Le biais étant le même pour les trois outils
testés, l’objectif de ce gold standard était simplement de nous permettre de comparer les
outils entre eux. La qualité effective des annotations générées par le SIFR Annotator fera
l’objet d’une évaluation spécifique sous peu en utilisant un corpus de référence tel que par
exemple Quaero (https://quaerofrenchmed.limsi.fr).
6 Conclusion et perspectives
Dans cet article nous avons présenté une plateforme ouverte et générique pour l’hébergement
d’ontologies en langue française (ou qui contiennent des labels français) ainsi qu’un service
d’annotation. Ces produits sont encore nouveaux et nécessiteront d’être améliorés pour trou-
ver complétement leur place dans l’écosystème français d’applications sémantiques pour le
domaine de la santé. Par exemple, au sein d’un projet de pharmacogénomique (ANR Pratik-
Pharma (2016-2020)), nous allons utiliser le SIFR Annotator pour annoter des dossiers pa-
tients de l’Hôpital Européen George Pompidou avec pour objectif de comparer les connais-
sances de l’état de l’art en pharmacogénomique (en anglais) et les connaissances cliniques
(en français).2 Nous souhaitons alors réaliser de nombreuses améliorations au SIFR Anno-
tator spécifiques au traitement des données cliniques : gestion de la négation, du contexte,
de la temporalité, et de la désambiguation. Nous avons plusieurs pistes pour cela établies
suite à notre travail en traitement automatique de la langue sur l’extraction de termes [42] et
plus récemment la désambiguation [43]. En ce qui concerne le portail d’ontologies, nous
avons entreprit de compléter les métadonnées proposées par la plateforme, pour permettre à
un utilisateur de choisir une ontologie avec le maximum d’information sur celle-ci. Nous
avons entamé les démarches pour rendre le portail multilingue et bien entendu en traduire
l’interface. Ensuite, nous prévoyons de solliciter la communauté pour dans un premier temps
amorcer la plateforme en chargeant des ontologies existantes. Nous sommes optimistes sur
le fait que le SIFR BioPortal offrira à la communauté biomédicale française (e.g., cliniciens,
professionnels de santé, chercheurs) des services basés sur les ontologies performants, leur
permettant d’améliorer leur processus de production et de consommation de données. En
outre, les résultats du projet ne sont pas limités au français (mais inclus aussi l’anglais, l’es-
pagnol) et nous sommes en train de les transférer dans le domaine de l’agronomie dans le
cadre du projet AgroPortal (http://agroportal.lirmm.fr) [44]. Le code est disponible à
l’adresse suivante : https://github.com/sifrproject.
Remerciements
Ce travail est réalisé au sein du projet SIFR (www.lirmm.fr/sifr) financé en partie par le
programme JCJC de l’Agence Nationale de la Recherche (ANR-12-JS02-01001), l’Univer-
sité de Montpellier, le CNRS et l’Institut de Biologie Computationnelle de Montpellier
(ANR-11-BINF-0002). Nous remercions également le NCBO (Université de Stanford), le
groupe CISMeF (CHU de Rouen), et Suzanne Pereira (VIDAL) pour la mise à disposition
de leur ontologies et/ou technologie.
2
Pour cette tâche, étant donné les restrictions d’accès aux données, une installation locale du SIFR
Annotator sera réalisée en interne à l’HEGP. Cette situation a déjà été rencontrée par le NCBO.
SIFR BioPortal 13
Références
[1] T. B. Murdoch and A. S. Detsky, “The Inevitable Application of Big Data to Health
Care,” Journal of the American Medical Association, vol. 309, no. 13, pp. 1351–1352, 2013.
[2] A. Neveol, J. Grosjean, S. J. Darmoni, and P. Zweigenbaum, “Language Resources
for French in the Biomedical Domain,” in 9th International Conference on Language Re-
sources and Evaluation, LREC’14 (N. Calzolari, K. Choukri, T. Declerck, H. Loftsson,
B. Maegaard, J. Mariani, A. Moreno, J. Odijk, and S. Piperidis, eds.), (Reykjavik, Iceland),
pp. 2146–2151, European Language Resources Association, May 2014.
[3] D. L. Rubin, N. H. Shah, and N. F. Noy, “Biomedical ontologies: a functional per-
spective,” Briefings in Bioinformatics, vol. 9, no. 1, pp. 75–90, 2008.
[4] N. F. Noy, N. H. Shah, P. L. Whetzel, B. Dai, M. Dorf, N. B. Griffith, C. Jonquet,
D. L. Rubin, M.-A. Storey, C. G. Chute, and M. A. Musen, “BioPortal: ontologies and inte-
grated data resources at the click of a mouse,” Nucleic Acids Research, vol. 37, pp. 170–173,
May 2009.
[5] C. Jonquet, N. H. Shah, and M. A. Musen, “Un service Web pour l’annotation sé-
mantique de données biomédicales avec des ontologies,” in 13èmes Journées Francophones
d’Informatique Médicale, JFIM’09 (M. Fieschi, P. Staccini, O. Bouhaddou, and C. Lovis,
eds.), vol. 17 of Informatique et Santé, (Nice, France), April 2009.
[6] J. Grosjean, T. Merabti, N. Griffon, B. Dahamna, and S. Darmoni, “Multiterminol-
ogy cross-lingual model to create the European Health Terminology/Ontology Portal,” in
9th International Conference on Terminology and Artificial Intelligence, TIA’11, (Paris,
France), pp. 119–122, November 2011.
[7] G. Delaporte and F. Amardeilh, “ITM et intelligence économique : MONDECA,” in
Congrès Veille stratégique, scientifique et technologique, (Toulouse , France), p. 546, 2004.
[8] P. Zweigenbaum, R. Baud, A. Burgun, F. Namer, Éric Jarrousse, N. Grabar,
P. Ruch, F. L. Duff, B. Thirion, and S. J. Darmoni, “Towards a unified medical lexicon for
French,” Studies in health technology and informatics, vol. 95, pp. 415–420, 2003.
[9] S. Darmoni, E. Jarrousse, P. Zweigenbaum, P. L. Beux, F. Namer, R. Baud,
M. Joubert, H. Vallée, A. Côté, A. Buemi, D. Bourigault, G. Recource, S. Jeanneau, and J.-
M. Rodrigues, “VUMeF: extending the French involvement in the UMLS Metathesaurus,”
in American Medical Informatics Association Annual Symposium, AMIA’03, (Washington
DC, USA), p. 884, November 2003.
[10] O. Bodenreider, “The Unified Medical Language System (UMLS): integrating bio-
medical terminology,” Nucleic Acids Research, vol. 32, pp. 267–270, 2004.
[11] M. Joubert, A.-L. Peretti, J. Gouvernet, and M. Fieschi, “Refinement of an automatic
method for indexing medical literature - a preliminary study,” in 19th International Confer-
ence of the European Federation for Medical Informatics, MIE’05 (R. Engelbrecht,
A. Geissbuhler, C. Lovis, and G. Mihalas, eds.), vol. 116 of Studies in Health Technology
and Informatics, (Geneva, Switzerland), pp. 683–688, IOS Press, 2005.
[12] S. J. Darmoni, S. Pereira, S. Sakji, T. Merabti, E. Prieur, M. Joubert, and B. Thirion,
“Multiple Terminologies in a Health Portal: Automatic Indexing and Information Retrieval,”
in 12th Conference on Artificial Intelligence in Medicine, AIME’09 (C. Combi, Y. Shahar,
and A. Abu-Hanna, eds.), no. 5651 in Lecture Notes in Computer Science, (Verona, Italy),
pp. 255–259, Springer, June 2009.
[13] S. J. Darmoni, B. Thirion, J.-P. Leroy, M. Douyère, B. Lacoste, C. Godard,
I. Rigolle, M. Brisou, S. Videau, E. Goupy, J. Piot, M. Quéré, S. Ouazir, and H. Abdulrab,
14 C. Jonquet, A. Annane, K. Bouarech, V. Emonet, S. Melzi
“Doc’CISMEF: a search tool based on "encapsulated" MeSH thesaurus,” in 10th World Con-
gress on Medical Informatics (R. Rogers, R. Haux, and V. Patel, eds.), vol. 10, (London,
UK), pp. 314–318, 2001.
[14] B. Smith, M. Ashburner, C. Rosse, J. Bard, W. Bug, W. Ceusters, L. J. Goldberg,
K. Eilbeck, A. Ireland, C. J. Mungall, T. O. Consortium, N. Leontis, P. Rocca-Serra, A. Rut-
tenberg, S.-A. Sansone, R. H. Scheuermann, N. H. Shah, P. L. Whetzel, and S. Lewis, “The
OBO Foundry: coordinated evolution of ontologies to support biomedical data integration,”
Nature Biotechnology, vol. 25, pp. 1251–1255, November 2007.
[15] R. G. Côté, P. Jones, R. Apweiler, and H. Hermjakob, “The Ontology Lookup Ser-
vice, a lightweight cross-platform tool for controlled vocabulary queries,” BMC Bioinfor-
matics, vol. 7, p. 7, February 2006.
[16] C. Jonquet, A. Coulet, N. H. Shah, and M. A. Musen, “Indexation et intégration de
ressources textuelles à l’aide d’ontologies : application au domaine biomédical,” in 21èmes
Journées Francophones d’Ingénierie des Connaissances, IC’10 (S. Despres, ed.), (Nimes,
France), pp. 271–282, June 2010.
[17] J. Grosjean, L. F. Soualmia, K. Bouarech, C. Jonquet, and S. J. Darmoni, “Compar-
ing BioPortal and HeTOP: towards a unique biomedical ontology portal?,” in (2nd Interna-
tional Work-Conference on Bioinformatics and Biomedical Engineering, IWBBIO’14, (Gra-
nada, Spain), p. 11, April 2014.
[18] S. Handschuh and S. Staab, eds., Annotation for the Semantic Web, vol. 96 of Fron-
tiers in Artificial Intelligence and Applications. IOS Press, 2003.
[19] W. A. Baumgartner, K. B. Cohen, L. M. Fox, G. Acquaah-Mensah, and L. A.
Hunter, “Manual curation is not sufficient for annotation of genomic databases,” Bioinfor-
matics, vol. 23, no. 13, pp. 41–48, 2007.
[20] Q. Zou, W. W. Chu, C. Morioka, G. H. Leazer, and H. Kangarloo, “IndexFinder: A
Method of Extracting Key Concepts from Clinical Texts for Indexing,” in American Medical
Informatics Association Annual Symposium, AMIA’03, (Washington DC, USA), pp. 763–
767, November 2003.
[21] A. R. Aronson, “Effective mapping of biomedical text to the UMLS Metathesaurus:
the MetaMap program.,” in American Medical Informatics Association Annual Symposium,
AMIA’01, (Washington, DC, USA), pp. 17–21, November 2001.
[22] L. H. Reeve and H. Han, “CONANN: An Online Biomedical Concept Annotator,”
in 4th International Workshop Data Integration in the Life Sciences, DILS’07 (S. Cohen-
Boulakia and V. Tannen, eds.), vol. 4544 of Lecture Notes in Computer Science, (Philadel-
phia, PA, USA), pp. 264–279, Springer-Verlag, June 2007.
[23] W. R. Hersh and R. A. Greenes, “SAPHIRE - an information retrieval system fea-
turing concept matching, automatic indexing, probabilistic retrieval, and hierarchical rela-
tionships,” Computers and Biomedical Research, vol. 23, pp. 410–425, October 1990.
[24] M. Dai, N. H. Shah, W. Xuan, M. A. Musen, S. J. Watson, B. D. Athey, and
F. Meng, “An Efficient Solution for Mapping Free Text to Ontology Terms,” in American
Medical Informatics Association Symposium on Translational BioInformatics, AMIA-
TBI’08, (San Francisco, CA, USA), March 2008.
[25] D. Hancock, N. Morrison, G. Velarde, and D. Field, “Terminizer – Assisting Mark-
Up of Text Using Ontological Terms,” in 3rd International Biocuration Conference, (Berlin,
Germany), April 2009.
[26] D. Song, C. G. Chute, and C. Taoa, “Semantator: Annotating Clinical Narratives
with Semantic Web Ontologies,” in AMIA Joint Summits on Translational Science, (San
SIFR BioPortal 15
Adresse de correspondance
Clement Jonquet – LIRMM, 161 Rue Ada, 34090 Montpellier, France – [email protected]