Topic on Wikidata:Bistro/Archives des discussions structurées

Base Léonore des Archives nationales

40
Xavier Cailleau WMFr (talkcontribs)

Bonjour,

les Archives nationales ont mis à jour la base Léonore qui comporte toutes les personnes nommées ou promues dans l'Ordre de la Légion d'honneur depuis 1802 : https://www.leonore.archives-nationales.culture.gouv.fr/ui/

Cette base comporte pour le moment 400 000 dossiers.

L'ancienne application faisait le lien avec Wikidata, il y a un identifiant base Léonore dans Wikidata : https://www.wikidata.org/wiki/Q2886420

Malheureusement les renvois se font vers la page d'accueil de Léonore et non vers les notices elles-mêmes.

L'idée serait de corriger ces redirections, savez-vous s'il y a un moyen de le faire de manière groupée ?

Par ailleurs, la syntaxe des cotes a légèrement évolué avec l'ajout d'un double slash comme vous pouvez le voir ici : https://www.leonore.archives-nationales.culture.gouv.fr/ui/notice/358795

Idem savez-vous s'il est possible de modifier massivement ces syntaxes de cotes ?

Cette base serait peut-être l'occasion d'enrichir Wikidata avec certaines fiches de légionnaires. Les Archives nationales organiseraient avec plaisir un datathon autour de ce projet, qu'en pensez-vous ?

Très bonne journée,

Xavier

Hsarrazin (talkcontribs)

je serais enchantée de participer à un Datathon organisé par les AN, mais il faudrait d'abord que le site soit capable de gérer un lien utilisant la cote pour créer un lien vers une notice, et non un numéro de notice arbitraire, et dont rien ne garantit la pérennité...

si une redirection doit être créée, c'est au sein de la base Leonore, et non du côté de wikidata, me semble-t-il...


d'autant qu'on trouve des ID Leonore non seulement en ''déclaration'', mais également, massivement, dans les ''références'', puisque très souvent, le dossier Leonore a été utilisé pour étayer les dates de vie, occupation, lieux de vie, etc...

Envlh (talkcontribs)
Ayack (talkcontribs)

Concernant le sujet de cotes (le reste ayant déjà été abordé dans les discussions citées par @Envlh) il s'agit selon moi d'un problème de reprise de données qui doit être géré par le nouveau site. Jusqu'à preuve du contraire, les cotes sur Wikidata sont les bonnes, ce sont celles du site qui sont erronées. @Hsarrazin : on est bien d'accord ?

Hsarrazin (talkcontribs)

absolument...

les cotes sont bien celles des dossier "papier" aux AN (ou ailleurs). D'ailleurs, la graphie des cotes Leonore telle qu'indiquée sur wikidata est toujours valable...

la preuve, si on la cherche entre guillemets dans le champ de recherche simple, on tombe bien sur la bonne notice :)


[ajout après-coup] ce ne sont pas les "cotes" à proprement parler qui ont changé, juste leur graphie...

aux AD, nous avons le même pb pour des questions de champs de saisie (série, sous-série, sous-sous-série, article, discriminant... )

Ayack (talkcontribs)

@Xavier Cailleau WMFr Petite question supplémentaire : vous avez (à WMFr) un contact avec les Archives nationales ? Avant de vouloir organiser un datathon lié à la base Léonore, il faudrait leur dire qu'ils auraient pu tenir compte des nombreuses remontées leur indiquant que leur nouveau site n'était pas abouti. J'attends toujours une réponse à mon mail d'il y a trois mois signalant tous les problèmes évoqués ci-dessus...

Hsarrazin (talkcontribs)

Je suis dans le même cas... j'ai signalé le problème dès le 1er mars (depuis mon adresse professionnelle aux Archives départementales), sans plus de réponse...

Xavier Cailleau WMFr (talkcontribs)

Bonjour,

merci de vos retours !

Concernant les cotes, seul change le slash qui devient un double slash. Il représente la norme à présent. Ce changement est du notamment aux absences de sous-catégories. (désolé pour les approximations, je ne suis pas fin technicien :) )

La recherche par cote semble possible mais dans le mode avancé, il faut bien mentionner la syntaxe avec le double slash.

Concernant les redirections, le renvoi automatique ne semble pas possible de leur côté. Le permalien fait référence au numéro de notice alors qu'il faisait avant référence à la cote .

Nous avons discuté de la possibilité d'utiliser OPen refine ou un bot pour régler en masse au moins l'un de ces problèmes ?

Qu'en pensez-vous ?


@Ayack et @Hsarrazin, je vous propose de relayer vos requêtes et remarques directement auprès de mes contacts aux Archives nationales. Pouvez-vous me les envoyer par mail ?

Très bonne soirée

Hsarrazin (talkcontribs)

ne faudrait il pas intégrer @Archives nationales DJI dans la réflexion sur ce problème ?

je ne connais pas cette personne, mais sa position professionnelle pourrait nous aider à faire entendre certaines difficultés, non ?

Daieuxetdailleurs (talkcontribs)

Bonjour.

Merci pour la notification Archives nationales DJI (mais je réponds avec mon compte perso).

Ces éléments ont été remontés dès février/mars en interne à plusieurs reprises. La nouvelle URL est censée être une URI (néanmoins l'identifiant unique est nouveau, et ne reprend pas le numéro de notice qui existait sur l'ancienne version , repris sur la nouvelle version).

Concernant le double // : il corrige la version ancienne erronée pour les cotes LH et correspond désormais strictement à la cote du dossier de Légion d'honneur, telle qu'elle figure dans le SI des Archives nationales et telle qu'il faut l'écrire si jamais on voulait consulter sur place le document. La correction est donc souhaitable pour tout ce qui est LH (exemple : LH//432). @Archives nationales (France) pourra le confirmer.

Par contre, pour les dossiers avec une cote strictement numérique (exemple 19800035/200/26132), la cote réelle du carton (existante dans le SI) ne contient pas le dernier nombre (cote réelle : 19800035/200) ; la dernière chaîne de chiffres après le 2e slash est le numéro de dossier, qui existe et est compréhensible dans la base Léonore uniquement. A contratio, la base Leonore ne comprend pas la cote du carton 19800035/200...


Plus largement (en dehors de la sphère wiki), la redirection d'url non fonctionnelle actuellement pose problème pour une base aussi utilisée sur le web ; cela devrait pouvoir être résolu techniquement côté AN/prestataire.

En attendant personnellement je mets sur pause mes enrichissements LH lors d'alignements de données AN sur Wikidata...

Hsarrazin (talkcontribs)

Μerci beaucoup pour ces informations, qui aident au moins à comprendre la raison des difficultés rencontrées récemment...

je viens de découvrir que je te suis depuis longtemps sur Twitter...  ;)


je suis très intéressée par le lien fourni vers l'ancienne base (Mistral) avec archive.org... - je ne m'étais même pas posé la question, du fait qu'il s'agit d'une base de données, et non d'un site...

cette méthode pourrait-elle être utilisée (par le biais de P1630), sur wikidata, pour continuer à permettre l'accès vers l'ancienne base, en attendant que la nouvelle permette le lien par le biais de la cote ?

j'ai fait un essai ici, non concluant, mais je ne suis pas la spécialiste de P1630)

Xavier Cailleau WMFr (talkcontribs)

Je ne pense pas, il ne s'agit pas des personnes directement en charge des questions liées aux données. Le plus efficace reste à mon avis le process que je vous ai proposé.

Ayack (talkcontribs)

Bonjour,

Plusieurs choses de mon point de vue :

  1. identifiant Léonore(P640) a été créé pour stocker les cotes de la base Léonore, il ne doit et ne peut donc pas stocker un permalien ou quelque autre valeur.
  2. On peut en revanche s'interroger sur l'opportunité de modifier les cotes pour adopter le double slash s'il s'agit d'un changement officiel. Pour cela une communication officielle et publique des AN serait souhaitable. Le changement pourrait ensuite être effectué par un bot.
  3. Étant donné que la recherche par cote est mise en place sur la base, je ne vois de blocage technique à la faire passer dans l'URL sauf incompétence ou manque de volonté ou de budget. Si vraiment cela ne devait pas se faire (et qui serait une énorme régression et une absurdité en terme de facilité d'usage de la base), je vois plusieurs possibilités pour lien un élément WD à une fiche Léonore :
    1. Mettre le permalien dans la référence de la cote avec URL de la référence(P854) : le plus simple, pas de propriété à créer
    2. Créer un nouvel identifiant pour le permalien et le mettre en qualificatif de la cote : le plus propre pour moi, la cote reste bien l'information principale, mais on fourni un lien vers la fiche Léonore
    3. Créer un nouvel identifiant pour le permalien et le mettre en déclaration à part : le moins propre selon moi, la cote risque de ne plus être renseignée, et à la prochaine version du site on se retrouvera qu'avec des liens morts.
  4. Qu'elle que soit la solution retenue, un mapping cote-permalien serait nécessaire pour automatiser le travail. Les AN pourraient-elles nous le fournir ?
Hsarrazin (talkcontribs)

je soutiens pleinement... mais depuis hier, j'ai constaté l'ajout d'un bandeau de recherche par patronyme ou lieu de naissance qui a l'immense inconvénient de masquer la fenêtre de recherche... (et je n'ai pas trouvé comment masquer/fermer ce bandeau de recherche) est-ce propre à ma configuration, ou peux-tu confirmer ?

Recherche - Base de données Léonore (culture.gouv.fr)

Ayack (talkcontribs)

Je vois en effet toujours la fenêtre de recherche quand je clique sur ces deux onglets ce qui n'est pas très cohérent.

Hsarrazin (talkcontribs)
Xavier Cailleau WMFr (talkcontribs)

@Ayack je transmets tes préconisations et ton point de vue pour un retour de leurs services.


@Hsarrazin, j'ai également la fenêtre de recherche accessible en cliquant sur les 2 onglets. Et ce sur Firefox et Chrome.

Hsarrazin (talkcontribs)

je viens, tout à fait par hasard, de comprendre le pourquoi de ce problème : il s'agit d'un problème de zoom...

en raison de mes yeux fatigués, je travaille habituellement en zoom 125% : à ce zoom, la barre fournissant ces deux onglets recouvre la fenêtre de recherche ; en dézoomant, je récupère l'accès à la barre de recherche... mais j'ai du mal à lire les petits caractères (comme ceux des mini-notices affichées en résultat)

je pense qu'il serait bien de signaler le problème, ne serait-ce que pour adapter le site aux personnes qui, comme moi, ont besoin de zoomer pour pouvoir lire leur écran :)

Gamp Protesilaus (talkcontribs)

Bonjour @Hsarrazin,

Merci pour ce point d'attention.

Dans une très prochaine release de l'application, des questions d'accessibilité et de responsiveness du site seront abordées.

Je vous tiendrai au courant sur ce forum de la date de la mise en service.


Bien cordialement,

Gaëtano

Hsarrazin (talkcontribs)

tout à fait d'accord avec 1, 2 et 3 et 4 !!!

pour les solutions, perso, j'applique déjà la 1e (mettre le permalien en URL de la référence), sachant qu'une référence peut parfaitement être reprise dans les infoboxes...

la solution 2 nécessitera un travail d'alignement, et la justification d'un 2e id pour Leonore....

la 3 me semble aussi à éviter...

Evynrhud (talkcontribs)
Daieuxetdailleurs (talkcontribs)

En effet, seules les cotes LH// portent un double // (cela correspond à la réalité des cotes dans le SI des Archives nationales). Les cotes uniquement en chiffre sont correctement écrites dans Wikidata par rapport à la base Léonore (mais pas par rapport au SI des AN, voir plus haut).

Hsarrazin (talkcontribs)
Hsarrazin (talkcontribs)

Un des gros inconvénients de la situation actuelle, est que l'outil User:Bargioni/UseAsRef.js n'autorise plus l'utilisation de Leonore comme source d'un simple clic...

du coup, moi qui l'utilisait énormément pour sourcer... je vais changer de source :(

c'est un mauvais coup porté à Leonore en tant que source d'infos fiable pour la biographie des personnes...

Xavier Cailleau WMFr (talkcontribs)

Je fais remonter tout cela merci !

Epìdosis (talkcontribs)

Bonjour (and excuse me for writing in English)! I come here from Property talk:P640#Change in the format of cotes on official Léonore database website. I see that the old formatter URL and old IDs of Léonore ID (P640) are working no more, which (among other problems) is bad for User:Bargioni/UseAsRef.js, as @Hsarrazin: noted. I haven't seen yet a proposal of a new property, should I make one or are we still waiting for more feedback regarding the new arrangement of the database? Thank you very much!

Hsarrazin (talkcontribs)

we're waiting the reaction of the official service that manages the site :(

knowing (first hand) how website design and administrative developing is managed in French administration, it could be long... : nothing before the end of vacation period (september) and probably later...

Hsarrazin (talkcontribs)

un contributeur étranger et peu habitué de Wikidata (134 contribs au moment où je regarde) a pris l'initiative de modifier l'expression régulière de contrainte pour imposer 2 // après LH, sans en parler à personne, et sans se poser de question visiblement...

ceci incite, bien entendu, des contributeurs qui ignorent la discussion en cours, à modifier les cotes déjà saisies...

je viens de m'en apercevoir par le message de non conformité au format affiché sur la page Auteur de s:fr:Auteur:Jean-Baptiste_Prosper_Jollois et quelques autres...

La question que je me pose est donc : vaut-il mieux ?

  1. faire évoluer les cotes vers // (et dans ce cas, traiter les 21145 éléments où P640 est utilisé, y compris dans les références), sans savoir si cette modification permettra de créer un lien dans l'avenir
    • dans cette hypothèse, il faudrait faire passer un bot vu le nombre d'occurrences à modifier (sur certains éléments, Léonore source plus de 20 déclarations)
    • et bien sûr il faudra alors modifier tous les modèles utilisant cette propriété, sur tous les projets... (je pense que frwikisource n'est pas le seul projet à utiliser le modèle Autorités) -> voir Module:Authority control (Q11640331)
  2. en attendant que l'on puisse savoir quoi faire avec les AN, maintenir le statu quo (donc l'ancienne forme des cotes) - et donc annuler cette modification de la contrainte, qui pousse des contributeurs de bonne foi à modifier les cotes précédemment saisies

Personnellement, en attendant de savoir où on en est de la réflexion avec les AN, je serais pour attendre...

@Tpt qui s'occupe de la maintenance du modèle sur wikisource @Gamp Protesilaus qui a fait la modification de contrainte en cause... @VIGNERON qui connaît un peu ce type de problème...

Tpt (talkcontribs)

La solution 2 me semble la plus simple, les identifiants étant cassés de toute façon. Si c'est utile je peux faire passer mon bot mettre à jour les cotes sans soucis (mais si je peux l'éviter, c'est d'autant mieux).

Hsarrazin (talkcontribs)

Salut et merci @Tpt

En attendant une décision collective, et une solution pour lier les notices, serait-il possible de modifier le modèle de wikisource soit pour qu'il n'affiche plus le lien, soit pour qu'il n'affiche plus une erreur de format ? Merci à toi :)

Tpt (talkcontribs)

C'est fait ! Le lien ne s'affiche plus.

Hsarrazin (talkcontribs)

Merci ! vivement qu'on trouve une solution pour remettre ces liens en place ! c'est une grosse perte d'informations…

Eru (talkcontribs)

Une troisième solution serait d'autoriser avec et sans en mettant LH//?\d{1,4}/\d{1,3}|19800035/\d{1,4}/\d{1,5}(Bis|Ter)?|C/0/\d{1,2}.

Mais cela ne résoudra pas le problème pour les pages déjà modifier provoquant une erreur, je suis donc plutôt pour la solution 2.

Gamp Protesilaus (talkcontribs)

Bonjour à tous

je travaille aux Archives nationales de France au sein du département du Système d'information. Dans ce contexte, je m'occupe entre autres de l'application web pour la diffusion des données Léonore. Je vous réponds avec mon compte personnel et m'excuse pour le retard.

Xavier m'a transféré certaines remarques (en italique ci-dessous) et donné le lien vers ce forum dont je ne connaissais pas l'existence avant et je peux maintenant répondre à vos questions.

L'identifiant Léonore (P640) a été créé pour stocker les cotes de la base Léonore, il ne doit et ne peut donc pas stocker un permalien ou quelque autre valeur.

Ce n’était pas l’intention des AN : nous souhaitons juste modifier les cotes de la série LH renseignées dans les pages Wikidata et rajouter la nouvelle URL de la ressource (P973 : l’élément décrit à l’URL suivante ou P854, comme cela vous semble plus pertinent) dans la référence de la cote. Il serait bien de modifier en parallèle la contrainte sur l’objet de cette propriété Léonore (P640), c’est-à-dire rajouter le double slash dans la RegeX

On peut en revanche s'interroger sur l'opportunité de modifier les cotes pour adopter le double slash s'il s'agit d'un changement officiel.

En effet, la syntaxe des cotes en LH (cela ne concerne pas les cotes continues comme 19800035/xxx) telle que renseignée dans l’ancienne application n’était pas correcte, d’où la décision des AN d’apporter cette modification. Les AN n'avaient plus la possibilité de modifier les données de l'ancienne application d’où le fait que cette correction n'avait pas pu être apportée auparavant.

Pour cela une communication officielle et publique des AN serait souhaitable.

Cette modification des cotes du cadre de classement est définitive. Si la direction des fonds des AN le juge nécessaire, l’information sera rajoutée dans la nouvelle application (fenêtre pop-in information)


Le changement pourrait ensuite être effectué par un bot.

   Étant donné que la recherche par cote est mise en place sur la base, je ne vois pas de blocage technique à la faire passer dans l'URL. Si vraiment cela ne devait pas se faire, je vois plusieurs possibilités pour lier un élément Wikidata à une fiche Léonore :

       1. Mettre le permalien dans la référence de la cote avec URL de la référence(P854) : le plus simple, pas de propriété à créer

      2. Créer un nouvel identifiant pour le permalien et le mettre en qualificatif de la cote.

Comme mieux cela vous semble. La proposition n°1 me semble convenir ;

       3. Créer un nouvel identifiant pour le permalien et le mettre en déclaration à part : le moins propre selon moi, la cote risque de ne plus être renseignée, et à la prochaine version du site on se retrouvera qu'avec des liens morts.

Qu'elle que soit la solution retenue, un mapping cote-permalien serait nécessaire pour automatiser le travail. Les AN pourraient-elles nous le fournir ?

La proposition n°1 me semble la plus pertinente

Ce mapping est référencé dans les csv transmis à Xavier. Je peux le poster ici si nécessaire.


Pour ma part, j’ai fait les alignements vers Wikidata sur OpenRefine. J’ai préparé le schéma et exporté sans problème les quickStatements. La prévisualisation des triplets Wikidata fonctionne bien sur openrefine et j’ai juste des problèmes mineurs signalés tel que le manque de référence pour les dates de mort par exemple).

Sur les 400.000 dossiers de la base Léonore, environ 15.000 ont été alignés automatiquement (j’ai aussi à peu près 10.000 d’autres candidats qu’il faudrait apparier manuellement. Cette tâche, à mon sens, pourrait faire l’objet d’un travail participatif en utilisant l’outil mix&match). C’est sur les environ 15.000 légionnaires appariés automatiquement que je propose de mettre à jour les fiches wikidata. Si vous le jugez pertinent, je vous enverrai le schéma .json et les quickstatemnts en .txt pour m'aider à le faire. Je ne suis pas un utilisateur expert de wikidata.


@Hsarrazin c'est moi qui a pris l'initiative de modifier l'expression régulière de contrainte pour imposer 2 // après LH pour inciter les contributeurs à utiliser la nouvelle syntaxe.

Quant à remarques critiques sur la nouvelle application, il s’agit d'une version beta qui a été mis en service en urgence car l'ancienne application avait cessé de fonctionner correctement et nous il n'était pas possible de la rétablir au vu de sa technologie obsolescente.

Des nouvelles versions plus abouties seront mises en service prochainement et nous organiseront des ateliers avec les utilisateurs où nous serions ravis de vous compter parmi les participants.


Je vous laisse mon adresse mail car je ne suis pas très fréquemment sur ce forum.

Gaetano PIRAINO

Chef de projet MOA en charge du SI et des innovations numériques

DSI

Archives nationales de France

[email protected]

Hsarrazin (talkcontribs)

Merci beaucoup pour ces informations qui permettent de mieux comprendre ce qui s'est passé au printemps...

Gamp Protesilaus (talkcontribs)

Merci à vous @Hsarrazin pour vos remarques.


N’hésitez pas à revenir vers moi par mail pour toute nouvelle remarque et pour envisager ce que nous pouvons faire ensemble.

Belle journée à vous,

GP

Ayack (talkcontribs)

Bonjour @Xavier Cailleau WMFr, le problème étant toujours présent 7 mois plus tard, je relisais ce message pour voir ce qui pouvait être fait pour avancer, et je vois qu'apparemment @Gamp Protesilaus t'a transmis des fichiers .csv de mapping. Serait-il possible de les partager ?

Je voudrais :

  1. Faire une demande de bot pour remplacer tous les simples slash par des doubles (après le LH uniquement bien sûr)
  2. Ajouter l'url de la notice en référence via reference URL (P854) à partir des fichiers de mapping en question

Merci par avance.

Xavier Cailleau WMFr (talkcontribs)

Bonsoir @Ayack, j'ai remis la main sur les fichiers, quel est le meilleur moyen pour les partager ici ?

Ayack (talkcontribs)
Envlh (talkcontribs)
Reply to "Base Léonore des Archives nationales"