Formats de données disponibles
Conformément à la politique d’ouverture des données portée par l’Abes depuis 2012, les métadonnées produites par les réseaux de signalement gérés par l’Abes sont sous Licence Ouverte / Open Licence de l’État élaborée par la mission Etalab. La récupération et la réutilisation des données est libre et gratuite sous réserve de l’indication de leur date de récupération et de la mention de leur source. Les « conditions d’utilisation » sont détaillées pour chaque set de données.
Fourniture de données Sudoc aux formats MARC
Formats d’export
Important : afin de suivre les évolutions des formats MARC, des modifications des formats d’export sont régulièrement implémentées :
- Le format UNIMARC d’export est mis à jour en fonction de l’évolution du format international. Pour suivre les mises à jour des formats d’export, les fournisseurs et les administrateurs de Système de Gestion de Bibliothèques (SGB) sont invités à se référer au document de suivi (voir ci-dessous et sur cette page).
- Le format MARC21 d’export est basé sur la version 1999 de l’USMARC. Seules quelques évolutions ont été ou peuvent être, ponctuellement, prises en compte. Les données Sudoc en MARC21 sont donc fournies dans une structuration qui peut ne pas être à jour des dernières nouveautés internationales.
Les notices bibliographiques Sudoc sont fournies dans un format d’échange conforme à la norme ISO 2709 (ICS no 34.240.30), norme internationale qui définit le format d’échange informatique de notices bibliographiques :
- UNIMARC : jeux de caractères ISO 646 / ISO 5426 (caractères latins) / ISO 10646 codé UTF-8 (encodage Unicode)
- MARC 21 : jeux de caractères ASCII (basic latin) et ANSEL (extended latin) ou ISO 10646 codé UTF-8 (encodage Unicode)
Le format UNIMARC constitue la référence pour l’échange de données à l’échelle nationale et internationale. En savoir plus
- données bibliographiques (UNIMARC/B) : Format d’export de données bibliographiques (mise à jour : janvier 2023)
- également disponible sous forme de Tableau Excel
- données d’autorité (UNIMARC/A) : Format d’export des données d’autorité (mise à jour : janvier 2020)
- données d’exemplaire (UNIMARC) : Recommandations pour l’échange de données d’exemplaire
Échantillon de notices Sudoc
Les établissements et les fournisseurs de Systèmes de Gestion de Bibliothèques ont à leur disposition un échantillon de données Sudoc pour leur permettre de tester l’interopérabilité des systèmes avec le Sudoc et ainsi garantir la fluidité des échanges de données. En savoir plus
- télécharger : échantillon de notices Sudoc (données : mai 2022)
Conditions d’utilisation
Pour se conformer aux exigences de citation de la source des données :
- UNIMARC : conserver le contenu des zones 801$b et 801$c
- MARC 21 : conserver le contenu de la zone 040$a
Exemples de réutilisation
- bibliothèques membres des réseaux Sudoc / Sudoc-PS : alimentation des systèmes locaux (SGB, outils de découverte…)
- structures documentaires hors réseaux Abes : enrichissement des systèmes locaux (SGB, outils de découverte…)
Exposition de données Sudoc en MARC XML
Les notices bibliographiques Sudoc sont disponibles au format UNIMARC/MARCXML.
à noter : les données fournies en XML étant converties « à la volée » à partir de la base d’export en UNIMARC, leur actualisation est garantie
Modalités de récupération
-
- à l’unité : à partir de l’identifiant de notice Sudoc (n°PPN)
- syntaxe de la requête : https://www.sudoc.fr/[inscrire ici le n°ppn sans les crochets].xml
Conditions d’utilisation
Pour se conformer aux exigences de citation de la source des données, il convient de conserver au minimum les 801$b et 801$c, exemple :
<datafield tag="801" ind1=" " ind2="3"> <subfield code="a">FR</<span">subfield> <subfield code="b">Abes</subfield> <subfield code="c">20210217</subfield> <subfield code="g">AFNOR</subfield>
Certaines zones / sous-zones UNIMARC ne peuvent être converties en XML. Il s’agit principalement :
- de zones en provenance de sources de données externes dont les fournisseurs n’autorisent pas l’exposition, comme par exemple les zones 100 et 101 ( dates de publication / langue) d’une notice de publication en série identifiée dans le Registre de l’ISSN qui font l’objet d’une validation par le CIEPS
- de certaines zones non exposées du fait de la complexité de leur modélisation ou de la différence de granularité avec UNIMARC
Exemples de réutilisation
- récupération de données Sudoc à l’unité dans un format plus facilement manipulable que l’ISO 2709
- réutilisation de données Sudoc en tant que réservoir bibliographique
- agrégation de notices de formats distincts en utilisant XML comme format pivot, ce qui permet par exemple l’agrégation des données produites au sein des différents réseaux de catalogage (données du Sudoc, de Calames ou de theses.fr)
en savoir plus : Activer le web service UNIMARC/MARCXML
Exposition de données Sudoc en RDF
En cohérence avec la politique de l’Abes en termes d’exposition des données Sudoc sur le Web de données, les notices bibliographiques Sudoc peuvent être récupérées au format RDF. Les données fournies en RDF étant converties « à la volée » à partir de la base d’export en UNIMARC, leur actualisation est garantie au quotidien
Modalités de récupération
- à l’unité : à partir de l’identifiant de notice Sudoc (n° PPN)
- syntaxe de la requête : https://www.sudoc.fr/[inscrire ici le n°ppn sans les crochets].rdf
Conditions d’utilisation
Pour se conformer aux exigences de mention de la source des données, il convient de mentionner les éléments suivants dans l’entête du fichier :
- dcterms:creator rdf:resource= »http://www.idref.fr/033702462/id »/ : identifie l’Abes (n°PPN de la notice d’autorité « Abes »)
- dcterms:created : date de création de la notice Sudoc
- dcterms:modified : date de modification de la notice Sudoc
Limitations
Certaines zones / sous-zones UNIMARC ne peuvent être converties en RDF. Il s’agit principalement :
- certaines zones en provenance de sources de données externes dont les fournisseurs n’autorisent pas l’exposition, comme par exemple les zones 100 et 101 ( dates de publication / langue) d’une publication en série identifiée dans le Registre de l’ISSN qui font l’objet d’une validation par le CIEPS
- certaines zones non exposées du fait de la complexité de leur modélisation ou de la différence de granularité avec UNIMARC.
en savoir plus : consulter la documentation Correspondances UNIMARC – RDF
Exemples de réutilisation
- récupération de données Sudoc à l’unité dans un format plus facilement manipulable que l’ISO 2709
- réutilisation de données Sudoc en tant que réservoir bibliographique
- agrégation de notices de formats distincts en utilisant RDF comme format pivot, ce qui permet par exemple l’agrégation des données produites au sein des différents réseaux de catalogage (données du Sudoc, de Calames ou de theses.fr)
Exposition des notices RCR en MARC
Les notices RCR – Répertoire du Centre de Ressources décrivent les établissements documentaires membres des réseaux Sudoc et Sudoc-PS. Elles sont structurées dans un format spécifique de type MARC, dont les champs sont décrits précisément. Consulter la documentation
Ces données sont enrichies d’informations de géolocalisation, ce qui optimise leur réutilisation lors de la conception d’applications ou de services innovants pour valoriser les collections des bibliothèques.
Disponibles à partir du Répertoire des Centres de Ressources Sudoc et du Répertoire des Bibliothèques du Catalogue Collectif de France – CCFr, les notices RCR, en tant que notices d’autorité, sont librement récupérables à partir des services IdRef, notamment via le triple store data.idref.fr.
Modalités de récupération
À partir de l’interface d’IdRef, il est possible de récupérer les données RCR au format XML :
- à l’unité : à partir de l’identifiant d’une notice Sudoc (n° PPN).
- par lot : à l’aide du webservice iln2rcr en indiquant l’identifiant de l’établissement de rattachement (ILN) des différentes bibliothèques (RCR). Ce webservice peut porter sur plusieurs ILN.
à savoir : les données RCR accessibles à partir d’IdRef sont également exposées partiellement au format RDF.
Exemples de réutilisation
- constitution d’annuaires de bibliothèques
- exploitation des données de géolocalisation associées aux notices RCR
L’écosystème des données Sudoc
Consulter la présentation : Que sont nos données devenues ? Les données au-delà du système d’information de l’Abes (Journées Abes 2022)