Formats de données disponibles

Conformément à la politique d’ouverture des données portée par l’Abes depuis 2012, les métadonnées produites par les réseaux de signalement gérés par l’Abes sont sous Licence Ouverte / Open Licence  de l’État élaborée par la mission Etalab. La récupération et la réutilisation des données est libre et gratuite sous réserve de l’indication de leur date de récupération et de la mention de leur source.  Les « conditions d’utilisation » sont détaillées pour chaque set de données.

Accéder au Sudoc

Fourniture de données Sudoc aux formats MARC


Formats d’export

Important : afin de suivre les évolutions des formats MARC, des modifications des formats d’export sont régulièrement implémentées :

  • Le format UNIMARC d’export est mis à jour en fonction de l’évolution du format international. Pour suivre les mises à jour des formats d’export, les fournisseurs et les administrateurs de Système de Gestion de Bibliothèques (SGB) sont invités à se référer au document de suivi (voir ci-dessous et sur cette page).
  • Le format MARC21 d’export est basé sur la version 1999 de l’USMARC. Seules quelques évolutions ont été ou peuvent être, ponctuellement, prises en compte. Les données Sudoc en MARC21 sont donc fournies dans une structuration qui peut ne pas être à jour des dernières nouveautés internationales.

Les notices bibliographiques Sudoc sont fournies dans un format d’échange conforme à la norme ISO 2709 (ICS no 34.240.30), norme internationale qui définit le format d’échange informatique de notices bibliographiques :

Le format UNIMARC constitue la référence pour l’échange de données à l’échelle nationale et internationale. En savoir plus

Échantillon de notices Sudoc

Les établissements et les fournisseurs de Systèmes de Gestion de Bibliothèques ont à leur disposition un échantillon de données Sudoc pour leur permettre de tester l’interopérabilité des systèmes avec le Sudoc et ainsi garantir la fluidité des échanges de données. En savoir plus

Conditions d’utilisation

Pour se conformer aux exigences de citation de la source des données :

  • UNIMARC : conserver le contenu des zones 801$b et 801$c
  • MARC 21 :  conserver le contenu de la zone 040$a

Exemples de réutilisation

  • bibliothèques membres des réseaux Sudoc / Sudoc-PS : alimentation des systèmes locaux (SGB, outils de découverte…)
  • structures documentaires hors réseaux Abes : enrichissement des systèmes locaux (SGB, outils de découverte…)
Lire la suite

Exposition de données Sudoc en MARC XML


Les notices bibliographiques Sudoc sont disponibles au format UNIMARC/MARCXML

à noter : les données fournies en XML étant converties « à la volée » à partir de la base d’export en UNIMARC, leur actualisation est garantie

Modalités de récupération

    • à l’unité : à partir de l’identifiant de notice Sudoc (n°PPN)
    • syntaxe de la requête : https://www.sudoc.fr/[inscrire ici le n°ppn sans les crochets].xml

Conditions d’utilisation

Pour se conformer aux exigences de citation de la source des données, il convient de conserver au minimum les 801$b et 801$c, exemple :

  <datafield tag="801" ind1=" " ind2="3">
  <subfield code="a">FR</<span">subfield>
  <subfield code="b">Abes</subfield>
  <subfield code="c">20210217</subfield>
  <subfield code="g">AFNOR</subfield>

Certaines zones / sous-zones UNIMARC ne peuvent être converties en XML. Il s’agit principalement :

  • de zones en provenance de sources de données externes dont les fournisseurs n’autorisent pas l’exposition, comme par exemple les zones 100 et 101 ( dates de publication / langue) d’une notice de publication en série identifiée dans le Registre de l’ISSN qui font l’objet d’une validation par le CIEPS
  • de certaines zones non exposées du fait de la complexité de leur modélisation ou de la différence de granularité avec UNIMARC

Exemples de réutilisation

  • récupération de données Sudoc à l’unité dans un format plus facilement manipulable que l’ISO 2709
  • réutilisation de données Sudoc en tant que réservoir bibliographique
  • agrégation de notices de formats distincts en utilisant XML comme format pivot, ce qui permet par exemple l’agrégation des données produites au sein des différents réseaux de catalogage (données du Sudoc, de Calames ou de theses.fr)

en savoir plus : Activer le web service UNIMARC/MARCXML

Lire la suite

Exposition de données Sudoc en RDF


En cohérence avec la politique de l’Abes en termes d’exposition des données Sudoc sur le Web de données,  les notices bibliographiques Sudoc peuvent être récupérées au format RDF. Les données fournies en RDF étant converties « à la volée » à partir de la base d’export en UNIMARC, leur actualisation est garantie au quotidien

Modalités de récupération

  • à l’unité : à partir de l’identifiant de notice Sudoc (n° PPN)
    • syntaxe de la requête : https://www.sudoc.fr/[inscrire ici le n°ppn sans les crochets].rdf

Conditions d’utilisation

Pour se conformer aux exigences de mention de la source des données, il convient de mentionner les éléments suivants dans l’entête du fichier  :

  • dcterms:creator rdf:resource= »http://www.idref.fr/033702462/id »/ : identifie l’Abes (n°PPN de la notice d’autorité « Abes »)
  • dcterms:created : date de création de la notice Sudoc
  • dcterms:modified : date de modification de la notice Sudoc

Limitations

Certaines zones / sous-zones UNIMARC ne peuvent être converties en RDF. Il s’agit principalement :

  • certaines zones en provenance de sources de données externes dont les fournisseurs n’autorisent pas l’exposition, comme par exemple les zones 100 et 101 ( dates de publication / langue) d’une publication en série identifiée dans le Registre de l’ISSN qui font l’objet d’une validation par le CIEPS
  • certaines zones non exposées du fait de la complexité de leur modélisation ou de la différence de granularité avec UNIMARC.

en savoir plus : consulter la documentation Correspondances UNIMARC – RDF

Exemples de réutilisation

  • récupération de données Sudoc à l’unité dans un format plus facilement manipulable que l’ISO 2709
  • réutilisation de données Sudoc en tant que réservoir bibliographique
  • agrégation de notices de formats distincts en utilisant RDF comme format pivot, ce qui permet par exemple l’agrégation des données produites au sein des différents réseaux de catalogage (données du Sudoc, de Calames ou de theses.fr)
Lire la suite

Exposition des notices RCR en MARC


Les notices RCR – Répertoire du Centre de Ressources décrivent les établissements documentaires membres des réseaux Sudoc et Sudoc-PS.  Elles sont structurées dans un format spécifique de type MARC, dont les champs sont décrits précisément. Consulter la documentation

Ces données sont enrichies d’informations de géolocalisation, ce qui optimise leur réutilisation lors de la conception d’applications ou de services innovants pour valoriser les collections des bibliothèques.

Disponibles à partir du Répertoire des Centres de Ressources Sudoc et du Répertoire des Bibliothèques du Catalogue Collectif de France – CCFrles notices RCR,  en tant que notices d’autorité, sont librement récupérables à partir des services IdRef, notamment via le triple store data.idref.fr.

Modalités de récupération

À partir de l’interface d’IdRef, il est possible de récupérer les données RCR au format XML :

  • à l’unité  : à partir de l’identifiant d’une notice Sudoc (n° PPN).
  • par lot  : à l’aide du webservice iln2rcr en indiquant l’identifiant de l’établissement de rattachement (ILN) des différentes bibliothèques (RCR). Ce webservice peut porter sur plusieurs ILN.

à savoir :  les données RCR accessibles à partir d’IdRef sont également exposées partiellement au format RDF.

Exemples de réutilisation

  • constitution d’annuaires de bibliothèques
  • exploitation des données de géolocalisation associées aux notices RCR
Lire la suite

L’écosystème des données Sudoc