Base de données bibliographiques

Les bases de données bibliographiques répertorient toute catégorie d'objets bibliographiques livres, collections, revues, articles de revues grâce à leurs métadonnées telles que leur titre, auteur, résumé, descripteur sujet. Elles sont le fruit de l'informatisation des catalogues de bibliothèque, et permettent des recherches à l'aide de mots-clefs ainsi que l'analyse des données (bibliométrieetc.). WorldCat est l'exemple d'une telle base de données.

Historique et terminologie modifier

Les bases bibliographiques ou plus précisément les bases de références bibliographiques se créent à partir des années 1960[1].

Dans les années 1960-1970, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives « à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs »[2],[3]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).

Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :

Caractéristiques modifier

Structure des données modifier

Le terme base de données utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.

La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.

Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.

Indexation et référentiels modifier

De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus documentaire ou ontologie.

Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme les titres de périodique ou les affiliations.

Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.

Thématique et couverture modifier

Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codification des gènes).

Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées.

Exemples modifier

  • Chemical Abstracts — Articles scientifiques en chimie — Origine américaine, Chemical Abstracts Service (CAS).
  • Francis — Articles scientifiques en sciences humaines et sociales — Origine française (CNRS, INIST) — résumés en français — indexation bilingue (français, anglais) (la base Francis n'est plus mise à jour).
  • Google Scholar — Origine société Google, États-Unis.
  • Index Theologicus — Théologie et Sciences des Religions — Origine allemande (Bibliothèque de l'Université de Tübingen).
  • Medline — Science de la vie et médecine — Origine administration américaine (National Library of Medecine).
  • Pascal — Science Technique et Médecine — Origine française (CNRS, INIST) — indexation bilingue (français, anglais) (la base Pascal n'est plus mise à jour).
  • WorldCat — catalogue collectif OPAC (monographies et périodiques) — Origine OCLC (États-Unis) — parfois citée comme la plus grande base bibliographique mondiale.
  • Open Library — Catalogue collectif du projet Internet Archive.
  • Urbamet — base de données bibliographiques — origine association Urbamet, France — la principale base de données française sur l'urbanisme, l'aménagement du territoire, les villes, l'habitat et le logement, l'architecture, les équipements collectifs, les transports, les collectivités locales, etc. qui rassemble et diffuse la mémoire de l’aménagement, de l’urbanisme et de l’habitat.
  • SantéPsy — base de données bibliographiques — origine Ascodocpsy — principale base de données française sur la psychiatrie et la santé mentale.

Notes et références modifier

  1. Carbone Pierre, Les bibliothèques, Paris, Presses Universitaires de France coll. « Que sais-je ? », 2012, 128 pages (ISBN 9782130594550).
  2. Définition donnée dans l'arrêté du , Journal Officiel, , p. 624. Consultable sur France Terme, la base des termes recommandés au Journal officiel de la République française - http://www.culture.fr/franceterme (consulté le ).
  3. Voir aussi la définition donnée dans le Vocabulaire de la documentation, ADBS, 2004 - http://www.adbs.fr/banque-de-donnees-16252.htm (consulté le ).
  4. Histoire des bases de données juridiques en France (1) - les origines, Infostratèges, 2005.
  5. Des formes éditoriales composites : Les revues Françaises de chimie, Sylvie Dalbin, Revue de Synthèse, , Volume 135, nos 2-3, p. 221-238. DOI 10.1007/s11873-014-0254-y (consulté le ).

Articles connexes modifier