Reconnaissance optique de musique

La reconnaissance optique de musique (ou ROM), et en anglais Optical Music Recognition (ou OMR) est l'application de techniques de reconnaissance optique de caractères (OCR) aux partitions musicales imprimées, afin de les transformer en fichiers informatiques éditables ou jouables. Une fois capturée sous une forme interne, la musique peut être enregistrée dans les formats de fichiers couramment utilisés, comme MusicXML pour la partition et MIDI pour la lecture.

Exemples de difficultés rencontrées pour la reconnaissance optique de partition, ici un extrait du Nocturne Op. 15 de Frédéric Chopin.

Histoire modifier

Les premiers travaux de recherche universitaire sur la reconnaissance des partitions imprimées datent de la fin des années 1960, au MIT et dans d'autres institutions[1]. Par la suite les efforts se sont concentrés sur la localisation et la suppression des lignes de portée, facilitant la reconnaissance et l'analyse des symboles musicaux. Le premier produit de reconnaissance optique de musique à être commercialisé est MIDISCAN (maintenant SmartScore), édité en 1991 par la société Musitek.

Principe de fonctionnement modifier

Contrairement à la reconnaissance optique de caractères où les mots sont analysés séquentiellement, la notation musicale comprend des éléments simultanés, comme des voix multiples, et des symboles pouvant indiquer des marques d'expression, non liés aux notes et positionnés à proximité. Par conséquent, la relation spatiale entre les notes, les marques d'expression, les nuances, les articulations et autres notations musicales est une partie importante de l'expression musicale.

Logiciels modifier

Logiciels propriétaires modifier

Logiciels libres modifier

Logiciels assimilés ROM modifier

PDFtoMUSIC, édité par Myriad, est souvent considéré comme un logiciel de ROM, mais il ne réalise en fait aucune reconnaissance optique de symboles musicaux. Le programme lit simplement les fichiers PDF qui ont été créés par un programme d'édition de partition, et identifie les glyphes musicaux qui ont été saisis directement en tant que caractères d'une police de notation musicale. La reconnaissance optique consiste en fait à déduire ces symboles musicaux à partir de la position des glyphes sur la page du document PDF, et à les assembler dans la partition résultante. Seule la version PRO peut exporter vers un fichier MusicXML, alors que la version standard ne produit qu'un fichier éditable par l'éditeur de partitions de Myriad[10].

Voir aussi modifier

  • Music information retrieval (MIR) couvre le problème plus large d'acquisition d'informations musicales issues de différents supports, comme les partitions musicales ou l'audio.
  • La reconnaissance optique de caractères (OCR) est la reconnaissance du texte qui peut être appliqué à la numérisation de documents, de manière analogue à l'OMR. Cependant, un système OMR complet doit représenter fidèlement le texte qui est présent dans les partitions musicales, donc l'OMR est de fait un sur-ensemble de l'OCR[11].

Références modifier

  1. (en) Pruslin, Dennis Howard, « Automatic Recognition of Sheet Music », Perspectives of New Music, vol. 11, no 1,‎ , p. 250–254 (lire en ligne, consulté le )
  2. Info capella-scan
  3. SharpEye MusicReader
  4. SCAN 2.1
  5. « OMeR »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le )
  6. PhotoScore Ultimate 8
  7. SharpEye
  8. SmartScore
  9. Audiveris - page Github
  10. « PDFtoMusic Pro »(Archive.orgWikiwixArchive.isGoogleQue faire ?), myriad-online.com, (consulté le )
  11. David Bainbridge et Tim Bell, « The challenge of optical music recognition », Computers and the Humanities, vol. 35.2,‎ , p. 95-121 (lire en ligne, consulté le )

Liens externes modifier