Système de reconnaissance des articles de tables de matières en vue de l'enrichissement du serveur de tables de matières de Calliope (système de biliothèque électronique). L'image montre en haut les couvertures de revues dont il faut reconnaître les sommaires, et en bas à droite, le résultat en HTML, de la reconnaissance d'une Table des Matières. Le but de ce projet est de définir un système de lecture automatique des tables de matières (TDM) de revues scientifiques directement à partir des images numérisées de leurs pages. Le système doit d'abord localiser la zone de la TDM et identifier pour chaque article, ses différents composants, comme le «titre», les «noms-d'auteurs» et le «numéro-de-page». Le texte est reconnu, dans une phase préalable, par OCR.
|