La Reprise du fond documentaire

La mise en place d’un système de GED inclut presque toujours une partie de reprise du fond documentaire existant. StarXpert a développé des outils pour faciliter cette tache, en se basant sur les besoins de nos clients.

La reprise des données

La reprise des données, c’est :

  • injection des documents, éventuellement précédé de numérisation de documents papier.
  • reprise ou création des méta-données
  • mise en place de l’organisation des documents (arborescence des espaces de stockage)

La reprise des données peut consister à reprendre des documents présents sur un serveur de fichiers, et intégrer des méta-données fournies dans un fichier au format CSV ou XML. L’arborescence peut être reprise du serveur de fichiers ou fournie dans le fichier CSV ou XML. Les outils développés par StarXpert ont permis d’effectuer ces opérations pour un coût client faible, et de répondre à une problématique fréquente qui est de retrouver dans Alfresco les informations d’origine sur les dates de création, de modification, le créateur du document.

Autres cas possibles

Dans d’autres cas, l’obtention des documents et / ou des méta-données nécessite d’interroger le système d’informations du client, et d’effectuer des transformations de nomenclature en appliquant des règles métier. StarXpert met alors en place une chaine de traitement plus complexe, avec stockage intermédiaire dans une base de données.

Ce système offre plusieurs avantages :

  • contrôler la qualité des données pendant l’intégration dans ce stockage intermédiaire
  • effectuer des vérification des données par requêtes SQL dans la base intermédiaire
  • effectuer les transformations dans cette même base
  • lancer l’injection dans Alfresco une fois les précédentes étapes validées. Cela permet de diminuer le nombre d’itérations du traitement, et donc la charge et le délai.

Complexité du projet

Dans tous les cas, la complexité vient en grande partie de la qualité des données existantes, qui peut être la cause de rejets d’intégration de documents, ou d’intégration incorrecte ou incomplète. Les conséquences en sont les contrôles qui doivent être effectués, les corrections à apporter sur les données elles-mêmes, et le nombre d’itérations à effectuer. La volumétrie est également un facteur de complexité, d’une part à cause des temps de traitement, d’autre part car cela accroit les risques de données incorrectes, et augmente le temps d’analyse des rejets.

Pour en savoir plus

alfresco_platinum