Lecture automatique de documents LAD

Lecture Automatique de Documents (LAD)

Les outils de LAD sont utilisés depuis de nombreuses années pour capturer et accélérer le traitement des courriers entrants. Ils permettre de “lire” un courrier c’est à dire d’en extraire des informations métier.

Comparez les périmètres fonctionnels entre notre solution ALADiN et les LAD historiques.

Les LAD sont des outils indépendants et complémentaires aux GED. Si vous avez un volume important de courriers, d’emails ou autres documents office à gérer dans votre GED, ce sont les LAD comme ALADiN qui vous apporterons le gain de productivité le plus important. Attention donc au périmètre fonctionnel de votre projet. D’ailleurs les visiteurs de ce site en ont souvent fait l’expérience : ALADiN permet donc de sécuriser facilement un projet de GED en cours sans ajouter de complexité.

Reconnaissance Automatique de Documents (RAD)

Les outils de RAD permettent eux de les reconnaitre donc de les identifier ce qui est un préalable à la LAD : pas de lecture si on ne connait pas le type de document puisque la configuration est associée au modèle de document (Les LAD fonctionnent essentiellement par zones géométriques sur une image).

Cette Reconnaissance Automatique de Documents est réalisée le plus souvent en identifiant un code barre ou en analysant la mise en page (détection des zones remarquables, présence d’image, de case à cocher, etc) et en la comparant à des modèles prédéfinis (par exemple les cerfas)

Les avantages LAD RAD

Premier avantage que ces outils historiques procurent c’est la capacité à extraire une zone très précise de texte, le montant d’un chèque par exemple, à condition que la numérisation soit donc parfaitement alignée au risque de lire une zone contenant une autre information ; et d’utiliser ces données pour alimenter un moteur de workflow et un processus métier dédié.

Second avantage : la gestion de cases à cocher permettant de connaitre un choix client, une option sélectionnée ou non.

Pour cela les outils fonctionnement en utilisant des OCR ou ICR permettant de reconnaitre des documents manuscrits, ce qui est complexe avec un taux de fiabilité moyen obligeant une relecture humaine appelée vidéo codage.

Les limites LAD RAD

Le principe étant d’extraire du texte dans des zones prédéfinies, tout est affaire de précision :

Dans la modélisation et le paramétrage
Dans la numérisation

Les inconvénients LAD RAD

Ce n’est pas pour rien que ce sont les premiers outils inventés : ils nécessitent un paramétrage important voir du développement pour définir zones et mots-clefs à rechercher.

Le principal inconvénient : la mise en œuvre. C’est à la MOA client de définir les mots clefs, et bien souvent les nombreuses collisions rendent la configuration impossible.

Par exemple :

“santé” pour une mutuelle : sera présent systématiquement
“accident” pour une assurance : sera présent systématiquement
“retraite” pour un fond de pension : sera présent systématiquement

C’est d’ailleurs pour cela que dès 2010 nous avons dû trouver une autre solution pour aider un client à indexer 400 000 courriers entrants par an dans 160 catégories.

Alors que d’autres consultants présents nous ont livrés une spécification avec toujours les mêmes mots pour distinguer 160 catégories de classement, notre solution statistique de classement automatique basé sur le contenu a trouvé seule et en à peine quelques minutes comment classer tous les documents avec un taux d’erreurs inférieur à ce que les utilisateurs faisaient manuellement.

La spécification contenait moins de mots-clefs que le nombre de catégories, cela ne pouvait donc pas fonctionner. Et encore nous ne parlons pas des fautes d’orthographes possibles (bien sûr on peut souhaiter ne jamais en faire ni que nos clients n’en fassent jamais mais que se passera-t-il si c’est le cas ? Accepterez-vous un coût de traitement supérieur ?)

Le second inconvénient à nos yeux : à l’heure de la Relation Client multicanal, faire le choix d’une technologie incapable de travailler sur des emails et autres documents Office semble manquer de vision stratégique à moyen terme.

Enfin citons quelques autres inconvénients :

Les outils de configuration propriétaires nécessitent une formation des utilisateurs et une précision dans la mise en oeuvre.
Aucune adaptation si de nouveaux documents se présentent
La numérisation doit être parfaitement précise, la moindre rotation ou décalage provoquant l’extraction d’une donnée n’ayant rien à voir avec celle attendue…attention dans la compta…

Voir également LAD RAD et email.

Dématérialisation par LAD ou par un outil d’intelligence artificielle avec apprentissage

Si vous avez un faible nombre de catégories de classement des courriers et des outils permettant d’utiliser le texte extrait d’une zone précise dans un moteur de Workflow : la LAD est une solution intéressante.

Si au contraire vous avez un gros volume de courrier, mais également d’emails ou de fax et autres documents bureautique à classer dans une GED ou un CRM alors une solution comme ALADiN, qui tri les documents par leur contenu semble une alternative bien plus moderne et efficace.

En cas de doute

Vous serez bienvenu en nous contactant et vous proposerons une simulation basée sur vos propres documents et catégories : notre simulateur pourra alors indiquer très précisément le taux de fiabilité que vous pouvez attendre de notre solution de capture et de classement automatique.

Vous pouvez aussi comparer les fonctionnalités.