- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Cases à cocher et signatures
Les champs à choix multiples qui utilisent des cases à cocher peuvent être de différents types. Il y a d’abord les types mutuellement exclusifs, puis il y a les types non mutuellement exclusifs, pour lesquels plusieurs options peuvent être sélectionnées. Un autre aspect important est le nombre de choix disponibles pour un champ à choix multiples donné. Dans certains cas, il peut y avoir une seule option, où la case est cochée ou non, tandis que dans d’autres cas, il peut y avoir 10 options, 20 options ou plus, disposées dans une grille ou un tableau, comme sur de nombreux formulaires de santé.
Il existe quatre manières principales de labelliser ces types de champs à choix multiples.
Prenons un exemple pour comprendre comment labelliser les options. Les formulaires peuvent inclure les options Projet (Project) ou Politique (Policy). Dans ce cas, vous n’avez qu’un seul champ et vous ne labellisez que le mot sélectionné, c’est-à-dire le mot Projet (Project) si la case à côté est cochée ou le mot Politique (Policy) si la case à côté est cochée. Si aucune n’est cochée, vous ne labellisez ni l’un ni l’autre, les deux ne seront pas cochés, et ces documents seront simplement supprimés de l’ensemble d’apprentissage.
Cette approche présente l’avantage de n’avoir qu’un seul champ, ce qui nécessite moins de données. Il présente également l’avantage de ne pas reposer sur une détection réussie des cases à cocher. Si une case à cocher est détectée comme une lettre X, le modèle peut toujours apprendre à reconnaître que cela signifie que l’option à côté est sélectionnée.
L’inconvénient est que vous devez vous assurer que les deux options sont représentées à peu près également, ce qui n’est pas toujours le cas. Potentiellement, dans votre ensemble d’entraînement, 90 % des documents peuvent avoir la case Projet (Project) cochée. Dans ce cas, le modèle ne peut pas fonctionner correctement et cette approche échoue. Le problème s’aggrave lorsque vous avez plus d’options, car certaines d’entre elles sont presque toujours rares. Dans ces cas, vous devrez peut-être créer de faux documents avec les rares options cochées pour équilibrer les choses.
Dans l’exemple ci-dessus, vous pouvez avoir un champ appelé Projet (Project) dans lequel vous cochez toujours la case Projet (Project) et un champ appelé Politique (Policy) dans lequel vous cochez toujours la case Politique (Policy), qu’ils soient cochés ou non. Cela présente l’avantage que l’équilibre compte beaucoup moins, même si l’une des options est cochée 90 % du temps, le modèle apprend toujours à la reconnaître car les cases à cocher sont toujours au même endroit.
L’inconvénient est que vous avez deux champs au lieu d’un. Lorsqu’il y a deux options, cela peut ne pas être un gros problème, mais lorsqu’il y a 10 ou 20 options, avoir 10 ou 20 champs au lieu d’un seul rend beaucoup plus difficile la labellisation, et le modèle est plus difficile à entraîner, nécessitant plus d’entraînement de données.
Un autre inconvénient est que parfois la case à cocher peut ne pas être détectée correctement et vous devrez peut-être ajouter une logique plus complexe dans le workflow pour gérer tous les caractères X, V ou K renvoyés. Dans certains cas, l’OCR peut même fusionner la case à cocher avec le mot à côté, comme Projet X (XProject), nécessitant une logique RPA encore plus complexe pour gérer cette situation.
Les champs à plusieurs valeurs font partie de la version 2022.10 de Document Understanding. Cela facilite l’étiquetage, il n’est pas affecté par la vérification des choix déséquilibrés et il n’est pas affecté s’il y a un grand nombre d’options. Cependant, cela dépend toujours de la précision de la détection des cases à cocher ou du risque que les cases à cocher soient fusionnées avec les options qui leur sont associées. Il est très difficile de se défendre contre les erreurs OCR.
Cela facilite également la labellisation, est moins sensible aux erreurs de détection de case à cocher, mais peut être plus sensible aux options déséquilibrées, tout comme la première option.
D’après notre expérience, toutes ces options peuvent être appropriées dans certaines situations. Nous avons initialement préféré la première option, mais comme la précision de la détection des cases à cocher dans UiPath Document OCR s’est améliorée, nous nous sommes davantage tournés vers les options deux et trois. Les options deux et trois présentent également un autre avantage majeur : elles sont compatibles entre Forms AI et nos paquets ML basés sur AI Center. Vous pouvez donc commencer avec Forms AI, puis si vous trouvez que la précision est inférieure à ce que vous attendiez, vous pouvez simplement déplacer l’ensemble de données vers une session Document Manager et entraîner un modèle ML directement sans aucune autre modification. Cette option est devenue particulièrement intéressante car nos paquets ML sont devenus plus puissants et nécessitent moins de données d’entraînement.
À partir de la version 2022.4 de LTS Enterprise, les signatures peuvent être détectées à l’aide de l’OCR de document UiPath. Par conséquent, les modèles d’apprentissage automatique peuvent détecter directement les signatures.
Labelliser une signature comme tout autre champ dans votre document. Une fois détecté par l’OCR de document UiPath, le modèle d’apprentissage automatique apprend à reconnaître le champ comme une signature.