- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Regex Based Extractor
L'extracteur basé sur RegEx est l'outil parfait pour les cas d'utilisation simples, dans lesquels, pour certains champs, les données sont toujours récupérées dans un format et un contexte stricts et prévisibles. En d'autres termes, si vous disposez d'un champ pour lequel vous pouvez définir une expression régulière qui s'avère toujours exacte lorsqu'elle est mise en correspondance, c'est que vous avez bien fait de choisir l'extracteur basé sur Regex.
L'activité est livrée avec un assistant de configuration qui vous aide à définir les expressions régulières des champs que vous souhaitez cibler aux fins de l'extraction de données en suivant cette méthode.
L'activité prend en charge à la fois l'extraction de champs simples et l'extraction de champ de table.
Il est recommandé d'opter pour d'autres méthodes d'extraction en cas de forte variabilité de contexte et de format des valeurs attendues. Le cas échéant, il est préférable d'utiliser un extracteur de formulaire ou un extracteur d'apprentissage automatique.
Cet extracteur n'a pas de capacités d'apprentissage et nécessite une configuration initiale.
L'utilisation de l'extracteur basé sur Regex ne présente pas d'exigences particulières.
L'extracteur basé sur Regex doit tenir compte de deux configurations principales :
- L'assistant Configurer les expressions régulières (Configure Regular Expressions), qui vous permet de définir des expressions régulières pour certains champs. Cet assistant met également à disposition l'assistant Regex Editor, qui vous aide à créer vos expressions régulières.
- le paramètre UtiliserAlignementVisuel, qui vous permet de contrôler si les expressions régulières configurées pour un extracteur doivent être appliquées à la sortie texte du composant de numérisation ou à une version texte dans laquelle les lignes de texte sont organisées visuellement et les mots réorganisés sur des lignes en fonction de leur alignement visuel.
En savoir plus sur l'Assistant de configuration d'expressions régulières (Configure Regular Expression Wizard), en suivant ce lien.