- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Activités Document Understanding
With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.
Limites connues
Nous sommes conscients des limitations actuelles du package DocumentUnderstanding.Activities, que nous prévoyons de résoudre bientôt. Les fonctionnalités suivantes ne sont pas encore disponibles :
- Prise en charge du fractionnement des documents.
- Règles métier.
- Modèles d’entraînement.
- Prise en charge des modèles des locataires autres que ceux où l’automatisation est déployée.
- Prise en charge d’Automation Suite.
1. Traiter les documents
Le traitement des documents fait référence à la préparation des fichiers PDF en vue de l’extraction. Grâce aux activités Document Understanding, vous pouvez :
- Extraire du texte, des images et des pages spécifiques, ou fusionner plusieurs PDF.
- Modifier le mot de passe des documents PDF chiffrés
Pour traiter des fichiers PDF avec des activités Document Understanding, utilisez les activités suivantes :
| Activité | Description |
|---|---|
| Définir le mot de passe du PDF | Modifie le mot de passe d'un fichier PDF spécifié. |
| Merge PDFs | Relie une collection d'objets fichier. |
| Get PDF Page Count | Fournit le nombre total de pages dans un fichier PDF. |
| Extraire le texte PDF (Extract PDF Text) | Extrait le texte d'un document PDF. |
| Extract PDF Images | L'activité extrait toutes les images qu'elle trouve dans le fichier PDF. |
| Extract PDF Page Range | Extrait une plage spécifiée de pages d'un document PDF. |
2. Extraire des données
Use the Extract Document Data activity to:
- Extraire les données d’un fichier d’entrée enregistré en tant qu’objet Données du document.
- Stockez les résultats de l’extraction dans le même objet Données du document.
Document Data is a resource that serves both as an input and output variable, within your Document Understanding workflows. The Document Data object holds all the necessary information about a single document. If you classify a document, the object includes the Document Type. If you extract data, the object contains the corresponding extracted fields. Irrespective of the activity, Document Data consistently contains the document's text and DOM (Document Object Model).
Provide the file as input only the first time you use Extract Document Data. The output, known as Document Data, should be reused throughout the workflow to prevent re-digitizing the same file, which costs 1 AI Unit per page.
Visit Document Data for more details.
3. Classer les données
Use the Classify Document activity to:
- Choisir entre différents modèles de classification.
- Exporter les données classifiées dans un objet Données du document.
4. Valider les données
L’étape de validation du processus du document fait référence à l’envoi des documents traités pour qu’ils soient validés par les membres de votre équipe dans Action Center. Vous pouvez également configurer le processus de validation des documents dans Action Center à l’aide des activités suivantes :
| Activité | Description |
|---|---|
| Create Validation Task | Crée une action de validation pour suspendre le workflow jusqu’à ce qu’elle soit terminée. |
| Attendre la tâche de validation et reprendre | Suspend l’action jusqu’à la fin de la validation, puis la reprend automatiquement. |
| Create Validation Task and Wait | Crée une action dans Action Center pour visualiser et modifier les résultats de l’extraction, et suspend le workflow jusqu’à la fin de l’action. |
| Créer une tâche de validation de classification (Create Classification Validation Task) | Crée une action pour vérifier les données du document classées sans attendre qu’elle se termine. |
| Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait) | Crée une action pour vérifier les données classées et attend qu’elle soit terminée avant de reprendre le workflow. |
| Attendre la tâche de validation de la classification et reprendre | Attend la fin d’une action de validation de la classification avant de reprendre le workflow. |