document-understanding
latest
false
- Vue d'ensemble (Overview)
- Démarrage
- Activités
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Détails du modèle
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Données et sécurité
- Logique d’attribution de licences et de charge
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Document Understanding classic user guide
Dernière mise à jour 23 avr. 2026
Activités IntelligentOCR
With Intelligent OCR activities you can process documents in a comprehensive manner, allowing you to not only digitize, extract, classify, and validate documents, but also train your extractor and classifiers on your specific data, so they can be faster and more accurate. The steps involved in creating Document UnderstandingTM processes using Intelligent OCR activities are:
- Create the Taxonomy: Define document types and convert them into a Document Object Model variable using the Load Taxonomy activity.
- Digitize documents: Prepare documents so robots can process them using an OCR engine, by storing their text inside a String variable, and basic information about them inside a Document Object Model file.
- Classify documents: Prepare documents using certain classifiers, so robots can identify what types of files they're processing.
- Validate the classification of documents: Verify and validate that the documents have been correctly classified.
- Train your classifiers: Configure your classifiers based on input received while validating the classification
- Extract data from documents: Identify and extract specific information from your documents using various extractors to send it for validation.
- Validate the extractions documents: Verify and validate the documents you processed, classified, and extracted, using the input of your team members within Action Center.
- Train your extractors: Configure your extractors based on input received while validating the extraction.
- Consume exported data: Once you validate the extracted data, you can use it as it is or export it as a DataSet variable using the Export Extraction Results activity.
Avant de commencer
Avant de commencer à utiliser IntelligentOCR.Activities, vérifiez les caractéristiques suivantes :
- Configurabilité élevée, impliquant également une courbe d’apprentissage élevée.
- Présence de plusieurs objets et activités, afin de répondre à une exigence de flexibilité.
- Réutilisabilité réduite en raison des complexités suivantes :
- Vous devez paramétrer de nombreuses configurations à l’intérieur du workflow.
- Vous devez transmettre des arguments explicites d’une activité à une autre de façon répétée, par exemple :
- Taxonomie
- Document Object Model
- Texte
- Résultats de la classification
- Résultats de l'extraction