- Vue d'ensemble (Overview)
- À propos des activités Document Understanding
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
À propos des activités Document Understanding
Les activités Document Understanding vous permettent de traiter, de classer et d’extraire des documents dans le but d’automatiser leur interprétation.
Les activités de Document Understanding sont un élément clé du traitement des documents. Il rend possible le traitement complet des documents en permettant au système d’interpréter le sens d’un document et d’en extraire des informations. Vous pouvez utiliser des méthodes de classification de documents et d'extraction de données pour extraire et interpréter les informations de plusieurs documents avec des structures différentes.
À un haut niveau, les documents passent par les cinq étapes fondamentales suivantes :
- Définition des types de documents et des données à extraire ;
- Fourniture du texte et de son emplacement ;
- Classification des documents à partir de la liste spécifiée ;
- Extraction des informations ;
- Confirmation des données extraites par un humain.
Ensuite, les données extraites peuvent être exportées et utilisées comme vous le souhaitez.
Les activités Document Understanding incluent les packages suivants :
- Contrats de traitement de documents (Document Processing Contracts) : contient des structures de données et des interfaces à utiliser dans le cadre de l’intégration avec l’infrastructure Document Understanding.
- Numériseur de Document Understanding (Document Understanding Digitizer) : une bibliothèque qui contient des fonctions liées à la numérisation.
- Paquet ML Document Understanding : contient des activités qui intègrent des modèles d’apprentissage automatique pour les workflows Document Understanding.
- Serveur local Document Understanding OCR (Document Understanding OCR Local Server) : ne contient aucune activité, mais une fois installé dans un projet, il permet d’utiliser UiPath Document OCR exécuté localement sur la machine robot.
- Processus Document Understanding : un modèle qui fournit la journalisation, la gestion des exceptions, les mécanismes de nouvelle tentative et toutes les méthodes qui doivent être utilisées dans un workflow Document Understanding prêt à l’emploi.
- Document Understanding : permet de traiter des documents.
- IntelligentOCR : contient l’infrastructure permettant d’activer les workflows de traitement de documents.
- Services ML (ML Services) : permet de récupérer et d’appeler toutes les compétences ML disponibles sur votre locataire, ainsi que de télécharger des fichiers ou de créer des tâches de labellisation.
- OCR : contient les activités UiPath Screen OCR et UiPath Document OCR qui utilisent les moteurs OCR internes de UiPath.
- Contrats OCR (OCR Contracts) : contient les contrats nécessaires au développement de nouveaux moteurs OCR.
- OmniPage : contient l’activité OmniPage OCR qui extrait les données d’un élément ou d’une image d’IU (interface utilisateur) indiqué(e) à l’aide du moteur OmniPage OCR.
- PDF : contient des activités conçues pour extraire des données à partir de fichiers PDF et XPS.
Consultez la section Limites basées sur l’activité ou l’API pour vérifier les spécifications et les paramètres actuels, afin d'optimiser les projets modernes et les activités de Document Understanding.
Windows - Projets Studio hérités | Projets Windows (Modern) Studio | Projets Studio multiplateformes | |
---|---|---|---|
Document Understanding ML | |||
Serveur local OCR Document Understanding | |||
Activités Document Understanding | |||
IntelligentOCR | |||
Services ML | |||
OCR | |||
Contrats OCR | |||
OmniPage | |||