- Vue d'ensemble (Overview)
- Document Processing Contracts
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Processus Document Understanding : modèle Studio
- Activités Document Understanding
- À propos du package Document Understanding Digitizer
- Compatibilité du Projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- À propos du package d'activités IntelligentOCR
- Compatibilité du Projet
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du Projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du Projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Extraire les données du document
UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>
Extrait les données d'un fichier d'entrée ou d'un objet Données du document (Document Data) et stocke les résultats dans un objet Données du document (soit celui reçu pour la section Entrée, soit un objet nouvellement créé pour le fichier d'entrée).
L'activité Extraire les données du document (Extract Document Data) nécessite une activité qui la précède, qui peut fournir un objet Données du document (Document Data) (produit en tant que sortie par d'autres activités Document Understanding, par exemple Classer un document (Classify Document).
- Données du document (Document Data) : à partir de l'activité Classer un document (Classify Document)
- Fichier (File) : à partir des activités Obtenir un fichier/dossier (Get File/Folder) ou Obtenir l'e-mail le plus récent (Get Newest Email)
Les langues prises en charge pour les modèles génératifs sont les mêmes que le moteur OCR utilisé utilisé. Pour plus d'informations, consultez la page Langues prises en charge par l'OCR .
Compatibilité du projet : multiplateforme
Propriétés
- Projet (Project) : vous devez sélectionner votre projet Document Understanding dans le menu déroulant. Les options disponibles sont les suivantes :
- Prédéfini (Predefined) : le projet par défaut
- Vous pouvez créer un projet personnalisé en accédant à Document Understanding.
- Extracteur (Extractor) : vous devez choisir l'extracteur du projet sélectionné. Pour le projet prédéfini, les options disponibles sont :
- L'un des paquets ML trouvés iciRemarque : l’activité Extraire les données du document (Extract Document Data) remplace le type de document par l’extracteur sélectionné. Ceci ne s'applique pas aux modèles génératifs.
- Génératif
- L'un des paquets ML trouvés ici
- Invite (Prompt) : ce champ s'affiche si vous choisissez l'option Génératif (Generative). Invite pour identifier les champs à extraire, fournie sous forme de paires clé-valeur, où la clé représente le nom du champ et la valeur une description de celui-ci, permettant à l'extracteur d'identifier la valeur correspondante. Cliquez sur le champ pour obtenir une invite avec les options suivantes, fournies par paires :
- Nom du champ (Field name) : vous devez saisir le nom du champ à extraire (ex. Date d'échéance) (limite de 30 caractères)
- Invite générative (Generative prompt) : vous devez fournir l'invite en tant qu'entrée pour l'Extracteur génératif. (limite de 500 caractères)
Astuce : pour connaître les bonnes pratiques d'utilisation des invites génératives, consultez la page Extracteur génératif - Bonnes pratiques . - Entrée (Input) : vous devez spécifier le fichier lui-même, ou les Données du document (Document Data), au cas où vous auriez déjà utilisé d'autres activités Document Understanding dans votre workflow (par exemple, Classer un document (Classify Document)).
Entrée
- Délai d'attente (secondes) (aperçu) : délai d'exécution maximal (en secondes) pour l'appel vers le modèle génératif. Si l'opération dépasse ce délai, elle est automatiquement arrêtée pour éviter les retards ou les blocages. Cette propriété s'affiche uniquement si l' extracteur génératif est sélectionné en tant qu'extracteur.
Sortie
- Données du document : toutes les données de champ extraites du fichier. Les informations peuvent également être reçues de Classer le document (Classify Document).
Dans le cas de champs à valeurs multiples, toutes les valeurs sont renvoyées dans les Données du document (Document Data). Les valeurs sont disponibles dans
DocumentData.Data.FieldName.MultiValues[]
. Si la valeur MultiValue estnull
, cela signifie que le champ respectif n'est pas un champ à valeurs multiples. Si la propriété MultiValues est un tableau (même si elle est vide[]
), cela signifie que le champ correspondant est un champ à valeurs multiples.