- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- À propos des paquets ML
- Configuration OCR
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
À propos des paquets ML
L'utilisation d'un paquet ML Document Understanding implique les étapes suivantes :
- Recueillir les échantillons de documents et les exigences des points de données qui doivent être extraits.
- Labelliser les documents à l'aide de Document Manager. Document Manager se connecte lui-même à un service OCR.
- Le téléchargement ou l'export de documents labellisés en tant qu'ensemble de données d'entraînement et le téléversement de ce dossier exporté sur un stockage AI Center.
- Le téléchargement ou l'export de documents labellisés en tant qu'ensemble de données d'évaluation et le téléversement de ce dossier exporté sur un stockage AI Center.
- L'exécution d'un Pipeline d'entraînement (Training Pipeline) sur AI Center.
- L'évaluation des performances du modèle avec un Pipeline d'évaluation (Evaluation Pipeline) sur AI Center.
- Le déploiement du modèle entraîné en tant que compétence ML sur AI Center.
- La requête envers la compétence ML à partir d'un workflow RPA à l'aide du package d'activités UiPath.DocumentUnderstanding.ML.
Remarque : n'oubliez pas que l'utilisation de paquets ML Document Understanding nécessite que la machine sur laquelle AI Center est installé puisse accéder à
https://du-metering.uipath.com
.Attention : lors de la création d'un package UiPath.DocumentUnderstanding.ML.Activities dans AI Center, le nom du package ne doit pas être un mot clé python réservé, tel queclass
,break
,from
,finally
,global
,None
, etc. Notez que cette liste n'est pas exhaustive puisque le nom du package est utilisé pourclass <pkg-name>
etimport <pkg-name>
.
Il s'agit de modèles d'apprentissage automatique prêts à l'emploi pour classer et extraire tous les points de données courants à partir de documents semi-structurés ou non structurés, y compris les champs réguliers, les colonnes de table et les champs de classification dans une approche sans modèle.
Les packages d’apprentissage automatique prêts à l’emploi fournis par UiPath ont la version 0 et sont déjà disponibles sur votre locataire, ce qui signifie qu’il n’est pas nécessaire de les télécharger.
Le téléchargement est disponible uniquement pour les versions 1 ou supérieures, que vous avez déjà entraînées.
Document Understanding contient plusieurs paquets ML divisés en cinq catégories principales :
- UiPath Document OCR
- Document Understanding
- Classifieur de documents
- Out-of-the-box Pre-trained ML Packages
- Paquets DU ML pré-entraîné prêts à l’emploi dans AI Center
- Autres paquets ML prêts à l’emploi
Il s'agit d'un modèle non réentraînable qui peut être utilisé avec l'activité moteur d'OCR de document UiPath (UiPath Document OCR) dans le cadre de l'activité Numériser le document (Digitize Document). Pour être utilisée, la compétence ML doit d'abord être rendue publique afin qu'une URL puisse être copiée-collée dans l'activité moteur d'OCR de document UiPath (UiPath Document OCR).
Vous pouvez exécuter UiPathDocumentOCR sur GPU ou processeur : la précision est la même dans les deux cas, mais l'entraînement sur GPU est plus rapide que celui sur processeur. Pour plus de détails, consultez la configuration matérielle requise.
UiPathDocumentOCR nécessite l'accès au serveur de comptage de Document Understanding à l'adresse https://du.uipath.com/metering si la compétence ML s'exécute sur une version locale d'AI Center à déploiement régulier. Aucun accès Internet n'est nécessaire sur la version locale d'AI Center pour les déploiements physiquement isolés.
Ce paquet ML peut être déployé de la même manière que le paquet ML UiPathDocumentOCR, avec les différences suivantes :
- il est optimisé pour fonctionner sur le processeur, vous devriez donc constater une exécution 3 à 4 fois plus rapide dans le workflow et une utilisation 5 à 10 fois plus rapide lors de l'importation des documents dans Document Manager
- la précision est légèrement inférieure à celle du paquet ML UiPathDocumentOCR et est similaire au paquet Studio UiPath.DocumentUnderstanding.OCR.LocalServer
- en raison de sa rapidité, le processeur est également recommandé lorsque les documents sont volumineux (plus de 20 pages par document) en l’absence d’un GPU, ce qui est idéal.
Il s'agit d'un modèle générique et réentraînable permettant d'extraire tous les points de données courants de tout type de documents structurés ou semi-structurés, en créant un modèle à partir de zéro. Ce paquet ML doit être entraîné. S'il est déployé sans entraînement préalable, le déploiement échouera en présentant une erreur indiquant que le modèle n'a pas été entraîné.
Il s'agit d'un modèle générique et réentraînable pour classer tout type de documents structurés ou semi-structurés, en construisant un modèle à partir de zéro. Ce paquet ML doit être entraîné. S'il est déployé sans entraînement préalable, le déploiement échouera en présentant une erreur indiquant que le modèle n'a pas été entraîné.
Il s'agit de packages ML réentraînables qui détiennent la connaissance de différents modèles d'apprentissage automatique.
Ils peuvent être personnalisés pour extraire des champs supplémentaires ou prendre en charge des langues supplémentaires à l'aide d'exécutions de pipeline. En utilisant des capacités d'apprentissage par transfert de pointe, ce modèle peut être réentraîné sur des documents labellisés supplémentaires et adapté à des cas d'utilisation spécifiques ou étendu pour une prise en charge supplémentaire des langues latines, cyrilliques ou grecques.
L'ensemble de données utilisé peut avoir les mêmes champs, un sous-ensemble des champs ou des champs supplémentaires. Afin de bénéficier des informations déjà contenues dans le modèle préentraîné, vous devez utiliser des champs portant les mêmes noms que dans le modèle prêt à l'emploi lui-même.
Ces packages ML sont :
- Factures (Invoices) : les champs extraits prêts à l'emploi peuvent être trouvés ici.
- FacturesAustralie : les champs extraits prêts à l'emploi se trouvent ici.
- FacturesInde : les champs extraits prêts à l'emploi se trouvent ici.
-
FacturesJapon
Preview
: les champs extraits prêts à l'emploi se trouvent ici.Le réentraînement à l'aide des données de la Station de validation (Validation Station) n'est actuellement pas pris en charge.
-
FacturesChine
Preview
: les champs extraits prêts à l'emploi se trouvent ici.Le réentraînement à l'aide des données de la Station de validation (Validation Station) n'est actuellement pas pris en charge.
- Reçus (Receipts) : les champs extraits prêts à l'emploi peuvent être trouvés ici.
- Bons de commande (Purchase Orders) : les champs extraits prêts à l'emploi se trouvent ici.
- Factures de services publics (Utility Bills) : les champs extraits prêts à l'emploi se trouvent ici.
- Cartes d'identité (ID Cards) : les champs extraits prêts à l'emploi peuvent être trouvés ici.
- Passeports (Passports) : les champs extraits prêts à l'emploi se trouvent ici.
- RemittanceAdvices : les champs extraits prêts à l'emploi se trouvent ici.
- FacturesAustralie : les champs extraits prêts à l'emploi se trouvent ici.
- W2 : les champs extraits prêts à l'emploi se trouvent ici.
- W9 : les champs extraits prêts à l'emploi se trouvent ici.
- ACORD125 : les champs extraits prêts à l'emploi se trouvent ici
- I9 : les champs extraits prêts à l'emploi se trouvent ici.
- 990
Preview
: les champs extraits prêts à l'emploi peuvent être trouvés ici. - 4506T : les champs extraits prêts à l'emploi peuvent être trouvés ici.
- FM1003
Preview
: les champs extraits prêts à l'emploi se trouvent ici. - ACORD25 - les champs extraits prêts à l'emploi se trouvent ici
- 1040 - les champs extraits prêts à l'emploi se trouvent ici
- Checks - les champs extraits prêts à l'emploi se trouvent ici
- États financiers : les champs extraits prêts à l’emploi peuvent être trouvés ici.
- États financiers - les champs extraits prêts à l'emploi peuvent être trouvés ici.
- Reçus (Receipts) - les champs extraits prêts à l'emploi peuvent être trouvés ici.
- ACORD131 - les champs extraits prêts à l'emploi se trouvent ici.
- ACORD126 : les champs extraits prêts à l'emploi se trouvent ici
- ACORD140 : les champs extraits prêts à l'emploi se trouvent ici
- Vehicle Titles - les champs extraits prêts à l'emploi se trouvent ici
Ces modèles sont des architectures d'apprentissage profond développées par UiPath. Un GPU peut être utilisé à la fois au moment du service et au moment de l'entraînement, mais n'est pas obligatoire. Un GPU offre une amélioration de la vitesse multipliée par 10 pour l'entraînement en particulier.
Les paquets ML pré-entraînés prêts à l’emploi peuvent être divisés en catégories de documents en fonction de l’utilisation prévue de chaque modèle :
Catégorie de document |
Modèle ML |
---|---|
KYC |
|
Assurance |
|
Prêt |
|
h |
|
Expédition |
|
PA |
|
RA |
|
Dépenses |
|
Il s'agit de packages non réentraînables requis pour les composants non ML de la suite Document Understanding.
Ces packages ML sont :
- Extracteur de formulaires : déployez en tant que compétence publique et collez l'URL dans l'activité Extracteur de formulaires (Form Extractor).
- Extracteur de formulaires intelligents : déployez en tant que compétence publique et collez l'URL dans l'activité Extracteur de formulaires intelligents (Intelligent Form Extractor). Assurez-vous d'abord de déployer la compétence ML HandwritingRecognition et de la configurer en tant qu'OCR pour ce package.
- Classifieur de mots clés intelligents : déployez en tant que compétence publique et collez l'URL dans l'activité Classifieur de mots clés intelligents (Intelligent Keyword Classifier).
- HandwritingRecognitionOCR : déployez-le en tant que compétence publique et utilisez-le en tant qu'OCR lors de la création du package IntelligentFormExtractor.