Document Understanding : à propos des paquets ML

document-understanding

2020.10

false

Guide de l'utilisateur de Document Understanding

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

À propos des paquets ML

L'utilisation d'un paquet ML Document Understanding implique les étapes suivantes :

Recueillez les échantillons de documents et les exigences des points de données qui doivent être extraits.
Étiquetez les documents à l'aide de Data Manager.
Data Manager se connectera à un service OCR.
Exportez les documents étiquetés en tant que jeu de données d'entraînement et chargez ce dossier exporté sur AI Center Storage.
Exportez les documents étiquetés en tant que jeu de données de test et chargez ce dossier exporté sur AI Center Storage.
Exécutez un pipeline d'entraînement sur AI Center.
Évaluez les performances du modèle avec un pipeline d'évaluation sur AI Center.
Déployez le modèle entraîné en tant que compétence ML sur AI Center.
Émettez une requête pour la compétence ML à partir d'un workflow RPA à l'aide du package d'activités UiPath.DocumentUnderstanding.ML.
Remarque : n'oubliez pas que l'utilisation de paquets ML Document Understanding nécessite que la machine sur laquelle AI Center est installé puisse accéder à https://du-metering.uipath.com.

Attention : lors de la création d'un package UiPath.DocumentUnderstanding.ML.Activities dans AI Center, le nom du package ne doit pas être un mot clé python réservé, tel que class , break, from, finally, global, None, etc. Notez que cette liste n'est pas exhaustive puisque le nom du package est utilisé pour class <pkg-name> et import <pkg-name> .

Il s'agit de modèles d'apprentissage automatique prêts à l'emploi pour classer et extraire tous les points de données courants à partir de documents semi-structurés ou non structurés, y compris les champs réguliers, les colonnes de table et les champs de classification dans une approche sans modèle.

Document Understanding contient plusieurs paquets ML divisés en quatre catégories principales :

UiPath Document OCR

Il s'agit d'un modèle non réentraînable qui peut être utilisé avec l'activité moteur d'OCR de document UiPath (UiPath Document OCR) dans le cadre de l'activité Numériser le document (Digitize Document). Pour être utilisé, il doit d'abord être rendu public afin qu'une URL puisse être copiée-collée dans l'activité moteur d'OCR de document UiPath (UiPath Document OCR).

UiPathDocumentOCR nécessite l'accès au serveur de comptage de Document Understanding à l'adresse https://du.uipath.com/metering si la compétence ML s'exécute sur une version locale d'AI Center à déploiement régulier. Aucun accès Internet n'est nécessaire sur la version locale d'AI Center pour les déploiements physiquement isolés.

Le paquet ML UiPathDocumentOCR d'AI Center est optimisé pour fonctionner sur GPU, nous vous recommandons donc fortement de l'utiliser sur GPU. Si aucun GPU n'est disponible, nous vous recommandons d'utiliser le conteneur docker autonome.

Document Understanding

Il s'agit d'un modèle générique et réentraînable permettant d'extraire tous les points de données courants de tout type de documents structurés ou semi-structurés, en créant un modèle à partir de zéro. Ce paquet ML doit être entraîné. S'il est déployé sans entraînement préalable, le déploiement échouera en présentant une erreur indiquant que le modèle n'a pas été entraîné.

Out-of-the-box Pre-trained ML Packages

Il s'agit de packages ML réentraînables qui détiennent la connaissance de différents modèles d'apprentissage automatique.

Ils peuvent être personnalisés pour extraire des champs supplémentaires ou prendre en charge des langues supplémentaires à l'aide d'exécutions de pipeline. En utilisant des capacités d'apprentissage par transfert de pointe, ce modèle peut être réentraîné sur des documents labellisés supplémentaires et adapté à des cas d'utilisation spécifiques ou étendu pour une prise en charge supplémentaire des langues latines, cyrilliques ou grecques.

L'ensemble de données utilisé peut avoir les mêmes champs, un sous-ensemble des champs ou des champs supplémentaires. Afin de bénéficier des informations déjà contenues dans le modèle préentraîné, vous devez utiliser des champs portant les mêmes noms que dans le modèle prêt à l'emploi lui-même.

Ces packages ML sont :

Factures (Invoices) : les champs extraits prêts à l'emploi peuvent être trouvés ici.
FacturesAustralie Preview : les champs extraits prêts à l'emploi se trouvent ici.
FacturesInde Preview : les champs extraits prêts à l'emploi se trouvent ici.
FacturesJapon Preview : les champs extraits prêts à l'emploi se trouvent ici.
Reçus (Receipts) : les champs extraits prêts à l'emploi peuvent être trouvés ici.
PurchaseOrders Preview : les champs extraits prêts à l'emploi se trouvent ici.
UtilityBills Preview : les champs extraits prêts à l'emploi se trouvent ici.

Ces modèles sont des architectures d'apprentissage profond développées par UiPath. Un GPU peut être utilisé à la fois au moment du service et au moment de l'entraînement, mais n'est pas obligatoire. Un GPU offre une amélioration de la vitesse multipliée par 10 pour l'entraînement en particulier.

Autres paquets ML prêts à l’emploi

Il s'agit de packages non réentraînables requis pour les composants non ML de la suite Document Understanding.

Ces packages ML sont :

Extracteur de formulaires : déployez en tant que compétence publique et collez l'URL dans l'activité Extracteur de formulaires (Form Extractor).
Extracteur de formulaires intelligents : déployez en tant que compétence publique et collez l'URL dans l'activité Extracteur de formulaires intelligents (Intelligent Form Extractor). Assurez-vous d'abord de déployer la compétence ML HandwritingRecognition et de la configurer en tant qu'OCR pour ce package.
Classifieur de mots clés intelligents : déployez en tant que compétence publique et collez l'URL dans l'activité Classifieur de mots clés intelligents (Intelligent Keyword Classifier).
HandwritingRecognition : déployez-le en tant que compétence publique et utilisez-le en tant qu'OCR lors de la création du package IntelligentFormExtractor.

Sommaire de la page

UiPath Document OCR
Document Understanding
Out-of-the-box Pre-trained ML Packages
Autres paquets ML prêts à l’emploi

Cette page vous a-t-elle été utile ?

PrécédentCréation de pipelines d'évaluation et d'entraînement

SuivantLangues prises en charge