- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Introduction
L’ infrastructure UiPath® Document UnderstandingTM simplifie le traitement des fichiers entrants, de la numérisation des fichiers à la validation des données extraites, le tout dans un environnement ouvert, extensible et polyvalent.
Document Understanding est conçu pour vous aider à combiner différentes approches d'extraction d'informations de plusieurs types de documents. Son principal objectif consiste à rendre le processus d'extraction de données aussi simple que possible : créer un workflow unique qui extraie les données de plusieurs documents.
Avant d'utiliser l'infrastructure Document Understanding, il est recommandé de comprendre les composants suivants de l'infrastructure Document Understanding :
- Taxonomie Quels documents doivent être traités et quelles données leur sont demandées ? Permet de définir les types de documents et les informations ciblées aux fins de l'extraction de données (champs) pour chaque type de document, et formalise ces informations dans une structure de taxonomie dédiée. Ces informations de métadonnées sont gérées par le biais de Taxonomy Manager.
- Numérisation Que contient ce fichier ? Utilisé pour obtenir le contenu textuel et la structure du document entrant, transformant un fichier en contenu lisible par machine afin qu'il puisse être traité ultérieurement en aval.
- Classification de document Quels types de documents de taxonomie se trouvent dans ce fichier ? Utilisé pour déterminer automatiquement les types de documents localisés dans un fichier numérisé.
- Administrateur de la classification de document La classification prévue est-elle correcte ? C'est ainsi que je peux l'examiner et la corriger. Utilisé pour assister la validation manuelle et la correction des résultats de la classification automatique ainsi que du fractionnement des documents.
- Apprentissage de la classification L'humain a-t-il examiné les données ? C'est ainsi que le robot peut en tirer des leçons. Utilisé pour transmettre les informations validées par l'homme aux classificateurs afin de les utiliser en vue d'améliorer leurs prédictions futures.
- Extraction de données Quelles données peuvent être trouvées dans ce document ? Sert à capturer les informations requises relatives au type de document identifié dans le document d'entrée et la plage de pages de classification donnés.
- Validation de l'extraction de données Les informations extraites sont-elles correctes ? C'est ainsi que je peux les examiner et les corriger. Sert à assister la validation humaine et la correction des résultats de données extraits automatiquement.
- Apprentissage de l'extraction de données L'humain a-t-il examiné les données ? C'est ainsi que le robot peut en tirer des leçons. Sert à transmettre les données extraites validées par l'homme aux extracteurs en vue de les utiliser pour améliorer leurs prévisions d'extraction.
- Consommation de données Permet d'exporter les données validées en vue de les utiliser.
- Logique de mesure et de charge Utilisée pour expliquer la consommation d'unités par page pour chaque service disponible.
Le diagramme ci-dessous présente les composants du cadre de Document Understanding ainsi que leurs relations :
L'infrastructure Document Understanding se trouve dans le package UiPath.IntelligentOCR.Activities . Une fois le package UiPath.IntelligentOCR.Activities installé, l'assistant Taxonomy Manager apparaît dans le ruban supérieur de UiPath Studio. Ce même package contient toutes les activités de l’infrastructure Document Understanding de base.
Les activités d'étendue (Classer l'étendue du document (Classify Document Scope), Étendue de l'extraction de données (Data Extraction Scope), Tester l'étendue des classifieurs (Train Classifiers Scope), Tester l'étendue des extracteurs (Train Extractors Scope) qui font partie de l'infrastructure Document Understanding vous permettent d'utiliser tous les algorithmes de classification de documents et d'extraction de données qui correspondent à votre cas d'utilisation, puis d'entraîner ces algorithmes.
L'infrastructure Document Understanding peut être utilisée non seulement avec les classifieurs et extracteurs prêts à l'emploi, mais également avec tous ceux qui ont été personnalisés au préalable. Ceux-ci peuvent être créés à l'aide des classes abstraites du package UiPath.DocumentProcessing.Contracts et peuvent être mis en œuvre en tant qu'activités de classification ou d'extraction de données. Des moteurs de reconnaissance optique de caractères personnalisés peuvent également être créés à l'aide des classes abstraites du package UiPath.OCR.Contracts.
Des cours dédiés à Document Understanding sont disponibles dans l'UiPath Academy.
Le forum de la communauté UiPath permet d'obtenir le soutien de notre communauté d'utilisateurs toujours croissante.