- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Paquets ML
- Pipelines
- Data Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
À propos des pipelines
Les paquets ML Document Understanding peuvent exécuter les trois types de pipelines :
Une fois terminée, l'exécution de pipeline dispose de sorties et des journaux associés. Pour voir ces informations, dans l'onglet Pipelines de la barre latérale gauche, cliquez sur un pipeline pour ouvrir la vue Pipeline (Pipeline view) qui se compose de :
- les détails du pipeline tels que le type, le nom et la version du paquet ML, l'ensemble de données, l'utilisation du GPU, les paramètres et le temps d'exécution
- le volet Sorties (Outputs) ; cela inclut toujours un fichier
_results.json
contenant un résumé des détails du Pipeline - la page Journaux (Logs) ; les journaux peuvent également être obtenus dans l'onglet ML Logs de la barre latérale gauche
Les pipelines d'entraînement ou les pipelines complets peuvent également être utilisés pour :
- Ajustez les modèles ML avec les données de Station de validation
- Ajuster automatiquement un modèle ML
Entraînement : entraîner un modèle à partir de zéro, c'est-à-dire en utilisant le paquet ML DocumentUnderstanding.
Réentraînement : entraînement à l'aide d'un modèle de base pré-entraîné, c'est-à-dire en utilisant l'un des autres paquet ML d'extraction de documents dans AI Center, tels que Factures, Reçus, Bons de commande, etc.
Réentraînement automatique : il s'agit du nom d'une variable d'environnement qui peut être définie lors de la création d'un pipeline dans AI Center, ce qui permet au pipeline d'utiliser automatiquement l'ensemble de données exporté le plus récent pour l'entraînement. Cette variable est indépendante du fait que cet ensemble de données inclut ou non des données provenant de la station de validation.
Ajustement : entraîner ou réentraîner un modèle à l'aide d'un ensemble de données qui comprend des données provenant de la station de validation.
Ajustement automatique : utilisation de la fonction de variable d'environnement de réentraînement automatique pour entraîner automatiquement un modèle à l'aide des données fournies par la station de validation à l'aide de la fonction d'exportation planifiée de Data Manager.