- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Numérisation
Cette section comprend des informations générales
et techniques sur le composant Numérisation (Digitization).
La numérisation est le processus d'obtention d'un texte lisible par une machine à partir d'un fichier entrant donné. Elle rend possible la compréhension de son contenu par un robot et permet à ce dernier d'agir en conséquence. Il s'agit de la première étape appliquée aux fichiers qui doivent être traités via l'infrastructure Document Understanding.
L'étape de numérisation a deux sorties :
- le texte du fichier traité, stocké dans une variable chaîne, et
- le modèle d'objet document de ce fichier – objet JSON contenant des informations de base telles que le nom, le type de contenu, la longueur du texte, le nombre de pages ainsi que des informations détaillées telles que la rotation des pages, la langue détectée, le contenu et les coordonnées de chaque mot identifié dans le fichier.
Dans l'infrastructure de traitement de document, la numérisation est effectuée à l'aide de l'activité Numériser le document (Digitize Document).
L'activité Numériser un document (Digitize Document) nécessite, dans le cadre de sa configuration, la sélection d'un moteur OCR afin qu'en cas de besoin, il puisse être utilisé tout en exécutant uniquement l'OCR sur
-
les fichiers images
- les formats d'images pris en charge sont .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp
- pour les fichiers TIFF multipages, l'OCR est appliqué pour chaque page
-
pages PDF qui
- ne présentent aucun contenu lisible par machine
- contiennent des images qui couvrent une zone significative de la page.
L'OCR est également toujours appliqué si l'activité Numériser le document (Digitize Document) est configurée avec l'indicateur ForceApplyOCR défini sur True (Vrai). Cette option est généralement recommandée pour les cas d'utilisation dans lesquels un important pourcentage de fichiers semble contenir du contenu natif, mais que le contenu lu de manière native ne correspond pas à ce qu'un utilisateur peut voir dans ces fichiers.
Comme chaque cas d'utilisation a ses propres particularités, il est fortement recommandé de tester tous les moteurs OCR disponibles avec des paramètres différents afin de déterminer celui qui fonctionne le mieux pour votre projet. Il est également recommandé de porter une attention particulière aux arguments du moteur OCR, tels que Profile,Scale,Language etc. (peut varier d'un moteur à l'autre), afin d'identifier les meilleurs paramètres pour chaque cas d'utilisation.