À propos du package d'activités IntelligentOCR

Ce pack contient l'infrastructure permettant d'activer les flux de traitement des documents à l'aide d'une approche complète, ouverte et extensible.

Important

Compatibilité entre UiPath.IntelligentOCR.Activities et UiPath.DocumentUnderstanding.ML.Activities

À partir de la version v6.18.0-preview , lors de l’installation du package UiPath.IntelligentOCR.Activities dans un projet, le package UiPath.DocumentUnderstanding.ML.Activities est automatiquement installé et vous n’avez pas besoin de l’installer séparément.

Compatibilité UiPath Studio 2023.4.4

Si vous utilisez UiPath Studio 2023.4.4 ou une version antérieure, assurez-vous d'installer la dernière version de Windows .NET 6.0 Desktop Runtime.

Compatibilité des versions

La mise à jour de UiPath.IntelligentOCR.Activities nécessite également de mettre à jour le pack UiPath.UIAutomation.Activities ainsi que le pack UiPath.OCR.Activities s'ils sont inclus dans le projet.

UiPath.IntelligentOCR.Activities et UiPath.DocumentUnderstanding.Activities ne doivent pas être utilisés ensemble dans le même projet. Le package UiPath.IntelligentOCR.Activities doit être utilisé pour les workflows Windows (ou hérités), tandis que le package UiPath.DocumentUnderstanding.Activities doit être utilisé pour les workflows multiplate-forme.

Formats pris en charge

Le pack d'activités IntelligentOCR peut prendre en charge l'un des types de fichiers suivants : .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp, et .pdf.

Prise en charge des variantes de projet C#

À partir de la version 4.10.0, ce package d'activité est validé pour une utilisation dans les projets C#.

Bibliothèque Docotic.Pdf

Si une erreur mentionnant la bibliothèque Docotic.Pdf est rencontrée au moment de l’exécution, vous devez mettre à niveau le package UiPath.IntelligentOCR.Activities vers la version v3.1.0 ou toute version ultérieure.
La version 3.0 et supérieure deUiPath.IntelligentOCR.Activities est incompatible avec une version de UiPath.PDF.Activities inférieure à 3.0, et une version 3.0 ou supérieure de UiPath.PDF.Activities est incompatible avec une version de UiPath.IntelligentOCR.Activities inférieure à 3.0. Veuillez utiliser des versions compatibles si les deux packages sont utilisés dans le même projet.
Si vous utilisez dans votre projet l'un des packages suivants : UiPath.DocumentUnderstanding.ML.Activities version 1.7.0, UiPath.IntelligentOCR.Activities version 4.13.0, ou UiPath.PDF.Activities version 3.4.0, alors vous devez mettre à jour le reste des packages vers les versions mentionnées.

Dépendances CefSharp

UiPath.IntelligentOCR.Activities version 4.10.2 est compatible uniquement avec les versions de UiPath.Form.Activities de 1.1.8 à 1.1.10 inclus, s'il est utilisé dans le même workflow.
UiPath.IntelligentOCR.Activities version 4.13.0 n'est compatible qu'avec les versions de UiPath.Form.Activities supérieures ou égales à 1.1.11, s'il est utilisé dans le même workflow.
Lors de la mise à jour de UiPath.IntelligentOCR.Activities à partir d'une version inférieure à 4.10.2 vers une version supérieure ou égale à 4.10.2, une erreur peut être générée. Il s’agit d’un problème connu qui doit être résolu et qui peut être ignoré.

Activités Abbyy

À partir de UiPath.IntelligentOCR.Activities version 4.0.0, toutes les activités liées à Abbyy ont été déplacées vers un package séparé. Installez le package UiPath.Abbyy.Activities si vous souhaitez utiliser ses activités pour l'OCR, l'OCR Cloud, la classification et l'extraction de données.

Autres notes

Temporairement, la Station de validation et la Station de classification ne sont pas prises en charge sur Studio v20.10. Veuillez utiliser n'importe quelle autre version de Studio pour exécuter les assistants Station de validation (Validation Station) et Station de classification (Classification Station).

Fonctionnalités

Le package UiPath.IntelligentOCR.Activities vous permet de :

Numériser les documents

Vous pouvez y parvenir à l'aide de l'activité Numériser le document ( Digitize Document) . Cela récupère le texte de n'importe quel PDF ou image, en utilisant, uniquement si nécessaire, le moteur OCR de votre choix.

Au fur et à mesure que les documents sont traités un par un, ils passent par le processus de numérisation. La différence pour les documents non numériques (numérisés) est que vous devez appliquer le moteur OCR de votre choix. Les sorties de cette étape sont le modèle d'objet de document et une variable de chaîne contenant tout le texte du document et sont transmises aux étapes suivantes.

Classer les documents

Pour ce faire, utilisez l'activité Classer le document (Classify Document). Cela permet d'identifier le type de document d'un fichier en utilisant n'importe quel algorithme de classification.

Après numérisation, le document est classé. Si vous travaillez avec plusieurs types de documents dans le même projet, pour extraire correctement les données, vous devez savoir avec quel type de document vous travaillez. L'important est que vous puissiez utiliser plusieurs classifieurs dans la même étendue, configurer les classifieurs et, plus tard dans l'infrastructure, les entraîner. Les résultats de la classification aident à appliquer la bonne stratégie d'extraction.
L’activité Classifieur basé sur des mots-clés ( Keyword Based Classifier ) est le premier de ces classifieurs, ciblant la classification des documents avec titre.
L’activité Classifieur de mots clés intelligents ( Intelligent Keyword Classifier) peut non seulement classer mais également « fractionner » des fichiers contenant plusieurs types de documents.
Le classifieur FlexiCapture, intégrant la technologie Abbyy FlexiCapture, est également intégré à notre produit. Cette activité fait partie du package UiPath.Abbyy.Activities .

Valider la classification automatique

Vous pouvez y parvenir à l'aide de l'activité Présenter la station de classification assistée ( Present Classification Station Attended ), qui présente une interface utilisateur spécifique au traitement de documents pour valider et corriger les sorties de classification automatique.

En particulier pour les cas d'utilisation dans lesquels le fractionnement de fichiers est impliqué, l'utilisation de l'étape de validation de la classification humaine est fortement recommandée, afin de s'assurer que le traitement en aval pour l'extraction de données fonctionne correctement.
Une alternative à l'activité Attended est disponible via l'utilisation de workflows de longue durée, conçus pour permettre de manière optimale la collaboration homme-robot. Les activités Créer des actions de classification de document ( Create Document Classification Actions) et Attendre les actions de classification du document et Reprendre ( Wait for Document Classification Actions ) et Reprendre (Resume) permettent ce scénario.

Entraîner les classifieurs

Vous pouvez y parvenir à l'aide de l'activité Tester l' étendue des classifieurs (Train Classifiers Scope) . Cela permet de fermer la boucle de rétroaction à tout algorithme de classification capable d'apprendre. Faites glisser et déposez vos outils d'entraînement de classifieurs dans cette activité Étendue et activez-les à l'aide de l'assistant Configurer les classifieurs (Configure Classifiers) pour vous assurer que les informations validées par des humains via la Station de classification ou la Station de validation sont utilisées par vos classifieurs pour améliorer leurs propres performances.

La classification est aussi efficace que les classifieurs utilisés. Si un document n'a pas été classé correctement, cela signifie qu'il était inconnu des classifieurs actifs. L'infrastructure offre la possibilité d'entraîner les classifieurs afin d'améliorer la reconnaissance des classes de documents.
L' outil Outil d'entraînement de classifieur basé sur des mots-clés ( Keyword Based Classifier Trainer) est l'activité d'entraînement associée au Classifieur basé sur des mots-clés ( Keyword Based Classifier).
Le Classifieur de mots clés intelligents ( Intelligent Keyword Classifier Trainer) active la boucle de rétroaction pour le Classifieur de mots clés intelligents (Intelligent Keyword Classifier).

Extraire des données de documents

Vous pouvez y parvenir à l'aide de l'activité Étendue de l' extraction de données (Data Extraction Scope) . Cela permet d'utiliser n'importe quel algorithme d'extraction de données pour identifier différents champs dans un document classifié.

L'extraction consiste à obtenir uniquement les données qui vous intéressent à partir d'un type de document donné. Par exemple, extraire des données spécifiques d'un document de 5 pages est assez fastidieux si vous souhaitez le faire avec une manipulation de chaînes. Dans cette infrastructure, vous pouvez utiliser différents extracteurs, pour les différentes structures de document, dans la même étendue d'extraction de données. Les résultats de l'extraction sont transmis pour validation.
L ' extracteur basé sur RegEx est un extracteur de données de base qui applique une correspondance d'expressions régulières pour identifier les meilleurs candidats pour un champ spécifique.
L' extracteur de formulaires utilise des modèles prédéfinis pour permettre le traitement de documents structurés à formulaire fixe.
L' Extracteur de formulaires intelligents ( Intelligent Form Extractor) est une extension de l' Extracteur de formulaires ( Form Extractor) avec des capacités étendues liées au traitement des formulaires manuscrits et des signatures sur les documents.
L' Extracteur d'apprentissage automatique ( Machine Learning Extractor) exploite la puissance de l'IA et de l'apprentissage automatique pour identifier les informations dans les documents structurés ou semi-structurés en utilisant l'un des services publics d'extraction de données UiPath ou en appelant des modèles d'apprentissage automatique entraînés personnalisés que vous pouvez créer et héberger dans AI Center. Cette activité fait partie du package UiPath.DocumentUnderstanding.ML.Activities .
L ' extracteur FlexiCapture intègre la technologie Abbyy FlexiCapture dans notre produit et fait partie du package UiPath.Abbyy.Activities .

Valider les résultats de l'extraction automatique des données

Vous pouvez y parvenir à l'aide de l'activité Présenter la station de validation (Present Validation Station Attended ), qui présente une interface utilisateur spécifique au traitement de documents pour la validation et la correction des données.

Les données extraites peuvent être validées par un utilisateur humain via la station de validation. Une bonne pratique consiste à construire une logique autour de la décision d'ajouter ou non une étape de validation humaine, avec des règles dépendant du cas d'utilisation spécifique à implémenter. Les résultats de la validation peuvent ensuite être exportés et utilisés dans d'autres activités d'automatisation.
Vous pouvez également activer la validation humaine via des workflows de longue durée, optimisant ainsi la collaboration homme-robot. Les ActionsCréer une validation de document (Create Document Validation) et Attendre les actions de validation du document et Reprendre ( Wait for Document Validation Actions and Resume)
.

Extracteurs de train

Vous pouvez y parvenir à l'aide de l'activité Étendue de l'entraînement des extracteurs (Train Extractors Scope) . Cela permet de fermer la boucle de rétroaction à tout algorithme d'extraction de données capable d'apprendre. Faites glisser et déposez vos outils d'entraînement d'extracteurs dans cette activité Étendue (Scope) et activez-les à l'aide de l'assistant Configurer les extracteurs (Configure Extractors) pour vous assurer que les informations validées par des humains via la Station de validation (Validation Station) sont utilisées par vos extracteurs pour améliorer leurs propres performances.

L'extraction est aussi efficace que les extracteurs utilisés. Si les valeurs de champ n'ont pas été extraites correctement, cela signifie qu'elles étaient inconnues des extracteurs actifs. L'infrastructure offre la possibilité d'entraîner les extracteurs afin d'améliorer la reconnaissance des valeurs de champ.
Le Machine Learning Extractor Trainer ferme la boucle de rétroaction pour l'extraction de données basée sur ML, en collectant les données nécessaires pour réentraîner un modèle d'apprentissage automatique hébergé dans AI Center. Cette activité fonctionne de pair avec l'activité Extracteur d'apprentissage automatique ( Machine Learning Extractor ) et fait partie du package UiPath.DocumentUnderstanding.ML.Activities .

Exporter les informations extraites

Vous pouvez y parvenir à l'aide de l'activité Exporter les résultats d'extraction ( Export Extraction Results ). Cela vous permet d'exporter la structure complexe des données extraites vers un simple DataSet (collection de DataTables).

Une fois vos informations validées, vous pouvez les utiliser telles quelles ou les enregistrer dans un format DataTable pouvant être converti très facilement en fichier Excel.

Le package UiPath.IntelligentOCR.Activities est compatible avec toute activité de classification ou d’extraction de données personnalisée basée sur le package public UiPath.DocumentProcessing.Contracts . Il offre une flexibilité totale pour créer votre propre algorithme spécifique à votre cas d'utilisation, ainsi que l'intégrer à toute solution tierce pour la classification de documents et l'extraction de données.

Les versions suivantes du paquet ont été supprimées du flux officiel. Si vous rencontrez des problèmes, veuillez contacter nos équipes d’assistance.