Activités (Activities)
Plus récente (Latest)
False
Image de fond de la bannière
Activités Document Understanding
Dernière mise à jour 10 avril. 2024

Notes de publication

V6.14.1

Date de publication : 24 octobre 2023

Nouvelles fonctionnalités et améliorations

Une nouvelle propriété, Confiance de validation des champs extraits exprimée en pourcentage (Extracted fields validation confidence %) est ajoutée pour les activités suivantes :
  • Present Validation Station
  • Create Document Validation Action
La nouvelle propriété Envoyer des documents est ajoutée aux activités suivantes :
  • Form Extractor
  • Intelligent Keyword Classifier

L’activité Numériser le document (Digitize Document) peut désormais détecter les boutons radio PDF natifs.

Les capacités de détection du type de contenu de l'activité Numériser le document (Digitize Document) ont été améliorées.

Taxonomy Manager permet désormais de définir plusieurs expressions mathématiques dans les règles métier.

v6.9.5

Date de publication : 19 septembre 2023

Nous avons corrigé un bogue qui déclenchait une erreur You are not authorized lors de la reprise d'une tâche une fois la validation du document terminée sur Action Center.

v6.9.4

Date de publication : 28 août 2023

Nous avons corrigé un bogue qui ralentissait la Station de validation lorsque les documents contenaient des tableaux volumineux.

v6.9.3

Date de publication : 8 juin 2023

Nous avons corrigé un bogue qui provoquait des incohérences au niveau des valeurs formatées lorsque le montant était négatif.

v6.9.2

Date de publication : 7 juin 2023

Une nouvelle option est disponible lors de l’utilisation de l’activité Extracteur de formulaires (Form Extractor), Envoyer des documents pour des améliorations d’algorithmes(Send documents for algorithm activities) , vous permettant d’activer ou de désactiver l’option avant d’exécuter le workflow. La valeur par défaut est enabled.

Nous avons corrigé des bogues mineurs et des corrections d'accessibilité dans l'ensemble du package UiPath.IntelligentOCR.Activities.

v6.5.3

Date de publication : 19 septembre 2023

Nous avons corrigé un bogue qui déclenchait une erreur You are not authorized lors de la reprise d'une tâche une fois la validation du document terminée sur Action Center.

v6.5.2

Date de publication : 7 juin 2023

Nous travaillons constamment pour améliorer votre expérience UiPath Document Understanding. Bien que cette version n’apporte aucun changement majeur, nous nous sommes assurés d’apporter des améliorations mineures et des correctifs d’accessibilité à notre produit.

v6.9.1

Date de publication : 2 mai 2023

Résolution de bogues

Nous avons corrigé un bogue provoquant le plantage de l’activité Étendue de l’extraction de données (Data Extraction Scope) lorsque l’extraction est terminée sur tous les sous-documents sauf le premier. Cela se produisait lorsqu'un classifieur était utilisé pour effectuer le fractionnement de documents et que plusieurs résultats de classification étaient renvoyés par Classer l'étendue du document (Classify Document Scope).

v6.9.0

Date de publication : 26 avril 2023

Nouvelles fonctionnalités et améliorations

UiPath Document OCR est le nouveau moteur OCR par défaut pour les activités suivantes : Classifieur de mots clés intelligents (Intelligent Kawword Classifier), Outil d'extraction de formulaires (Form Extractor)

Nous avons ajouté une fonctionnalité de nouvelle tentative aux activités Attendre les actions de validation du document ( Wait for Document Validation Actions) et Attendre les actions de classification du document ( Wait for Document Classification Actions) . Vous pouvez utiliser la nouvelle option Réessayer (Retry) et la définir sur Activé (Enabled)/Désactivé (Disabled), la valeur par défaut étant Activé (Enabled). Si activé, les appels HTTP seront retentés en cas d’échec.

Le package UiPath.IntelligentOCR.Activities peut désormais être utilisé avec des langues écrites de droite à gauche.

La précision de l’extraction de l’activité Extracteur de formulaires (Form Extractor) a été améliorée en incluant les informations de correspondance des pages dans l’algorithme d’extraction.

Nous avons mis à jour la conception des règles de champ qui peuvent être définies dans Taxonomy Manager.

Vous pouvez désormais appliquer des expressions mathématiques aux règles de champ à l'aide de l'assistant Taxonomy Manager de l'activité Charger la taxonomie (Load taxonomy).

L'assistant de la station de validation a été mis à jour, vous permettant de voir les règles appliquées aux champs. De plus, lorsqu'un champ est mis à jour manuellement, la règle de champ est également mise à jour automatiquement.

L’activité Numériser le document (Digitize Document) a été améliorée et consomme désormais moins de mémoire système.

Les widgets de tampon sont désormais numérisés dans les fichiers PDF natifs.

La prise en charge des fichiers PDF a été améliorée pour l’activité Numériser le document.

Erratum de septembre 2023 : des fonctionnalités avancées de fractionnement sont disponibles pour l'activité Classifieur de mots-clés intelligents (Intelligent Keyword Classifier).

Résolution de bogues

Nous avons mis à jour les dépendances du package et corrigé l’erreur Méthode introuvable ( Method not found ) générée lorsqu’une activité Appeler le code (Invoke Code) était ajoutée au workflow.

Nous avons corrigé un bogue qui empêchait le remplissage automatique de la clé API lorsque votre jeton d'authentification pour l'instance Orchestrator utilisée avait expiré. L’erreur s’est produite à la fois pour UiPath Document OCR et pour l’OCR pour le chinois, le japonais et le coréen .

Chronologie de l’abandon

Nous vous recommandons de vérifier régulièrement le calendrier d'obsolescence pour toute mise à jour concernant les fonctionnalités qui seront obsolètes et supprimées.

v6.5.1

Date de publication : 27 mars 2023

Nouvelles fonctionnalités et améliorations

Nous travaillons constamment pour améliorer le package UiPath.IntelligentOCR.Activities. Bien que ce correctif n’apporte aucun changement majeur, nous nous sommes assurés d’apporter des améliorations mineures et des correctifs d’accessibilité à notre produit.

V6.6.0

Date de publication : 15 décembre 2022

Nouvelles fonctionnalités et améliorations

La clé API Document Understanding est désormais préremplie pour les activités suivantes : UiPath Document OCR, OCR pour le chinois, le japonais et le coréen, Machine Learning Extractor, Machine Learning Classifier et le gestionnaire de modèles de l’activité Form Extractor.

L'interface utilisateur de Task Capture est désormais disponible en chinois traditionnel.

Vous pouvez désormais bénéficier du pré-remplissage du champ Clé API pour les activités suivantes incluses dans le package UiPath.IntelligentOCR.Activities : Intelligent Keyword Classifier et Form Extractor.

Le menu Raccourcis clavier comprend désormais de nouveaux raccourcis clavier, ajoutés dans une section Accessibilité distincte. Ils sont disponibles pour les activités Présenter la station de validation et Présenter la station de classification.

Résolution de bogues

Correction d'un bogue qui empêchait le remplissage automatique de la clé API lorsque votre jeton d'authentification pour l'instance Orchestrator utilisée avait expiré. L’erreur s’est produite pour les champs de clé API UiPath Document OCR et OCR for Chinese, Japanese, Korean .

V6.5.0

Date de publication : 24 octobre 2022

Nouvelles fonctionnalités et améliorations

De nouveaux objets d’action sont disponibles pour les activités Attendre l’action de classification du document et Reprendre et Attendre l’action de validation du document et Reprendre .

L’activité Numériser le document a été mise à niveau et est désormais livrée avec un moteur OCR présélectionné par défaut, le moteur UiPath Document OCR . En conséquence de ce changement, le package UiPath.OCR.Activities est devenu une dépendance du package UiPath.IntelligentOCR.Activities .

L'activitéNumériser le document a reçu un nouveau paramètre, Detect Checkboxes, qui active la détection de la case à cocher pendant la numérisation du document.

Le niveau de confiance OCR peut être mis à jour individuellement pour un champ sélectionné dans Station de validation.

La conception du filtre de confiance a été mise à jour et des scores de confiance ont été ajoutés au niveau de la table, pour chaque entrée, à la fois pour l'OCR et l'extraction. Vous pouvez désormais vérifier le niveau de confiance d'origine d'un champ qui a été validé manuellement. Les deux valeurs sont disponibles en cliquant sur le niveau de confiance affiché.

Des mises à jour ont été apportées à l'assistant Station de validation . Vous pouvez désormais définir un seuil pour les niveaux de confiance et les trier en fonction de la limite définie.

L'interface de l'assistant Taxonomy Manager a été mise à jour, ce qui la rend encore plus facile à utiliser. Parmi les nouvelles fonctionnalités, citons une option Supprimer ( Delete ) supplémentaire pour tous les groupes, champs, catégories ou l'option Activer/Désactiver les raccourcis clavier .

La détection des cases à cocher est désormais appliquée aux pages PDF natives qui ne contiennent pas de caractères de case à cocher ou de commandes natifs intégrés.

Les capacités de traitement PDF ont fait l'objet d'une mise à jour majeure, notamment la possibilité de traiter du texte vectoriel, la possibilité d'ignorer les objets texte invisibles, des améliorations de la détection des mots, des améliorations du traitement des logos, des correctifs pour les problèmes de duplication de caractères et d'autres améliorations.

L'extraction de texte à partir de fichiers PDF a été mise à niveau, ce qui permet d'optimiser le processus d'extraction, dans lequel le texte natif et scanné est récupéré en même temps, l'OCR n'étant appliqué qu'aux images identifiées dans le fichier PDF. Cette amélioration n'est disponible que lorsque l'option AppliquerOCROnPDF est définie sur Auto.

Le modèle Document Understanding Process Studio a été mis à niveau vers une nouvelle version. Le package UiPath.IntelligentOCR.Activities est une dépendance de ce modèle. Ici, vous pouvez consulter les notes de publication.

Résolution de bogues

  • Correction d’un bogue qui provoquait des erreurs d’extraction lorsque Digitizer était utilisé en mettant à niveau la bibliothèque PDF et en utilisant les fonctionnalités OCR hybrides.
  • Correction d’un bogue survenant lors de l’activité Numériser le document qui provoquait l’extraction de cases à cocher sur certains fichiers PDF, même lorsque l’option DetectCheckboxes était définie sur Faux.
  • Correction d’un bogue survenant dans l’activité Classifier l’étendue du document ( Classify Document Scope) qui renvoyait une erreur vide pour le paramètre documentText lorsque deux classifieurs étaient utilisés dans l’étendue et traitaient un certain document.
  • Lorsqu'un champ de la Station de validation était validé manuellement, le niveau de confiance n'était pas mis à jour à 100 %. Le bogue a été corrigé et le pourcentage du niveau de confiance est désormais mis à jour automatiquement lorsqu'un champ est validé manuellement par l'utilisateur.
  • Correction d'un bogue qui se produisait dans l'assistant Station de classification et le Gestionnaire de taxonomie lorsque le curseur de la souris était déplacé vers la section Affichage du document. Maintenant, tout fonctionne comme prévu.
  • Une erreur s’est produite lorsque la Station de validation a été utilisée en mode texte avec des documents qui incluaient des caractères spéciaux. Le bogue a été corrigé et vous pouvez désormais afficher les documents contenant des caractères spéciaux en mode texte.

8 décembre 2022

Problèmes connus

Le package UiPath.IntelligentOCR.Activities , v6.5.0, ne peut pas être exécuté avec des versions de Studio antérieures à 2021.10.

V6.0.1

Date de sortie : 9 mai 2022

Nouvelles fonctionnalités et améliorations

Nous avons travaillé dur pour donner un nouveau visage à certains de nos assistants. Par conséquent, la Station de validation , la Stationde classificationet le Taxonomy Manager ont désormais tous une toute nouvelle interface très conviviale et présentant de nombreuses nouvelles fonctionnalités.

Certaines des fonctionnalités de Validation Station qui méritent d’être mentionnées sont les scores de confiance affichés pour chaque champ extrait. Ils peuvent être triés par OCR ou Extracteur et vous montrer exactement le score de confiance pour chaque champ extrait. Le score de confiance ne doit être utilisé qu’à titre indicatif. Vous pouvez toujours améliorer ce score en validant manuellement les données.

L'assistant Station de validation comporte également un en-tête redessiné dans la visionneuse PDF à partir duquel vous pouvez choisir de faire glisser la vue du document de gauche à droite, de masquer les jetons extraits pour une vue claire du document ou de visualiser les raccourcis clavier. N'hésitez plus et allez-y, essayez-le !

L'assistant Station de classification se présente avec le même en-tête restylé dans la visionneuse PDF que son homologue, la Station de validation. Ici, vous pouvez également choisir d'afficher le document sur le côté gauche ou droit de l'écran, ou vous pouvez vérifier les raccourcis clavier disponibles. L'option de rotation est également disponible dans le nouvel en-tête, facilitant plus que jamais la manipulation des documents !

L'assistant Taxonomy Manager comporte, entre autres améliorations, une nouvelle option particulièrement utile : une option Supprimer (Delete) disponible dans l'en-tête du type de document qui permet également une suppression en bloc.

Le package UiPath.IntelligentOCR.Activities a été mis à niveau vers .NET5 portable, vous permettant de les exécuter sur des robots Linux.

La taille du MSI d’UiPath Studio a été optimisée et le package UiPath.IntelligentOCR.Activities n’est plus un package de base du MSI UiPath Studio, mais un package facultatif. Toutes les fonctionnalités restent les mêmes. Le seul changement est que vous devez installer manuellement le package dans UiPath Studio.

Les activités Digitize Document et Intelligent Keyword Classifier ont été mises à jour et l’option ForceApplyOCR a été remplacée par l’option ApplyOcrOnPdf . Appliquer l'OCR au PDF propose trois options dans la liste déroulante : True, Falseet Auto. S'il est défini sur True, l'OCR est appliqué à toutes les pages PDF du document, s'il est défini sur False, seul le texte dactylographié numériquement est extrait. La valeur par défaut est Auto, déterminant si le document nécessite l'application de l'algorithme OCR en fonction du document d'entrée.

Dans l'assistant Station de classification , la valeur des groupes Non classé est désormais définie sur N/A.

L’abandon de l’activité Intelligent Form Extractor est prévu pour octobre 2022. Nous vous recommandons d’utiliser l’activité Extracteur de formulaires (Form Extractor) .

L’activité Extracteur de formulaires ( Form Extractor) peut désormais traiter les documents contenant des signatures détectées.

Résolution de bogues

  • Correction d'un bogue survenant dans l'assistant de la station de validation. Certaines polices asiatiques ne s'affichaient pas correctement dans la visionneuse PDF de la Station de validation.
  • Correction d’un bogue survenant lors de l’utilisation de l’activité Numériser le document avec UiPath Studio v19.10 et v20.10. Une erreur a été générée lors de la tentative de traitement de .tiff fichiers. Maintenant, tout fonctionne comme prévu.
  • Correction d'un bogue survenant sur la station de validation lors de l'utilisation de la touche de raccourci TAB. Au lieu d'enregistrer les modifications, la touche TAB rétablissait la valeur précédente du champ. Maintenant, tout fonctionne comme prévu.
  • Correction d’un bogue se produisant sur l’activité Extracteur de formulaires . Un message d'erreur erroné s'affichait lors de l'importation d'un modèle.

Problèmes connus

  • Si vous utilisez un GPU Intel Xe et que Taxonomy Manager, Station de validation (Validation Station) ou Station de classification (Classification Station) ne s'affichent pas correctement, nous vous recommandons de mettre à jour le pilote graphique vers la dernière version. Pour plus d'informations, consultez cette page.

v5.0.2

Date de publication : 19 octobre 2021

Améliorations

Le Taxonomy Manager a fait l'objet d'une refonte complète, avec une interface utilisateur et une expérience utilisateur améliorées. Vous pouvez désormais ajouter des types de documents sans groupe ni catégorie, configurer des couleurs et des raccourcis clavier pour les champs, et bien plus encore. Consultez la documentation pour une description complète.

Le package UiPath.IntelligentOCR.Activities a été mis à niveau vers .NET5. Bien que les deux versions .NET continuent d'être prises en charge, les projets .NET5 ne peuvent fonctionner que sur des architectures 64 bits.

Le processus de numérisation a été amélioré pour l'ensemble de la structure dans Document Understanding et Data Manager.

Des améliorations ont été apportées pour optimiser les résultats de l'OCR sur les documents numérisés. Les meilleurs résultats sont obtenus en maintenant l'angle d'inclinaison entre +/- 20 degrés.

Les dimensions du traitement d'image ont été améliorées pour de meilleurs résultats. Pour qu'une image soit numérisée/traitée avec succès, ses dimensions en largeur et en hauteur doivent être comprises entre 50 et 10 000 pixels. Toute image inférieure ou supérieure à cette plage doit être rejetée, avec un message d'exception. Une image validée avec les dimensions mentionnées précédemment et avec une taille totale supérieure à 14MP doit être réduite à 14 000 pixels, tout en conservant le rapport hauteur/largeur (rapport largeur/hauteur).

Le système de messages d'erreur de la Station de validation a été amélioré et désormais, si l'utilisateur rejette un document, une exception de type DocumentRejectedByUserException est levée et le processus est arrêté.

Amélioration du temps de chargement de la station de validation pour les types de documents comprenant de grandes taxonomies.

Pour les pièces dérivées dans la Station de validation, les nombres avec plus de deux décimales ne sont plus arrondis.

En raison des améliorations apportées aux algorithmes de traitement des images, des changements peuvent apparaître dans la numérisation de certains documents.

Une nouvelle case à cocher a été ajoutée à l'assistant du gestionnaire de modèles , vous permettant de choisir si les synonymes ajoutés sont sensibles à la casse ou non.

Une mise à jour de conception a été apportée à l’assistant du gestionnaire de modèles accessible à partir des activités Intelligent Form Extractor et Form Extractor .

Si vous rencontrez des délais d’attente en raison d’un long délai de traitement, vous pouvez maintenant utiliser le paramètre Délai d’attente nouvellement ajouté pour l’extracteur de formulaire et l’extracteur de formulaire intelligent pour augmenter le délai d’attente d’appel de service.

Si un champ est coché à la fois dans les cases Signature et Manuscrit (Handwritten) dans l'assistant du Gestionnaire de modèles (Template Manager) de l'activité Extracteur de formulaire intelligent (Intelligent Form Extractor), un message contextuel s'affiche pour vous informer qu'un champ ne peut être ajouté que dans une case, pas dans les deux.

L’assistant disponible pour l’activité Intelligent Keyword Classifier a reçu une mise à jour, ce qui signifie qu’un clic sur le bouton OK du message exporté du ou des vecteurs exportés renvoie désormais l’utilisateur à l’assistant au lieu de fermer l’assistant.

Les activités Créer une action de validation de document et Présenter une station de validation ont reçu un nouveau paramètre, ShowOnlyRelevantPageRange. Cela vous permet de configurer l'activité de sorte qu'elle affiche uniquement la plage de pages capturée dans la partie classification du résultat de l'extraction.

Améliorations des performances et de la mémoire dans l’activité Numériser le document .

La référence CefSharp a été mise à jour vers la version 92.0.260.

Résolution de bogues

  • Correction d'un bogue qui se produisait lorsque l'OCR était exécuté sur différents formats de région de système d'exploitation. Désormais, l'OCR s'exécute comme prévu et tous les résultats sont générés correctement, quel que soit le format de la région du système d'exploitation.
  • Correction d’un bogue dans l’activité Exporter les résultats de l’extraction ( Export Extraction Results ) qui supprimait la table extraite lorsqu’un champ était marqué comme écrit à la main. À présent, le résultat de l’extraction entier est exporté comme prévu.
  • Correction d'un problème lié à la station de validation qui provoquait un formatage inattendu des nombres lors de la lecture de la valeur des pièces dérivées.
  • Correction d’un bogue dans l’activité Attendre l’action de validation qui renvoyait une erreur lorsque le paramètre Résultat de l’ extraction automatique (Automatic Extraction Result ) était défini sur vide. À présent, l’activité s’exécute comme prévu, sans aucune erreur.
  • Correction d’un problème qui générait une erreur d’exécution lorsqu’aucun résultat d’extraction n’était fourni à l’activité Présenter la station de validation .
  • Correction d’un problème dans l’activité Digitize Document , qui entraînait le plantage de l’activité lorsque le paramètre ForceApplyOCR était défini sur False.
  • Correction d’un problème dans l’assistant du gestionnaire de modèles qui empêchait l’extraction des données lors de l’utilisation de la sélection de table avec l’ extracteur de formulaires.
  • Correction d’un problème qui empêchait l'extraction des éléments dérivés pour un champ de date lors du traitement d’un document spécifique.
  • Correction d’un problème dans l’assistant du gestionnaire de modèles qui empêchait les ancres d’être mises en surbrillance après avoir marqué une table.
  • Correction d’un problème à cause duquel l’activité Étendue d’ extraction de données (Data Extraction Scope) renvoyait une erreur lorsqu’elle indiquait que les champs de la configuration des extracteurs étaient introuvables dans la taxonomie, bien que les extracteurs aient été supprimés de l’étendue.
  • Correction d’un problème où l’assistant du gestionnaire de modèles générait une erreur lorsqu’il tentait d’enregistrer un modèle avec certains mots ajoutés comme preuve de page.
  • Correction d’un problème qui empêchait l’affichage d’une station de validation vide avec un traitement manuel complet pour la saisie de données lorsque le paramètre AutomaticExtractionResults était null.
  • Correction d'un bogue qui se produisait lorsque des caractères spéciaux étaient inclus dans le nom du fichier ou du compartiment pour l'une des activités suivantes : Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Désormais, tous les caractères spéciaux des noms de fichiers/compartiments sont encodés comme prévu.
  • Correction d’un problème qui empêchait l’extraction des champs de signature et des champs manuscrits en raison du contraste de l’arrière-plan. Désormais, tous les champs sont correctement extraits, quelle que soit la couleur d’arrière-plan.
  • Correction d’un bogue qui faisait que le moteur OCR renvoyait une erreur sur certains systèmes air-gappés.
  • Correction d’un bogue qui fusionnait le contenu extrait lors de l’utilisation de l’activité Numériser le document avec le moteur OCR de document UiPath . Maintenant, chaque élément est extrait séparément.

Problèmes connus

  • Si vous souhaitez utiliser une activité OCR de ce package dans Studio v2019.10, veuillez installer le package UiPath.CoreIPC , version 2.0.1 ou ultérieure.
  • Si vous installez le package UiPath.IntelligentOCR.Activities v5.0.0 sur une machine utilisant Windows N/KN comme système d’exploitation, le package Fonctionnalités multimédias (Media Features) est également requis. Vous trouverez ici les instructions d'installation du package Fonctionnalités multimédias (Media Features).

v4.13.2

Date de publication : 28 mai 2021

Améliorations

Amélioration du temps de chargement de la station de validation pour les types de documents comprenant de grandes taxonomies.

v4.13.1

Date de publication : 16 avril 2021

Améliorations

Si vous rencontrez des délais d’attente en raison d’un long délai de traitement, vous pouvez maintenant utiliser le paramètre Délai d’attente nouvellement ajouté pour l’extracteur de formulaire et l’extracteur de formulaire intelligent pour augmenter le délai d’attente d’appel de service.

v4.13.0

Date de publication : 29 mars 2021

Nouvelles fonctionnalités et améliorations

Extension des capacités de l'Extracteur de formulaires et de l'Extracteur de formulaires intelligents en ajoutant des règles d’extraction basées sur l’ancrage au niveau du champ. Outre les ancres au niveau de la page, les ancres au niveau du champ peuvent désormais être définies dans l'Éditeur de modèles - une nouvelle option permettant de définir les limites d’une zone personnalisée à partir de laquelle les données doivent être extraites. Contrairement aux configurations au niveau de la page, qui définissent les positions de données par rapport à l’ensemble du contenu de la page, les configurations basées sur l’ancrage permettent désormais de cibler l’extraction de données en fonction des configurations au niveau du champ, ce qui permet une plus grande flexibilité.

Améliorations des performances de la Station de validation.

Mise à jour du système de conception de la Station de validation et de la Station de classification pour une meilleure expérience utilisateur.

La Station de validation, la Station de classification et le Gestionnaire de modèle possèdent maintenant un bouton à trois états, dans le côté Vue du document, qui permet aux utilisateurs de choisir entre différents modes d’interaction de documents : Jetons (sélections de mots), Zone personnalisée (sélection de zone) et Choix de la sélection (les utilisateurs peuvent choisir entre les jetons et la zone personnalisée à chaque sélection).

Les interfaces utilisateur, la Station de validation, la Station de classification et le Gestionnaire de modèles ont été améliorés grâce à l'ajout d'un nouveau mode de sélection en vue texte, permettant désormais aux utilisateurs d’effectuer des sélections depuis la version texte d’un document de la même manière qu’en interagissant avec sa version originale. Le nouveau raccourci clavier d+s a également été ajouté, et permet de basculer entre la vue du document d’origine et les modes de vue texte.

Lorsque vous attribuez une valeur à un champ de données, la Station de validation affiche désormais un « rognage » du document d’origine sous la valeur de texte déclaré sélectionnée. Il permet de localiser et de vérifier une valeur de champ spécifique par rapport à la zone de valeur correspondante dans le document.

Modification du calcul de la confiance pour le Classifieur de mots clés intelligents afin qu'il puisse évoluer avec la longueur des vecteurs mots.

Ajout de la case à cocher IncludeOCRConfidence au panneau Propriétés de l’activité Résultats d’extraction à l’exportation (Export Extraction Results). Si elle est cochée, les informations exportées contiendront également la confiance OCR pour chaque valeur.

Amélioration des algorithmes de traitement des lettres et des mots pour éviter de signaler les caractères ou les mots en double dans certaines situations.

Classer la portée du document et Tester l'étendue des classifieurs prennent désormais en charge les capacités du classifieur.

Classer la portée du document a été optimisé afin d'effectuer des appels séquentiels vers les classifieurs dans sa portée, avec seulement les plages de page qui n'ont pas déjà été classifiées par un extracteur précédent.

Résolution de bogues

  • Correction d’un problème qui générait une erreur de temps d’exécution dans des cas spécifiques lorsqu’une activité Extracteur de formulaire (Form Extractor) et une activité Extracteur de formulaire intelligent (Intelligent Form Extractor) se trouvaient dans la même Étendue de l'extraction des données (Data Extraction Scope).
  • Correction d’un problème qui empêchait les erreurs de classifieur d’être générées dans des cas spécifiques, menant à l'absence de notification de l'échec de la classification.
  • Correction d’un problème qui empêchait l'extraction des éléments dérivés pour un champ de nombre lors du traitement d’un document spécifique.
  • Correction d’un problème dans Numériser le document (Digitize Document) qui amenait l’activité à traiter les pages de documents même après le signalement d'une exception, augmentant ainsi le temps d’exécution global pour les cas d’échec.
  • Correction d’un bogue qui ne permettait pas la configuration correcte des expressions Regex dans Regex Based Extractor, dans les projets C# et dans d’autres situations très spécifiques.
  • Correction d’un problème de performances qui apparaissait dans Station de validation et Éditeur de modèles lorsqu’un type de document contenait plus de 200 champs.
  • Correction d’un bogue apparaissant dans certaines situations, où les nombres étaient fusionnés en une seule valeur numérique rapportée.
  • Correction d’un problème apparaissant dans certaines situations et à cause duquel l’activité Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume) générait une exception lorsqu'elle communiquait avec les compartiments de stockage.

Problèmes connus

  • Crée une action de classification de document / Crée une action de validation de document et Attendre l'action de classification des documents et reprendre / Attendre l’action de validation du document et reprendre ne fonctionnent pas avec les compartiments de stockage sur lesquels Accéder aux données depuis Orchestrator a été activé.

v4.10.5

Date de publication : 28 mai 2021

Améliorations

Amélioration du temps de chargement de la station de validation pour les types de documents comprenant de grandes taxonomies.

v4.10.4

Date de publication : 3 février 2021

Améliorations

Amélioration des performances de la station de validation.

v4.10.3

Date de publication : 11 janvier 2021

Améliorations

Amélioration du téléchargement de fichiers à partir des actions Créer une validation de document (Create Document Validation) et Créer une classification de document (Create Document Classification) appliquées au compartiment de stockage hébergé par AWS.

v4.10.2

Date de publication : 12 novembre 2020

Nouvelles fonctionnalités et améliorations

Référence CefSharp mise à jour vers la version 84.4.10.

Points de terminaison mis à jour comme suit :

  • Extracteur de formulaire (Form Extractor) : de https://formextractor.uipath.com à https://du.uipath.com/svc/formextractor
  • Extracteur de formulaires intelligents (Intelligent Form Extractor) : de https://intelligentforms.uipath.com à https://du.uipath.com/svc/intelligentforms
  • Classifieur de mots clés intelligents (Intelligent Keyword Classifier) : de https://intelligentkeywords.uipath.com à https://du.uipath.com/svc/intelligentkeywords

Amélioration apportée à la station de validation en mode de marquage de table.

Résolution de bogues

  • Correction d’un problème de l'Action de classification de document liée à l’expiration du jeton du porteur.

v4.10.1

Date de publication : 20 octobre 2020

Améliorations

Consignation plus détaillée des erreurs des activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier).

Résolution de bogues

  • Amélioration de l’analyse des adresses.
  • Correction d’un problème dans le cadre duquel toutes les compétences ML n’étaient pas utilisables par les activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier).

v4.10.0

Date de publication : 5 octobre 2020

Nouvelles fonctionnalités et améliorations

Nouvelles activités

Cinq nouvelles activités ont été incluses dans le package :

Station de validation

Pour identifier facilement les informations dans la station de validation, des codes couleur ont été ajoutés aux cartes de champ et jetons ou aux zones personnalisées. Chaque carte de champ a par défaut un code couleur, tandis que les jetons ou les zones personnalisées obtiennent le même code couleur que la carte de champ à laquelle ils sont affectés.

De nouveaux raccourcis ont été ajoutés à la station de validation, permettant à l’utilisateur de déplacer une ligne sélectionnée dans une table vers le haut, vers le bas, vers la gauche ou vers la droite. En outre, lorsque des sélections sont faites dans la station de validation, celles-ci peuvent être attribuées à un champ spécifique à l’aide de raccourcis au niveau du champ. Chaque carte de champ a une clé qui lui est associée. Lorsqu’aucune sélection n’est effectuée, vous pouvez utiliser des raccourcis au niveau du champ pour passer d’une carte de champ à une autre.

Pour les champs de table de la station de validation, un point de contrôle au niveau de la ligne a été ajouté. Vous pouvez maintenant vérifier tous les champs d’une ligne en cliquant sur la coche, ou elle sera automatiquement cliquée lorsque vous visiterez tous les champs.

Les jetons de la station de validation ont été mis à jour. Ainsi, les jetons mis en évidence ont une bordure inférieure rouge et les jetons sélectionnés ont une bordure en pointillés.

Les valeurs de champ sans référence sont désormais prises en charge dans la station de validation. Les utilisateurs peuvent attribuer des valeurs à des champs qui n’ont pas de référence dans le document. Pour ce faire, lorsque l’utilisateur crée un champ dans Taxonomy Manager, la case à cocher Requiert une référence (Requires Reference) nécessite d’être décochée.

Station de classification

De nouveaux raccourcis ont été créés pour la station de classification, permettant à l’utilisateur de naviguer à travers les types de documents ; d'ajouter, de modifier, de supprimer ou de mettre en surbrillance la référence ; de déplacer toutes les pages vers le haut ou vers le bas ; de fractionner après la page sélectionnée ; d'ignorer les modifications ; d'enregistrer comme exception.

En plus d’utiliser le menu du type de document, une référence peut maintenant être supprimée au niveau de la page ainsi qu'en pointant au-dessus d’une page et en cliquant sur l’icône bleue dans le coin inférieur droit. L’icône permet également à l’utilisateur de mettre en évidence la référence.

Visionneuse PDF dans la station de classification et la station de validation

Le bouton Rotation (Rotate) a été ajouté à la visionneuse PDF. En cliquant sur le bouton, la page de document actuelle tournera dans le sens des aiguilles d’une montre.

Le mode de sélection est activé par défaut dans la visionneuse PDF.

Autres activités

Les activités Extracteur de formulaires intelligents (Intelligent Form Extractor) et Extracteur de formulaires (Form Extractor) peuvent désormais intégrer des modèles importés qui ont le même nom mais un contenu différent que ceux déjà disponibles. Chaque modèle est analysé et un message d’avertissement est affiché pour chaque cas.

La propriété ActionPriority de l’activité Créer une action de validation de document (Create Document Validation Action) prend désormais en charge les expressions et les variables.

Les conditions BucketFolderPath et DirectoryFolderPath ont été remplacées par BucketDirectoryPath et DownloadDirectoryPath pour l’activité Créer une action de validation de document (Create Document Validation Action) et Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume), respectivement. Le but est d'opérer une distinction claire avec le concept de « Dossier » (Folder) d'Orchestrator.

v4.5.2

Date de publication : 24 août 2020

Résolution de bogues

Correction d’un problème qui, dans certains cas, renvoyait un message d'erreur 407ProxyAuthenticationRequired pour les demandes d’authentification Kerberos ou NTLM. Cela s’applique aux activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier).
  • Correction d’un problème dans le cadre duquel l'activité Extracteur de formulaires intelligents (Intelligent Form Extractor) n'affichait pas correctement une erreur de délai d’attente.
  • Des traductions manquantes ont été ajoutées pour certaines chaînes de station de validation.
  • Correction d’un problème dans le cadre duquel l'activité Étendue de l'extraction de données (Data Extraction Scope) générait une erreur lors de la désélection d’un champ de table.

v4.5.1

Date de publication : 24 juin 2020

Résolution de bogues

  • Correction d’un problème qui causait des problèmes de synchronisation entre la fenêtre de configuration et le panneau Propriétés (Properties) pour l'activité Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume).
  • Correction d’un problème dans le cadre duquel, dans certaines situations, les champs de table étaient enregistrés de manière erronée comme étant à valeurs multiples dans la taxonomie.

V1.3.2

Date de publication : 2 juin 2020

Améliorations

Le package UiPath.IntelligentOCR.Activities a été mis à jour pour référencer la dernière bibliothèque Uipath Vision.

v4.5.0

Date de publication : 4 mai 2020

Nouvelles fonctionnalités et améliorations

Cette version apporte de nombreuses nouvelles activités intéressantes telles que Créer une action de validation de document (Create Document Validation Action) et Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume), qui peuvent être utilisées pour créer, suspendre et reprendre les workflows d’orchestration dans le UiPath Action Center.

Deux nouveaux extracteurs sont là pour vous aider. Vous pouvez les trouver sous le nom de Form Extractor (Extracteur de formulaires) et Intelligent Form Extractor (Intelligent Form Extractor). Les deux activités peuvent extraire des informations de documents à formulaire fixe en fonction de modèles prédéfinis, la différence étant que l' Intelligent Form Extractor peut également être configuré pour interpréter les champs signés ou écrits à la main. Vous pouvez extraire des informations de n'importe quel type de champ, y compris des tables, et créer des règles d'extraction de table personnalisées à l'aide de l'assistant du gestionnaire de modèles .

Lors de l’utilisation de l’activité Extracteur de formulaires intelligents (Intelligent Form Extractor), si le nombre de champs manuscrits peut avoir été dépassé, alors un avertissement est affiché directement dans le workflow. Cela n’empêche pas l’utilisateur d’exécuter le workflow.

L’activité Extracteur basé sur Regex (Regex Based Extractor) a reçu une nouvelle option nommée UseVisualAlignment qui peut être utilisée pour des mises en page complexes, permettant aux utilisateurs d’écrire plus facilement des expressions régulières basées sur la façon dont les mots sont organisés visuellement sur les lignes, ignorant toute phrase, tout paragraphe ou tout groupe de mise en page autrement identifié dans le document.

Vous pouvez définir une expression régulière pour identifier la zone de table, une expression régulière pour identifier une ligne de table dans cette zone, et des expressions régulières pour identifier des colonnes spécifiques dans les lignes de table.

La station de validation actuelle et son assistant sont dotés de nombreuses fonctionnalités nouvelles et améliorées.

L’assistant de la station de validation a maintenant un nouveau bouton nommé Ignorer les modifications (Discard changes). Vous pouvez l’utiliser pour confirmer ou ignorer toute modification apportée à la station de validation. La fonction peut être utilisée sur chaque type de document.

L’assistant dispose également d’une nouvelle option nommée Afficher les suggestions (Show Suggestions) qui vous permet de sélectionner une valeur parmi plusieurs candidats si les extracteurs utilisés rapportent plusieurs valeurs possibles.

La liste des raccourcis disponibles dans la station de validation a été enrichie d’un nouveau raccourci, f+a, vous permettant d’ajouter une nouvelle valeur dans un champ à valeurs multiples.

Des améliorations ont été apportées à l’activité Numériser le document (Digitize Document), qui peut désormais mieux identifier les cases à cocher dans un document.

Cette activité a également une nouvelle option nommée ForceApplyOCR. Lorsqu’elle est sélectionnée, elle applique le moteur OCR à toutes les pages du document, y compris un PDF natif.

L’activité Étendue d’extraction des données ( Data Extraction Scope) peut désormais lire automatiquement les capacités de l’extracteur (taxonomies internes) si l’extracteur les déclare. Cela simplifie l'étape de configuration en exposant les champs connus de l'extracteur. L' extracteur d'apprentissage automatique prend désormais en charge cette nouvelle fonctionnalité, ce qui la rend très facile à utiliser et à configurer.

L'activité Exporter les résultats de l'extraction ( Export Extraction Results ) a reçu une nouvelle option nommée IncludeConfidence. Si cette option est sélectionnée, le niveau de confiance est fourni.

Les assistants d'extraction et de configuration prennent désormais en charge la sélection de champs en bloc pour les types de documents et les champs de table.

V4.0.1

Date de publication : 14 janvier 2020

Résolution de bogues

  • Correction d'un problème qui faisait que l'assistant Station de validation (Validation Station) affichait de manière incorrecte les préférences de table, lors de l'utilisation de l'option Extraire une nouvelle table .
  • Correction d’un problème qui renvoyait une erreur lorsque l’assistant Station de validation était exécuté avec l’activité Légende chaînée avant ou après celle-ci. À présent, l’activité s’exécute comme prévu.
  • Correction d’un problème à cause duquel l’activité Étendue d’extraction des données (Data Extraction Scope ) renvoyait une erreur lorsqu’elle était exécutée avec une culture de machine personnalisée et que l’option FormatValuesIfPossible était sélectionnée. À présent, l’activité s’exécute comme prévu.
  • Correction d’un problème qui entraînait des problèmes de performances lorsque de grandes quantités de texte étaient sélectionnées dans l’option Affichage du texte ( Text View ) de l’assistant Station de validation . À présent, l’option Affichage du texte ( Text View ) affiche le texte comme prévu.
  • Correction d’un problème à cause duquel l’activité Étendue d’extraction des données (Data Extraction Scope) renvoyait une erreur lorsqu’elle était exécutée avec un extracteur sans ensemble de taxonomie interne et qu’un nouveau champ était ajouté dans la taxonomie du projet. À présent, l’activité s’exécute comme prévu.
  • Sur certaines machines, les documents pivotés ne s'affichaient pas correctement lors de l'utilisation de la Station de validation.

v4.0.0

Date de publication : 6 décembre 2019

Changements radicaux

Problèmes connus

  • Le package UiPath.Abbyy.Activities ne peut pas être utilisé avec des versions antérieures à la v19.11 pour le package UiPath.UIAutomation.Activities et antérieures à v4.0.0 pour le package UiPath.IntelligentOCR.Activities.
  • Si vous rencontrez des erreurs de validation d’exécution après la mise à jour d’un workflow vers la nouvelle version UiPath.IntelligentOCR.Activities v4.0.0 et UiPath.Abbyy.Activities v1.0.0, forcez une nouvelle sauvegarde sur le .xaml en effectuant une petite modification, puis en la rétablissant. Cela peut se produire dans les workflows utilisant des activités FlexiCapture.
  • Les workflows créés ou mis à niveau vers UiPath.IntelligentOCR.Activities v4.0.0 ne peuvent pas être rétrogradés vers une version antérieure de UiPath.IntelligentOCR.Activities.

Résolution de bogues

  • Une exception était générée lorsque l’activité Numériser le document était utilisée avec OmniPage OCR pour les documents contenant des caractères spéciaux inclus dans le pack moteur étendu. Le problème a été résolu et l’activité est désormais exécutée comme prévu.

V2.0.2

Date de publication : 25 novembre 2019

Améliorations

Des améliorations des performances ont eu lieu pour le traitement des fichiers dans l'infrastructure de traitement des documents, pour le package UiPath.IntelligentOCR.Activities .

V1.3.1

Date de publication : 25 novembre 2019

Améliorations

Des améliorations des performances ont eu lieu pour le traitement des fichiers dans l'infrastructure de traitement des documents, pour le package UiPath.IntelligentOCR.Activities .

V3.1.0

Date de publication : 8 novembre 2019

Nouvelles fonctionnalités et améliorations

De nouvelles fonctionnalités et améliorations intéressantes vous sont apportées avec cette version.

Une nouvelle activité destinée à vous aider à mieux organiser et gérer vos classifieurs pouvant être formés est disponible : Outil d’apprentissage de classifieur basé sur mot clé (Keyword Based Classifier Trainer). Cette activité ne peut être utilisée qu’avec l’activité Tester l’étendue des classifieurs (Train Classifiers Scope).

L'assistant Station de validation ( Validation Station) a reçu une mise à niveau importante et est maintenant disponible pour que vous puissiez Explore son potentiel au maximum. Cet assistant devient disponible uniquement lorsque l'activité Présenter la station de validation (Present Validation Station) est utilisée dans un workflow. Vous pouvez utiliser la version mise à niveau pour bénéficier d’une nouvelle interface conviviale, naviguer dans le document à l’aide des raccourcis clavier, ou sélectionner un ou plusieurs mots ou une zone personnalisée. Vous pouvez facilement marquer un champ comme manquant, extraire de nouvelles données, modifier une table ou extraire une nouvelle table. Toutes ces choses merveilleuses peuvent être faites avec l'assistant de la station de validation tout en utilisant un thème sombre.

L’une des améliorations incluses dans cette version est que l’activité Classifieur basé sur les mots clés ( Keyword Based Classifier ) a reçu un nouveau paramètre nommé LearningData. En plus de spécifier où se trouvent les données du fichier d'apprentissage, vous pouvez désormais également utiliser la chaîne contenant les données sérialisées du classifieur. Cette activité a été améliorée avec un assistant nommé Gérer l’apprentissage des classifieurs par mots-clés ( Manage Keyword Based Classifier Learning) qui peut être utilisé pour configurer et gérer les mots-clés utilisés pour identifier des types de documents spécifiques.

Les activités Keyword Based Classifier et Keyword Based Classifier Trainer peuvent désormais gérer plusieurs mots clés. Une fois les ensembles de mots clés sélectionnés, l'extraction est basée sur une correspondance complète des mots sélectionnés.

Autre grande amélioration, la sortie DocumentObjectModel , incluse dans l’activité Numériser le document ( Digitize Document ), peut désormais prendre en charge les polygones de mot, en plus des cases de mot horizontales.

L'assistant Taxonomy Manager a reçu une nouvelle barre de défilement qui intègre tous les éléments de l'interface utilisateur et offre une meilleure expérience utilisateur.

Les activités Étendue de l'extraction de données (Data Extraction Scope), Tester l'étendue des extracteurs (Train Extractors Scope), Tester l'étendue des classifieurs (Train Classifier Scope) et Classer la portée du document (Classify Document Scope) organisent maintenant leurs extracteurs et classifieurs dans l’ordre horizontal, remplaçant l’ordre vertical précédent.

L’activité Extracteur basé sur Regex (Regex Based Extractor) a été améliorée et peut désormais traiter et renvoyer des valeurs multiples. La sortie n’est visible que lorsque l’activité est utilisée en même temps que la station de validation (Validation Station).

Quatre nouvelles langues, le turc (TR), le portugais (PT), l’espagnol (ES) et l’espagnol-mexicain (ES-MX) sont disponibles pour le package UiPath.IntelligentOCR.Activities.

Problèmes connus

  • Taxonomy Manager n'est accessible que si vous avez déjà ouvert un fichier .xaml . Si aucun fichier n'est ouvert lorsque vous accédez au Taxonomy Manager, une fenêtre d'enregistrement s'affiche et Taxonomy Manager ne s'affiche qu'après la fermeture de la fenêtre d'enregistrement.

Résolution de bogues

  • Une exception a été générée lors de l’utilisation de l’activité Étendue de l’extraction de données (Data Extraction Scope) ainsi que d’une activité Essayer de capturer (Try Catch). Le problème a été résolu et maintenant l’activité est exécutée comme prévu.
  • Lorsqu'un champ booléen était défini sur Non dans la Station de validation, le fichier de sortie aurait dû afficher le résultat Non , mais l'affiche plutôt comme manquant. Le problème a été résolu et le fichier de sortie affiche désormais le résultat correct.
  • Correction de l'analyse incorrecte des nombres qui se produisait lorsque l'activité Étendue de l' extraction de données (Data Extraction Scope) essayait d'analyser les nombres dans les documents en utilisant un format de nombre différent de celui de la culture du document.
  • Lors de l'utilisation de plusieurs stations de validation, l'ordre des parties dérivées n'était pas respecté dans les résultats validés. Le problème a été résolu et les résultats affichent désormais les pièces dérivées dans le même ordre dans lequel ils ont été introduits.
  • Des différences entre les cases avec une sélection personnalisée se sont produites lorsque les résultats d'une Station de validation ont été exécutés via une deuxième Station de validation. Le problème a été résolu et il n’y a désormais plus de différences entre les boîtes avec sélection personnalisée.
  • Lorsque l'activité Numériser le document ( Digitize Document) était utilisée avec le moteur Microsoft Azure Computer Vision OCR , la rotation ne fonctionnait pas lorsque le paramètre HandwritingRecognition était défini sur True. Le problème a été résolu et les informations sont désormais traitées correctement.
  • Lors de l’utilisation de l’activité Numériser le document ( Digitize Document ), une erreur se produisait en essayant de traiter des images avec beaucoup de texte. Le bogue a été corrigé en améliorant le processus de mise à l’échelle.
  • Correction d’un problème qui générait une erreur en essayant de former l’activité Classifieur basé sur mot clé (Keyword Based Classifier) dans la portée de formation et l’extraction était exécutée sans référence de classification. Le problème a été résolu et maintenant le fait qu’il n’y a pas d’informations d’apprentissage est seulement enregistré, pas généré comme une erreur.
  • Une erreur était générée lors de l’utilisation de l’activité Extracteur FlexiCapture (FlexiCapture Extractor) et le même nom était donné à la fois à une colonne de table et à un champ. Le problème a été résolu et le fichier .fcdot est désormais traité comme prévu.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.