- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
Notes de publication
Date de publication : 26 novembre 2024
Mise à jour du texte explicatif dans l’éditeur de modèle d’extracteur de formulaire afin de mieux refléter le processus de définition des ancres de champ.
Date de publication : 22 octobre 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 3 octobre 2024
Vous pouvez désormais utiliser les activités suivantes dans les activités Classer l’étendue du document (Classify Document Scope) et Étendue de l’extraction de données (Data Extraction Scope), même si le robot est connecté à une installation Orchestrator locale :
- Classifieur génératif
- Extracteur génératif
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
Pour l’activité Étendue de l’extraction de données (Data Extraction Scope) notamment, il est désormais possible d’utiliser des fonctionnalités de validation automatique à partir d’une autre organisation ou d’un autre locataire.
Nous avons ajouté les propriétés URLLocataireRuntime (RuntimeTenantURL) et RessourceInformationsIdentificationRuntime (RuntimeCredentialsAsset) aux activités précédentes. Avec ces propriétés, vous pouvez désormais utiliser directement les informations d'identification des applications externes stockées dans Orchestrator pour accéder aux ressources Document Understanding au moment du runtime. Pour ce faire, assurez-vous que votre locataire sélectionné a activé Document Understanding et que des AI Units ont été affectées.
De plus, dans l’assistant Obtenir des capacités (Get Capabilities) des activités Classifieur de projet Document Understanding (Document Understanding Project Extractor) et Extracteur de projet Document Understanding (Document Understanding Project Extractor), nous avons inclus des propriétés telles que ID de l’application (App Id), Clé secrète de l’application (App Secret) et URLLocataire (TenantUrl). Ces propriétés facilitent l’accès aux ressources de différentes organisations et locataires pendant la phase de conception.
Le package IntelligentOCR.Activities permet désormais la consommation de projets Document Understanding modernes, grâce à un nouvel ensemble d’activités centrées sur l’utilisation de projets modernes. Vous disposez désormais des activités suivantes pour utiliser vos projets et versions Document Understanding modernes :
- Classifieur de projet Document Understanding utilisé dans une activité Classer l'étendue du document (Classify Document Scope).
- Extracteur de projet Document Understanding (Document Understanding Project Extractor) utilisé dans une activité Étendue de l'extraction de données (Data Extraction Scope).
Améliorez la capacité de vos projets à traiter des documents en utilisant l’outil UiPath Extended Languages OCR, qui affiche désormais une disponibilité générale.
- Résolution d’un problème où l’erreur « La longueur du texte est de zéro » (Text length is zero) survenait lorsque le classifieur basé sur clavier (Keyboard - Based Classifier) et le classifieur de clavier intelligent (Intelligent Keyboard Classifier) étaient activés pour le même type de document.
- L’extracteur ML renvoyait des valeurs vides, ce qui entraînait l’échec des tâches de validation en raison de propriétés de valeur nulle.
- Les valeurs de champ ajoutées manuellement dans la station de validation d’Action Center n’étaient pas formatées conformément à la taxonomie. De ce fait, les résultats exportés affichaient des données incorrectes.
- Résolution d’un problème qui vous empêchait de marquer des tables dans les fichiers image de la station de validation.
L'OCR UiPath pour le chinois, le japonais et le coréen sera obsolète à partir de janvier 2025. Nous recommandons d'utiliser plutôt UiPath Extended Languages OCR. Consultez le calendrier d'obsolescence pour plus d'informations sur les obsolescences et les suppressions à venir.
Date de publication : 13 août 2024
Nous avons mis à niveau certaines dépendances internes pour améliorer les performances.
Date de publication : 31 juillet 2024
- La tentative de numérisation d’un certain contenu de fichier générait une exception « System.InvalidOperation » ainsi que le message « Complétion » (Fullity) pendant l’activité Numériser le document (Digitize Document).
- Lors de l'utilisation des activités Classifieur génératif (Generative Classifier) et Extracteur génératif (Generative Extractor), la saisie d'une invite qui commençait ou se terminait par des espaces blancs générait une erreur "KeyNotFoundException" avec le message "La clé donnée n'était pas présente dans le dictionnaire".
Date de publication : 29 juillet 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 29 juillet 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 20 juin 2024
Nous travaillons constamment pour améliorer votre expérience UiPath Document Understanding. Bien que cette version n’apporte aucun changement majeur, nous nous sommes assurés d’apporter des améliorations mineures et des correctifs d’accessibilité à notre produit.
Date de publication : 5 juin 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 27 mai 2024
- Résolution d’un problème où l’erreur « La longueur du texte est de zéro » était rencontrée lorsque le classifieur basé sur le clavier et le classifieur de clavier intelligent étaient activés pour le même type de document.
- L’extracteur ML renvoyait des valeurs vides, ce qui entraînait l’échec des tâches de validation en raison de propriétés de valeur nulle.
Date de publication : 29 avril 2024
Ces notes de publication contiennent toutes les mises à jour effectuées entre novembre 2023 et mars 2024.
Notes du validateur
Vous pouvez maintenant activer les Notes du Validateur pour chaque champ du Gestionnaire de taxonomie. Lorsque cette option est activée, vous pouvez définir des notes sur ces champs, et elles s'affichent pour le validateur humain. Si les notes sont définies comme modifiables, le validateur peut les modifier et communiquer des informations avec l'automatisation, via une nouvelle propriété d'objet ExtractionResult .
Validation générative pour l'étendue d'extraction de données
Vous pouvez utiliser la validation générative pour l'activité Étendue de l'extraction de données (Data Extraction Scope) pour ajuster la confiance à l'aide de la vérification croisée de l'extraction générative. Consultez les propriétés AppliquerAutoValidation et AutoValidationConfidenceThreshold dans l'activité Étendue de l'extraction de données (Data Extraction Scope).
- L'installation du package UiPath.IntelligentOCR.Activities installe automatiquement le package UiPath.DocumentUnderstanding.ML.Activities . Vous n'avez pas besoin de l'installer séparément.
- Correction d'un problème où la police japonaise n'était pas reconnue lors de la conversion en JPG.
- Correction d’un problème dans lequel l’ordre des nombres était inversé en hébreu dans la station de validation.
- Correction d'un problème lié à l'extraction de valeurs de texte bidirectionnelles (de gauche à droite et de droite à gauche), ce qui provoquait un mauvais ordre pour les symboles de ponctuation.
Un problème connu existe lors de l'utilisation du modèle de processus Document Understanding version 2022.10.2 dans Studio 2023.4.4 sur un projet Windows. L'ouverture du Gestionnaire de taxonomie entraîne une erreur indiquant que vous devez installer les infrastructures .NET manquantes. Que vous choisissiez d'installer .NET ou non, un autre message d'erreur suit : « La communication entre UiPath Studio et Taxonomy Manager s'est terminée de manière inattendue ».
Solution: installez manuellement le runtime .NET 6.0.
Date de publication : 24 octobre 2023
- Present Validation Station
- Create Document Validation Action
- Form Extractor
- Intelligent Keyword Classifier
L’activité Numériser le document (Digitize Document) peut désormais détecter les boutons radio PDF natifs.
Les capacités de détection du type de contenu de l'activité Numériser le document (Digitize Document) ont été améliorées.
Taxonomy Manager permet désormais de définir plusieurs expressions mathématiques dans les règles métier.
Date de publication : 19 septembre 2023
You are not authorized
lors de la reprise d'une tâche une fois la validation du document terminée sur Action Center.
Date de publication : 28 août 2023
Nous avons corrigé un bogue qui ralentissait la Station de validation lorsque les documents contenaient des tableaux volumineux.
Date de publication : 8 juin 2023
Nous avons corrigé un bogue qui provoquait des incohérences au niveau des valeurs formatées lorsque le montant était négatif.
Date de publication : 7 juin 2023
Une nouvelle option est disponible lors de l’utilisation de l’activité Extracteur de formulaires (Form Extractor), Envoyer des documents pour des améliorations d’algorithmes(Send documents for algorithm activities) , vous permettant d’activer ou de désactiver l’option avant d’exécuter le workflow. La valeur par défaut est enabled.
Nous avons corrigé des bogues mineurs et des corrections d'accessibilité dans l'ensemble du package UiPath.IntelligentOCR.Activities.
Date de publication : 19 septembre 2023
You are not authorized
lors de la reprise d'une tâche une fois la validation du document terminée sur Action Center.
Date de publication : 7 juin 2023
Nous travaillons constamment pour améliorer votre expérience UiPath Document Understanding. Bien que cette version n’apporte aucun changement majeur, nous nous sommes assurés d’apporter des améliorations mineures et des correctifs d’accessibilité à notre produit.
Date de publication : 2 mai 2023
Nous avons corrigé un bogue provoquant le plantage de l’activité Étendue de l’extraction de données (Data Extraction Scope) lorsque l’extraction est terminée sur tous les sous-documents sauf le premier. Cela se produisait lorsqu'un classifieur était utilisé pour effectuer le fractionnement de documents et que plusieurs résultats de classification étaient renvoyés par Classer l'étendue du document (Classify Document Scope).
Date de publication : 26 avril 2023
- UiPath Document OCR est le nouveau moteur OCR par défaut pour les activités suivantes : Classifieur de mots clés intelligents (Intelligent Kawword Classifier), Outil d'extraction de formulaires (Form Extractor)
- Nous avons ajouté une fonctionnalité de nouvelle tentative aux activités Attendre les actions de validation du document ( Wait for Document Validation Actions) et Attendre les actions de classification du document ( Wait for Document Classification Actions) . Vous pouvez utiliser la nouvelle option Réessayer (Retry) et la définir sur Activé (Enabled)/Désactivé (Disabled), la valeur par défaut étant Activé (Enabled). Si activé, les appels HTTP seront retentés en cas d’échec.
- Le package UiPath.IntelligentOCR.Activities peut désormais être utilisé avec des langues écrites de droite à gauche.
- La précision de l’extraction de l’activité Extracteur de formulaires (Form Extractor) a été améliorée en incluant les informations de correspondance des pages dans l’algorithme d’extraction.
- Nous avons mis à jour la conception des règles de champ qui peuvent être définies dans Taxonomy Manager.
- Vous pouvez désormais appliquer des expressions mathématiques aux règles de champ à l'aide de l'assistant Taxonomy Manager de l'activité Charger la taxonomie (Load taxonomy).
- L'assistant de la station de validation a été mis à jour, vous permettant de voir les règles appliquées aux champs. De plus, lorsqu'un champ est mis à jour manuellement, la règle de champ est également mise à jour automatiquement.
- L’activité Numériser le document (Digitize Document) a été améliorée et consomme désormais moins de mémoire système.
- Les widgets de tampon sont désormais numérisés dans les fichiers PDF natifs.
- La prise en charge des fichiers PDF a été améliorée pour l’activité Numériser le document.
Erratum de septembre 2023 : des fonctionnalités avancées de fractionnement sont disponibles pour l'activité Classifieur de mots-clés intelligents (Intelligent Keyword Classifier).
- Nous avons mis à jour les dépendances du package et corrigé l’erreur Méthode introuvable ( Method not found ) générée lorsqu’une activité Appeler le code (Invoke Code) était ajoutée au workflow.
- Nous avons corrigé un bogue qui empêchait le remplissage automatique de la clé API lorsque votre jeton d'authentification pour l'instance Orchestrator utilisée avait expiré. L’erreur s’est produite à la fois pour UiPath Document OCR et pour l’OCR pour le chinois, le japonais et le coréen .
Nous vous recommandons de vérifier régulièrement le calendrier d'obsolescence pour toute mise à jour concernant les fonctionnalités qui seront obsolètes et supprimées.
Date de publication : 27 mars 2023
Nous travaillons constamment pour améliorer le package UiPath.IntelligentOCR.Activities. Bien que ce correctif n’apporte aucun changement majeur, nous nous sommes assurés d’apporter des améliorations mineures et des correctifs d’accessibilité à notre produit.
Date de publication : 15 décembre 2022
- La clé API Document Understanding est désormais préremplie pour les activités suivantes : UiPath Document OCR, OCR pour le chinois, le japonais et le coréen, Machine Learning Extractor, Machine Learning Classifier et le gestionnaire de modèles de l’activité Form Extractor.
- L'interface utilisateur de Task Capture est désormais disponible en chinois traditionnel.
- Vous pouvez désormais bénéficier du pré-remplissage du champ Clé API pour les activités suivantes incluses dans le package UiPath.IntelligentOCR.Activities : Intelligent Keyword Classifier et Form Extractor.
- Le menu Raccourcis clavier comprend désormais de nouveaux raccourcis clavier, ajoutés dans une section Accessibilité distincte. Ils sont disponibles pour les activités Présenter la station de validation et Présenter la station de classification.
Date de publication : 24 octobre 2022
- De nouveaux objets d’action sont disponibles pour les activités Attendre l’action de classification du document et Reprendre et Attendre l’action de validation du document et Reprendre .
- L’activité Numériser le document a été mise à niveau et est désormais livrée avec un moteur OCR présélectionné par défaut, le moteur UiPath Document OCR . En conséquence de ce changement, le package UiPath.OCR.Activities est devenu une dépendance du package UiPath.IntelligentOCR.Activities .
- Un nouveau paramètre,
Detect Checkboxes
, q été ajouté à l’activité Numériser le document (Digitize Document). Celui-ci permet de détecter des cases à cocher pendant que le document est numérisé. - Le niveau de confiance OCR peut être mis à jour individuellement pour un champ sélectionné dans Station de validation.
- La conception du filtre de confiance a été mise à jour et des scores de confiance ont été ajoutés au niveau de la table, pour chaque entrée, à la fois pour l'OCR et l'extraction. Vous pouvez désormais vérifier le niveau de confiance d'origine d'un champ qui a été validé manuellement. Les deux valeurs sont disponibles en cliquant sur le niveau de confiance affiché.
- Des mises à jour ont été apportées à l'assistant Station de validation . Vous pouvez désormais définir un seuil pour les niveaux de confiance et les trier en fonction de la limite définie.
- L'interface de l'assistant Taxonomy Manager a été mise à jour, ce qui la rend encore plus facile à utiliser. Parmi les nouvelles fonctionnalités, citons une option Supprimer ( Delete ) supplémentaire pour tous les groupes, champs, catégories ou l'option Activer/Désactiver les raccourcis clavier .
- La détection des cases à cocher est désormais appliquée aux pages PDF natives qui ne contiennent pas de caractères de case à cocher ou de commandes natifs intégrés.
- Les capacités de traitement PDF ont fait l'objet d'une mise à jour majeure, notamment la possibilité de traiter du texte vectoriel, la possibilité d'ignorer les objets texte invisibles, des améliorations de la détection des mots, des améliorations du traitement des logos, des correctifs pour les problèmes de duplication de caractères et d'autres améliorations.
- L'extraction de texte à partir de fichiers PDF a été mise à niveau, ce qui permet d'optimiser le processus d'extraction, dans lequel le texte natif et scanné est récupéré en même temps, l'OCR n'étant appliqué qu'aux images identifiées dans le fichier PDF. Cette amélioration n'est disponible que lorsque l'option AppliquerOCROnPDF est définie sur Auto.
- Le modèle Document Understanding Process Studio a été mis à niveau vers une nouvelle version. Le package UiPath.IntelligentOCR.Activities est une dépendance de ce modèle.
- Correction d’un bogue qui provoquait des erreurs d’extraction lorsque Digitizer était utilisé en mettant à niveau la bibliothèque PDF et en utilisant les fonctionnalités OCR hybrides.
- Correction d’un bogue survenant lors de l’activité Numériser le document qui provoquait l’extraction de cases à cocher sur certains fichiers PDF, même lorsque l’option
DetectCheckboxes
était définie sur Faux. - Correction d’un bogue survenant dans l’activité Classifier l’étendue du document ( Classify Document Scope) qui renvoyait une erreur vide pour le paramètre
documentText
lorsque deux classifieurs étaient utilisés dans l’étendue et traitaient un certain document. - Lorsqu'un champ de la Station de validation était validé manuellement, le niveau de confiance n'était pas mis à jour à 100 %. Le bogue a été corrigé et le pourcentage du niveau de confiance est désormais mis à jour automatiquement lorsqu'un champ est validé manuellement par l'utilisateur.
- Correction d'un bogue qui se produisait dans l'assistant Station de classification et le Gestionnaire de taxonomie lorsque le curseur de la souris était déplacé vers la section Affichage du document. Maintenant, tout fonctionne comme prévu.
- Une erreur s’est produite lorsque la Station de validation a été utilisée en mode texte avec des documents qui incluaient des caractères spéciaux. Le bogue a été corrigé et vous pouvez désormais afficher les documents contenant des caractères spéciaux en mode texte.
Date de sortie : 9 mai 2022
- Nous avons travaillé dur pour donner un nouveau visage à certains de nos assistants. Par conséquent, la Station de validation , la Stationde classificationet le Taxonomy Manager ont désormais tous une toute nouvelle interface très conviviale et présentant de nombreuses nouvelles fonctionnalités.
- Certaines des fonctionnalités de Validation Station qui méritent d’être mentionnées sont les scores de confiance affichés pour chaque champ extrait. Ils peuvent être triés par OCR ou Extracteur et vous montrer exactement le score de confiance pour chaque champ extrait. Le score de confiance ne doit être utilisé qu’à titre indicatif. Vous pouvez toujours améliorer ce score en validant manuellement les données.
- L’assistant de la station de validation dispose également d’un nouvel en-tête dans la visionneuse PDF, à partir duquel vous pouvez choisir de faire passer la vue du document de la gauche vers la droite, masquer les jetons extraits pour améliorer la vue du document, ou encore visualiser les raccourcis clavier. N’hésitez plus, essayez-le !
- L’assistant de la station de classification se présente dans la visionneuse PDF avec le même en-tête reconfiguré que la station de validation, son homologue. Vous pouvez également choisir d’afficher ici le document sur le côté gauche ou droit de l’écran, ou bien découvrir les raccourcis clavier disponibles. L’option de rotation est également disponible dans le nouvel en-tête afin de rendre la manipulation des documents plus facile que jamais.
- L'assistant Taxonomy Manager comporte, entre autres améliorations, une nouvelle option particulièrement utile : une option Supprimer (Delete) disponible dans l'en-tête du type de document qui permet également une suppression en bloc.
- Le package UiPath.IntelligentOCR.Activities a été mis à niveau vers .NET5 portable, vous permettant de les exécuter sur des robots Linux.
- La taille du MSI d’UiPath Studio a été optimisée et le package UiPath.IntelligentOCR.Activities n’est plus un package de base du MSI UiPath Studio, mais un package facultatif. Toutes les fonctionnalités restent les mêmes. Le seul changement est que vous devez installer manuellement le package dans UiPath Studio.
- Les activités Digitize Document et Intelligent Keyword Classifier ont été mises à jour et l’option ForceApplyOCR a été remplacée par l’option ApplyOcrOnPdf . Appliquer l'OCR au PDF propose trois options dans la liste déroulante : True, Falseet Auto. S'il est défini sur True, l'OCR est appliqué à toutes les pages PDF du document, s'il est défini sur False, seul le texte dactylographié numériquement est extrait. La valeur par défaut est Auto, déterminant si le document nécessite l'application de l'algorithme OCR en fonction du document d'entrée.
- Dans l'assistant Station de classification , la valeur des groupes Non classé est désormais définie sur N/A.
- L’abandon de l’activité Intelligent Form Extractor est prévu pour octobre 2022. Nous vous recommandons d’utiliser l’activité Extracteur de formulaires (Form Extractor) .
- L’activité Extracteur de formulaires ( Form Extractor) peut désormais traiter les documents contenant des signatures détectées.
- Correction d'un bogue survenant dans l'assistant de la station de validation. Certaines polices asiatiques ne s'affichaient pas correctement dans la visionneuse PDF de la Station de validation.
- Correction d’un bogue survenant lors de l’utilisation de l’activité Numériser le document avec UiPath Studio v19.10 et v20.10. Une erreur a été générée lors de la tentative de traitement de
.tiff
fichiers. Maintenant, tout fonctionne comme prévu. - Correction d'un bogue survenant sur la station de validation lors de l'utilisation de la touche de raccourci TAB. Au lieu d'enregistrer les modifications, la touche TAB rétablissait la valeur précédente du champ. Maintenant, tout fonctionne comme prévu.
- Correction d’un bogue se produisant sur l’activité Extracteur de formulaires . Un message d'erreur erroné s'affichait lors de l'importation d'un modèle.
Date de publication : 19 octobre 2021
- Le Taxonomy Manager a fait l'objet d'une refonte complète, avec une interface utilisateur et une expérience utilisateur améliorées. Vous pouvez désormais ajouter des types de documents sans groupe ni catégorie, configurer des couleurs et des raccourcis clavier pour les champs, et bien plus encore. Consultez la documentation pour une description complète.
- Le package UiPath.IntelligentOCR.Activities a été mis à niveau vers .NET5. Bien que les deux versions .NET continuent d'être prises en charge, les projets .NET5 ne peuvent fonctionner que sur des architectures 64 bits.
- Le processus de numérisation a été amélioré pour l'ensemble de la structure dans Document Understanding et Data Manager.
- Des améliorations ont été apportées pour optimiser les résultats de l'OCR sur les documents numérisés. Les meilleurs résultats sont obtenus en maintenant l'angle d'inclinaison entre +/- 20 degrés.
- Les dimensions du traitement d'image ont été améliorées pour de meilleurs résultats. Pour qu'une image soit numérisée/traitée avec succès, ses dimensions en largeur et en hauteur doivent être comprises entre 50 et 10 000 pixels. Toute image inférieure ou supérieure à cette plage doit être rejetée, avec un message d'exception. Une image validée avec les dimensions mentionnées précédemment et avec une taille totale supérieure à 14MP doit être réduite à 14 000 pixels, tout en conservant le rapport hauteur/largeur (rapport largeur/hauteur).
- Le système de messages d'erreur de la Station de validation a été amélioré et désormais, si l'utilisateur rejette un document, une exception de type
DocumentRejectedByUserException
est levée et le processus est arrêté. - Amélioration du temps de chargement de la station de validation pour les types de documents comprenant de grandes taxonomies.
- Pour les pièces dérivées dans la Station de validation, les nombres avec plus de deux décimales ne sont plus arrondis.
- En raison des améliorations apportées aux algorithmes de traitement des images, des changements peuvent apparaître dans la numérisation de certains documents.
- Une nouvelle case à cocher a été ajoutée à l’assistant du gestionnaire de modèles, qui vous permet de choisir si les synonymes ajoutés sont sensibles à la casse ou non.
- Une mise à jour de conception a été apportée à l’assistant du gestionnaire de modèles accessible à partir des activités Intelligent Form Extractor et Form Extractor .
- Si vous rencontrez des délais d’attente en raison d’un long délai de traitement, vous pouvez maintenant utiliser le paramètre Délai d’attente nouvellement ajouté pour l’extracteur de formulaire et l’extracteur de formulaire intelligent pour augmenter le délai d’attente d’appel de service.
- Si un champ est coché à la fois dans les cases Signature et Manuscrit (Handwritten) dans l'assistant du Gestionnaire de modèles (Template Manager) de l'activité Extracteur de formulaire intelligent (Intelligent Form Extractor), un message contextuel s'affiche pour vous informer qu'un champ ne peut être ajouté que dans une case, pas dans les deux.
- L’assistant disponible pour l’activité Intelligent Keyword Classifier a reçu une mise à jour, ce qui signifie qu’un clic sur le bouton OK du message exporté du ou des vecteurs exportés renvoie désormais l’utilisateur à l’assistant au lieu de fermer l’assistant.
- Les activités Créer une action de validation de document et Présenter une station de validation ont reçu un nouveau paramètre, ShowOnlyRelevantPageRange. Cela vous permet de configurer l'activité de sorte qu'elle affiche uniquement la plage de pages capturée dans la partie classification du résultat de l'extraction.
- Améliorations des performances et de la mémoire dans l’activité Numériser le document .
- La référence CefSharp a été mise à jour vers la version 92.0.260.
- Correction d'un bogue qui se produisait lorsque l'OCR était exécuté sur différents formats de région de système d'exploitation. Désormais, l'OCR s'exécute comme prévu et tous les résultats sont générés correctement, quel que soit le format de la région du système d'exploitation.
- Correction d’un bogue dans l’activité Exporter les résultats de l’extraction ( Export Extraction Results ) qui supprimait la table extraite lorsqu’un champ était marqué comme écrit à la main. À présent, le résultat de l’extraction entier est exporté comme prévu.
- Correction d'un problème lié à la station de validation qui provoquait un formatage inattendu des nombres lors de la lecture de la valeur des pièces dérivées.
- Correction d’un bogue dans l’activité Attendre l’action de validation qui renvoyait une erreur lorsque le paramètre Résultat de l’ extraction automatique (Automatic Extraction Result ) était défini sur vide. À présent, l’activité s’exécute comme prévu, sans aucune erreur.
- Correction d’un problème qui générait une erreur d’exécution lorsqu’aucun résultat d’extraction n’était fourni à l’activité Présenter la station de validation .
- Correction d’un problème dans l’activité Digitize Document , qui entraînait le plantage de l’activité lorsque le paramètre ForceApplyOCR était défini sur False.
- Correction d’un problème dans l’assistant du gestionnaire de modèles qui empêchait l’extraction des données lors de l’utilisation de la sélection de table avec l’ extracteur de formulaires.
- Correction d’un problème qui empêchait l'extraction des éléments dérivés pour un champ de date lors du traitement d’un document spécifique.
- Correction d’un problème dans l’assistant du gestionnaire de modèles qui empêchait les ancres d’être mises en surbrillance après avoir marqué une table.
- Correction d’un problème à cause duquel l’activité Étendue d’ extraction de données (Data Extraction Scope) renvoyait une erreur lorsqu’elle indiquait que les champs de la configuration des extracteurs étaient introuvables dans la taxonomie, bien que les extracteurs aient été supprimés de l’étendue.
- Correction d’un problème où l’assistant du gestionnaire de modèles générait une erreur lorsqu’il tentait d’enregistrer un modèle avec certains mots ajoutés comme preuve de page.
- Correction d’un problème qui empêchait l’affichage d’une station de validation vide avec un traitement manuel complet pour la saisie de données lorsque le paramètre AutomaticExtractionResults était null.
- Correction d'un bogue qui se produisait lorsque des caractères spéciaux étaient inclus dans le nom du fichier ou du compartiment pour l'une des activités suivantes : Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Désormais, tous les caractères spéciaux des noms de fichiers/compartiments sont encodés comme prévu.
- Correction d’un problème qui empêchait l’extraction des champs de signature et des champs manuscrits en raison du contraste de l’arrière-plan. Désormais, tous les champs sont correctement extraits, quelle que soit la couleur d’arrière-plan.
- Correction d’un bogue qui faisait que le moteur OCR renvoyait une erreur sur certains systèmes air-gappés.
- Correction d’un bogue qui fusionnait le contenu extrait lors de l’utilisation de l’activité Numériser le document avec le moteur OCR de document UiPath . Maintenant, chaque élément est extrait séparément.
- Si vous souhaitez utiliser une activité OCR de ce package dans Studio v2019.10, veuillez installer le package UiPath.CoreIPC , version 2.0.1 ou ultérieure.
- Si vous installez le package UiPath.IntelligentOCR.Activities v5.0.0 sur une machine utilisant Windows N/KN comme système d’exploitation, le package Fonctionnalités multimédias (Media Features) est également requis. Consultez la Liste du package de fonctionnalités multimédias pour les éditions Windows N afin d’obtenir les instructions d’installation du package de fonctionnalités multimédias.
Date de publication : 16 avril 2021
Si vous rencontrez des délais d’attente en raison d’un long délai de traitement, vous pouvez maintenant utiliser le paramètre Délai d’attente nouvellement ajouté pour l’extracteur de formulaire et l’extracteur de formulaire intelligent pour augmenter le délai d’attente d’appel de service.
Date de publication : 29 mars 2021
- Extension des capacités de l'Extracteur de formulaires et de l'Extracteur de formulaires intelligents en ajoutant des règles d’extraction basées sur l’ancrage au niveau du champ. Outre les ancres au niveau de la page, les ancres au niveau du champ peuvent désormais être définies dans l'Éditeur de modèles - une nouvelle option permettant de définir les limites d’une zone personnalisée à partir de laquelle les données doivent être extraites. Contrairement aux configurations au niveau de la page, qui définissent les positions de données par rapport à l’ensemble du contenu de la page, les configurations basées sur l’ancrage permettent désormais de cibler l’extraction de données en fonction des configurations au niveau du champ, ce qui permet une plus grande flexibilité.
- Améliorations des performances de la Station de validation.
- Mise à jour du système de conception de la Station de validation et de la Station de classification pour une meilleure expérience utilisateur.
- La Station de validation, la Station de classification et le Gestionnaire de modèle possèdent maintenant un bouton à trois états, dans le côté Vue du document, qui permet aux utilisateurs de choisir entre différents modes d’interaction de documents : Jetons (sélections de mots), Zone personnalisée (sélection de zone) et Choix de la sélection (les utilisateurs peuvent choisir entre les jetons et la zone personnalisée à chaque sélection).
- Les interfaces utilisateur, la Station de validation, la Station de classification et le Gestionnaire de modèles ont été améliorés grâce à l'ajout d'un nouveau mode de sélection en vue texte, permettant désormais aux utilisateurs d’effectuer des sélections depuis la version texte d’un document de la même manière qu’en interagissant avec sa version originale. Le nouveau raccourci clavier d+s a également été ajouté, et permet de basculer entre la vue du document d’origine et les modes de vue texte.
- Lorsque vous attribuez une valeur à un champ de données, la Station de validation affiche désormais un « rognage » du document d’origine sous la valeur de texte déclaré sélectionnée. Il permet de localiser et de vérifier une valeur de champ spécifique par rapport à la zone de valeur correspondante dans le document.
- Modification du calcul de la confiance pour le Classifieur de mots clés intelligents afin qu'il puisse évoluer avec la longueur des vecteurs mots.
- Ajout de la case à cocher IncludeOCRConfidence au panneau Propriétés de l’activité Résultats d’extraction à l’exportation (Export Extraction Results). Si elle est cochée, les informations exportées contiendront également la confiance OCR pour chaque valeur.
- Amélioration des algorithmes de traitement des lettres et des mots pour éviter de signaler les caractères ou les mots en double dans certaines situations.
- Classer la portée du document et Tester l'étendue des classifieurs prennent désormais en charge les capacités du classifieur.
- Classer la portée du document a été optimisé afin d'effectuer des appels séquentiels vers les classifieurs dans sa portée, avec seulement les plages de page qui n'ont pas déjà été classifiées par un extracteur précédent.
- Correction d’un problème qui générait une erreur de temps d’exécution dans des cas spécifiques lorsqu’une activité Extracteur de formulaire (Form Extractor) et une activité Extracteur de formulaire intelligent (Intelligent Form Extractor) se trouvaient dans la même Étendue de l'extraction des données (Data Extraction Scope).
- Correction d’un problème qui empêchait les erreurs de classifieur d’être générées dans des cas spécifiques, menant à l'absence de notification de l'échec de la classification.
- Correction d’un problème qui empêchait l'extraction des éléments dérivés pour un champ de nombre lors du traitement d’un document spécifique.
- Correction d’un problème dans Numériser le document (Digitize Document) qui amenait l’activité à traiter les pages de documents même après le signalement d'une exception, augmentant ainsi le temps d’exécution global pour les cas d’échec.
- Correction d’un bogue qui ne permettait pas la configuration correcte des expressions Regex dans Regex Based Extractor, dans les projets C# et dans d’autres situations très spécifiques.
- Correction d’un problème de performances qui apparaissait dans Station de validation et Éditeur de modèles lorsqu’un type de document contenait plus de 200 champs.
- Correction d’un bogue apparaissant dans certaines situations, où les nombres étaient fusionnés en une seule valeur numérique rapportée.
- Correction d’un problème apparaissant dans certaines situations et à cause duquel l’activité Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume) générait une exception lorsqu'elle communiquait avec les compartiments de stockage.
Date de publication : 11 janvier 2021
Date de publication : 12 novembre 2020
- Référence CefSharp mise à jour vers la version 84.4.10.
- Points de terminaison mis à jour comme suit :
- Extracteur de formulaire (Form Extractor) : de
https://formextractor.uipath.com
àhttps://du.uipath.com/svc/formextractor
- Extracteur de formulaires intelligents (Intelligent Form Extractor) : de
https://intelligentforms.uipath.com
àhttps://du.uipath.com/svc/intelligentforms
- Classifieur de mots clés intelligents (Intelligent Keyword Classifier) : de
https://intelligentkeywords.uipath.com
àhttps://du.uipath.com/svc/intelligentkeywords
- Extracteur de formulaire (Form Extractor) : de
- Amélioration apportée à la station de validation en mode de marquage de table.
Date de publication : 20 octobre 2020
Consignation plus détaillée des erreurs des activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier).
- Amélioration de l’analyse des adresses.
- Correction d’un problème dans le cadre duquel toutes les compétences ML n’étaient pas utilisables par les activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier).
Date de publication : 5 octobre 2020
Nouvelles activités
Les activités suivantes ont été incluses dans le package :
- Station de classification actuelle - conçue pour classer et séparer les fichiers en fonction du type de document.
- Créer des Actionsde classification de documents et attendre la classification des documents et reprendre ( Wait for Document Classification and Resume ) - conçu pour l'intégration avec Orchestrator.
- Classifieur de mots clés intelligents et entraîneur de classifieurs de mots clés intelligents - conçus pour classer, diviser et entraîner des packages de documents en types de documents individuels.
Station de validation
Pour identifier facilement les informations dans la station de validation, des codes couleur ont été ajoutés aux cartes de champ et jetons ou aux zones personnalisées. Chaque carte de champ a par défaut un code couleur, tandis que les jetons ou les zones personnalisées obtiennent le même code couleur que la carte de champ à laquelle ils sont affectés.
De nouveaux raccourcis ont été ajoutés à la station de validation, permettant à l’utilisateur de déplacer une ligne sélectionnée dans une table vers le haut, vers le bas, vers la gauche ou vers la droite. En outre, lorsque des sélections sont faites dans la station de validation, celles-ci peuvent être attribuées à un champ spécifique à l’aide de raccourcis au niveau du champ. Chaque carte de champ a une clé qui lui est associée. Lorsqu’aucune sélection n’est effectuée, vous pouvez utiliser des raccourcis au niveau du champ pour passer d’une carte de champ à une autre.
Pour les champs de table de la station de validation, un point de contrôle au niveau de la ligne a été ajouté. Vous pouvez maintenant vérifier tous les champs d’une ligne en cliquant sur la coche, ou elle sera automatiquement cliquée lorsque vous visiterez tous les champs.
Les jetons de la station de validation ont été mis à jour. Ainsi, les jetons mis en évidence ont une bordure inférieure rouge et les jetons sélectionnés ont une bordure en pointillés.
Les valeurs de champ sans référence sont désormais prises en charge dans la station de validation. Les utilisateurs peuvent attribuer des valeurs à des champs qui n’ont pas de référence dans le document. Pour ce faire, lorsque l’utilisateur crée un champ dans Taxonomy Manager, la case à cocher Requiert une référence (Requires Reference) nécessite d’être décochée.
Station de classification
De nouveaux raccourcis ont été créés pour la station de classification, permettant à l’utilisateur de naviguer à travers les types de documents ; d'ajouter, de modifier, de supprimer ou de mettre en surbrillance la référence ; de déplacer toutes les pages vers le haut ou vers le bas ; de fractionner après la page sélectionnée ; d'ignorer les modifications ; d'enregistrer comme exception.
En plus d’utiliser le menu du type de document, une référence peut maintenant être supprimée au niveau de la page ainsi qu'en pointant au-dessus d’une page et en cliquant sur l’icône bleue dans le coin inférieur droit. L’icône permet également à l’utilisateur de mettre en évidence la référence.
Visionneuse PDF dans la station de classification et la station de validation
Le bouton Rotation (Rotate) a été ajouté à la visionneuse PDF. En cliquant sur le bouton, la page de document actuelle tournera dans le sens des aiguilles d’une montre.
Le mode de sélection est activé par défaut dans la visionneuse PDF.
Autres activités
Les activités Extracteur de formulaires intelligents (Intelligent Form Extractor) et Extracteur de formulaires (Form Extractor) peuvent désormais intégrer des modèles importés qui ont le même nom mais un contenu différent que ceux déjà disponibles. Chaque modèle est analysé et un message d’avertissement est affiché pour chaque cas.
La propriété ActionPriority de l’activité Créer une action de validation de document (Create Document Validation Action) prend désormais en charge les expressions et les variables.
Les conditions BucketFolderPath et DirectoryFolderPath ont été remplacées par BucketDirectoryPath et DownloadDirectoryPath pour l’activité Créer une action de validation de document (Create Document Validation Action) et Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume), respectivement. Le but est d'opérer une distinction claire avec le concept de « Dossier » (Folder) d'Orchestrator.
Date de publication : 24 août 2020
- Correction d’un problème qui, dans certains cas, renvoyait un message d'erreur
407ProxyAuthenticationRequired
pour les demandes d’authentification Kerberos ou NTLM. Cela s’applique aux activités Extracteur de formulaires (Form Extractor), Extracteur de formulaires intelligents (Intelligent Form Extractor) et Classifieur de mots clés intelligents (Intelligent Keyword Classifier). - Correction d’un problème dans le cadre duquel l'activité Extracteur de formulaires intelligents (Intelligent Form Extractor) n'affichait pas correctement une erreur de délai d’attente.
- Des traductions manquantes ont été ajoutées pour certaines chaînes de station de validation.
- Correction d’un problème dans le cadre duquel l'activité Étendue de l'extraction de données (Data Extraction Scope) générait une erreur lors de la désélection d’un champ de table.
Date de publication : 24 juin 2020
- Correction d’un problème qui causait des problèmes de synchronisation entre la fenêtre de configuration et le panneau Propriétés (Properties) pour l'activité Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume).
- Correction d’un problème dans le cadre duquel, dans certaines situations, les champs de table étaient enregistrés de manière erronée comme étant à valeurs multiples dans la taxonomie.
Date de publication : 4 mai 2020
- Cette version apporte de nombreuses nouvelles activités intéressantes telles que Créer une action de validation de document (Create Document Validation Action) et Attendre l’action de validation du document et reprendre (Wait for Document Validation Action and Resume), qui peuvent être utilisées pour créer, suspendre et reprendre les workflows d’orchestration dans le UiPath Action Center.
- Deux nouveaux extracteurs sont là pour vous aider. Vous pouvez les trouver sous le nom de Form Extractor (Extracteur de formulaires) et Intelligent Form Extractor (Intelligent Form Extractor). Les deux activités peuvent extraire des informations de documents à formulaire fixe en fonction de modèles prédéfinis, la différence étant que l' Intelligent Form Extractor peut également être configuré pour interpréter les champs signés ou écrits à la main. Vous pouvez extraire des informations de n'importe quel type de champ, y compris des tables, et créer des règles d'extraction de table personnalisées à l'aide de l'assistant du gestionnaire de modèles .
- Lors de l’utilisation de l’activité Extracteur de formulaires intelligents (Intelligent Form Extractor), si le nombre de champs manuscrits peut avoir été dépassé, alors un avertissement est affiché directement dans le workflow. Cela n’empêche pas l’utilisateur d’exécuter le workflow.
- L’activité Extracteur basé sur Regex (Regex Based Extractor) a reçu une nouvelle option nommée
UseVisualAlignment
qui peut être utilisée pour des mises en page complexes, permettant aux utilisateurs d’écrire plus facilement des expressions régulières basées sur la façon dont les mots sont organisés visuellement sur les lignes, ignorant toute phrase, tout paragraphe ou tout groupe de mise en page autrement identifié dans le document. - Vous pouvez définir une expression régulière pour identifier la zone de table, une expression régulière pour identifier une ligne de table dans cette zone, et des expressions régulières pour identifier des colonnes spécifiques dans les lignes de table.
- La station de validation actuelle et son assistant sont dotés de nombreuses fonctionnalités nouvelles et améliorées.
- L’assistant de la station de validation a maintenant un nouveau bouton nommé Ignorer les modifications (Discard changes). Vous pouvez l’utiliser pour confirmer ou ignorer toute modification apportée à la station de validation. La fonction peut être utilisée sur chaque type de document.
- L’assistant dispose également d’une nouvelle option nommée Afficher les suggestions (Show Suggestions) qui vous permet de sélectionner une valeur parmi plusieurs candidats si les extracteurs utilisés rapportent plusieurs valeurs possibles.
- La liste des raccourcis disponibles dans la station de validation a été enrichie d’un nouveau raccourci,
f+a
, vous permettant d’ajouter une nouvelle valeur dans un champ à valeurs multiples. - Des améliorations ont été apportées à l’activité Numériser le document (Digitize Document), qui peut désormais mieux identifier les cases à cocher dans un document.
- L’activité Numériser le document dispose également d’une nouvelle option nommée ForcerApplicationOCR. Lorsque celle-ci est sélectionnée, elle applique le moteur OCR à toutes les pages du document, y compris à un PDF natif.
- L’activité Étendue d’extraction des données ( Data Extraction Scope) peut désormais lire automatiquement les capacités de l’extracteur (taxonomies internes) si l’extracteur les déclare. Cela simplifie l'étape de configuration en exposant les champs connus de l'extracteur. L' extracteur d'apprentissage automatique prend désormais en charge cette nouvelle fonctionnalité, ce qui la rend très facile à utiliser et à configurer.
- L'activité Exporter les résultats de l'extraction ( Export Extraction Results ) a reçu une nouvelle option nommée IncludeConfidence. Si cette option est sélectionnée, le niveau de confiance est fourni.
- Les assistants d'extraction et de configuration prennent désormais en charge la sélection de champs en bloc pour les types de documents et les champs de table.
Date de publication : 14 janvier 2020
- Correction d'un problème qui faisait que l'assistant Station de validation (Validation Station) affichait de manière incorrecte les préférences de table, lors de l'utilisation de l'option Extraire une nouvelle table .
- Correction d’un problème qui renvoyait une erreur lorsque l’assistant Station de validation était exécuté avec l’activité Légende chaînée avant ou après celle-ci. À présent, l’activité s’exécute comme prévu.
- Correction d’un problème à cause duquel l’activité Étendue d’extraction des données (Data Extraction Scope ) renvoyait une erreur lorsqu’elle était exécutée avec une culture de machine personnalisée et que l’option FormatValuesIfPossible était sélectionnée. À présent, l’activité s’exécute comme prévu.
- Correction d’un problème qui entraînait des problèmes de performances lorsque de grandes quantités de texte étaient sélectionnées dans l’option Affichage du texte ( Text View ) de l’assistant Station de validation . À présent, l’option Affichage du texte ( Text View ) affiche le texte comme prévu.
- Correction d’un problème à cause duquel l’activité Étendue d’extraction des données (Data Extraction Scope) renvoyait une erreur lorsqu’elle était exécutée avec un extracteur sans ensemble de taxonomie interne et qu’un nouveau champ était ajouté dans la taxonomie du projet. À présent, l’activité s’exécute comme prévu.
- Sur certaines machines, les documents pivotés ne s'affichaient pas correctement lors de l'utilisation de la Station de validation.
Date de publication : 6 décembre 2019
- Des mises à jour majeures ont été appliquées au package UiPath.IntelligentOCR.Activities. Toutes les activités utilisées pour travailler avec les familles de produits FineReader et FlexiCapture Abbyy ont été déplacées vers un package distinct nommé UiPath.Abbyy.Activities. Cela a conduit à une modification radicale du package UiPath.IntelligentOCR.Activities, dont la version est passée de v3.1.0 à v4.0.0. La liste suivante présente les activités qui ont été déplacées du package UiPath.IntelligentOCR.Activities vers le package UiPath.Abbyy.Activities :
- Le package UiPath.Abbyy.Activities ne peut pas être utilisé avec des versions antérieures à la v19.11 pour le package UiPath.UIAutomation.Activities et antérieures à v4.0.0 pour le package UiPath.IntelligentOCR.Activities.
- Si vous rencontrez des erreurs de validation d’exécution après la mise à jour d’un workflow vers la nouvelle version UiPath.IntelligentOCR.Activities v4.0.0 et UiPath.Abbyy.Activities v1.0.0, forcez une nouvelle sauvegarde sur le
.xaml
en effectuant une petite modification, puis en la rétablissant. Cela peut se produire dans les workflows utilisant des activités FlexiCapture. - Les workflows créés ou mis à niveau vers UiPath.IntelligentOCR.Activities v4.0.0 ne peuvent pas être rétrogradés vers une version antérieure de UiPath.IntelligentOCR.Activities.
Date de publication : 8 novembre 2019
- Une nouvelle activité destinée à vous aider à mieux organiser et gérer vos classifieurs pouvant être formés est disponible : Outil d’apprentissage de classifieur basé sur mot clé (Keyword Based Classifier Trainer). Cette activité ne peut être utilisée qu’avec l’activité Tester l’étendue des classifieurs (Train Classifiers Scope).
- L'assistant Station de validation ( Validation Station) a reçu une mise à niveau importante et est maintenant disponible pour que vous puissiez Explore son potentiel au maximum. Cet assistant devient disponible uniquement lorsque l'activité Présenter la station de validation (Present Validation Station) est utilisée dans un workflow. Vous pouvez utiliser la version mise à niveau pour bénéficier d’une nouvelle interface conviviale, naviguer dans le document à l’aide des raccourcis clavier, ou sélectionner un ou plusieurs mots ou une zone personnalisée. Vous pouvez facilement marquer un champ comme manquant, extraire de nouvelles données, modifier une table ou extraire une nouvelle table. Toutes ces choses merveilleuses peuvent être faites avec l'assistant de la station de validation tout en utilisant un thème sombre.
- L’une des améliorations incluses dans cette version est que l’activité Classifieur basé sur les mots clés ( Keyword Based Classifier ) a reçu un nouveau paramètre nommé LearningData. En plus de spécifier où se trouvent les données du fichier d'apprentissage, vous pouvez désormais également utiliser la chaîne contenant les données sérialisées du classifieur. Cette activité a été améliorée avec un assistant nommé Gérer l’apprentissage des classifieurs par mots-clés ( Manage Keyword Based Classifier Learning) qui peut être utilisé pour configurer et gérer les mots-clés utilisés pour identifier des types de documents spécifiques.
- Les activités Keyword Based Classifier et Keyword Based Classifier Trainer peuvent désormais gérer plusieurs mots clés. Une fois les ensembles de mots clés sélectionnés, l'extraction est basée sur une correspondance complète des mots sélectionnés.
- Autre grande amélioration, la sortie
DocumentObjectModel
, incluse dans l’activité Numériser le document ( Digitize Document ), peut désormais prendre en charge les polygones de mot, en plus des cases de mot horizontales. - L'assistant Taxonomy Manager a reçu une nouvelle barre de défilement qui intègre tous les éléments de l'interface utilisateur et offre une meilleure expérience utilisateur.
- Les activités Étendue de l'extraction de données (Data Extraction Scope), Tester l'étendue des extracteurs (Train Extractors Scope), Tester l'étendue des classifieurs (Train Classifier Scope) et Classer la portée du document (Classify Document Scope) organisent maintenant leurs extracteurs et classifieurs dans l’ordre horizontal, remplaçant l’ordre vertical précédent.
- L’activité Extracteur basé sur Regex (Regex Based Extractor) a été améliorée et peut désormais traiter et renvoyer des valeurs multiples. La sortie n’est visible que lorsque l’activité est utilisée en même temps que la station de validation (Validation Station).
- Quatre nouvelles langues, le turc (TR), le portugais (PT), l’espagnol (ES) et l’espagnol-mexicain (ES-MX) sont disponibles pour le package UiPath.IntelligentOCR.Activities.
.xaml
. Si aucun fichier n'est ouvert lorsque vous accédez au Taxonomy Manager, une fenêtre d'enregistrement s'affiche et Taxonomy Manager ne s'affiche qu'après la fermeture de la fenêtre d'enregistrement.
- Une exception a été générée lors de l’utilisation de l’activité Étendue de l’extraction de données (Data Extraction Scope) ainsi que d’une activité Essayer de capturer (Try Catch). Le problème a été résolu et maintenant l’activité est exécutée comme prévu.
- Lorsqu'un champ booléen était défini sur Non dans la Station de validation, le fichier de sortie aurait dû afficher le résultat Non , mais l'affiche plutôt comme manquant. Le problème a été résolu et le fichier de sortie affiche désormais le résultat correct.
- Correction de l'analyse incorrecte des nombres qui se produisait lorsque l'activité Étendue de l' extraction de données (Data Extraction Scope) essayait d'analyser les nombres dans les documents en utilisant un format de nombre différent de celui de la culture du document.
- Lors de l'utilisation de plusieurs stations de validation, l'ordre des parties dérivées n'était pas respecté dans les résultats validés. Le problème a été résolu et les résultats affichent désormais les pièces dérivées dans le même ordre dans lequel ils ont été introduits.
- Des différences entre les cases avec une sélection personnalisée se sont produites lorsque les résultats d'une Station de validation ont été exécutés via une deuxième Station de validation. Le problème a été résolu et il n’y a désormais plus de différences entre les boîtes avec sélection personnalisée.
- Lorsque l'activité Numériser le document ( Digitize Document) était utilisée avec le moteur Microsoft Azure Computer Vision OCR , la rotation ne fonctionnait pas lorsque le paramètre HandwritingRecognition était défini sur True. Le problème a été résolu et les informations sont désormais traitées correctement.
- Lors de l’utilisation de l’activité Numériser le document ( Digitize Document ), une erreur se produisait en essayant de traiter des images avec beaucoup de texte. Le bogue a été corrigé en améliorant le processus de mise à l’échelle.
- Correction d’un problème qui générait une erreur en essayant de former l’activité Classifieur basé sur mot clé (Keyword Based Classifier) dans la portée de formation et l’extraction était exécutée sans référence de classification. Le problème a été résolu et maintenant le fait qu’il n’y a pas d’informations d’apprentissage est seulement enregistré, pas généré comme une erreur.
- Une erreur était générée lors de l’utilisation de l’activité Extracteur FlexiCapture (FlexiCapture Extractor) et le même nom était donné à la fois à une colonne de table et à un champ. Le problème a été résolu et le fichier
.fcdot
est désormais traité comme prévu.
- v6.22.1
- Améliorations
- Résolution de bogues
- v.6.9.8
- v6.14.3
- Résolution de bogues
- v6.19.7
- Résolution de bogues
- v6.22.0
- Nouveautés
- Prise en charge des activités à partir d'une configuration locale
- Prise en charge d’IntelligentOCR pour les projets modernes
- Extended Languages OCR
- Résolution de bogues
- Obsolescences à venir
- v6.19.6
- v6.19.5
- Résolution de bogues
- v6.0.2
- v6.5.4
- v6.19.3
- v6.14.2
- v6.19.2
- Résolution de bogues
- v6.19.1
- Résolution de bogues
- v6.19.0
- Nouveautés
- Améliorations
- Résolution de bogues
- Problèmes connus
- v6.14.1
- Nouvelles fonctionnalités et améliorations
- v6.9.5
- v6.9.4
- v6.9.3
- v6.9.2
- v6.5.3
- v6.5.2
- v6.9.1
- Résolution de bogues
- v6.9.0
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- Chronologie de l’abandon
- v6.5.1
- Nouvelles fonctionnalités et améliorations
- v6.6.0
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- v6.5.0
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- 8 décembre 2022
- v6.0.1
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- Problèmes connus
- v5.0.2
- Améliorations
- Résolution de bogues
- Problèmes connus
- v4.13.2
- Améliorations
- v4.13.1
- Améliorations
- v4.13.0
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- Problèmes connus
- v4.10.5
- Améliorations
- v4.10.4
- Améliorations
- v4.10.3
- Améliorations
- v4.10.2
- Nouvelles fonctionnalités et améliorations
- Résolution de bogues
- v4.10.1
- Améliorations
- Résolution de bogues
- v4.10.0
- Nouvelles fonctionnalités et améliorations
- v4.5.2
- Résolution de bogues
- v4.5.1
- Résolution de bogues
- v1.3.2
- Améliorations
- v4.5.0
- Nouvelles fonctionnalités et améliorations
- v4.0.1
- Résolution de bogues
- v4.0.0
- Changements radicaux
- Problèmes connus
- Résolution de bogues
- v2.0.2
- Améliorations
- v1.3.1
- Améliorations
- v3.1.0
- Nouvelles fonctionnalités et améliorations
- Problèmes connus
- Résolution de bogues