Document Understanding - UiPath Helix Extractor 1.0 [Obsolète]

document-understanding

latest

false

Guide de l'utilisateur de Document Understanding

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

UiPath Helix Extractor 1.0 [obsolète]

Avertissement :

UiPath Helix Extractor 1.0 est obsolète. Vous pouvez utiliser au lieu de cela UiPath Helix Extractor 2.0.

Pour de plus amples détails, consultez la note de version annonçant l'obsolescence de Helix Extractor 1.0 et la section Obsolescences à venir .

Le modèle LLM Helix Extractor 1.0 est le modèle d'extraction de données généralement disponible pour UiPath® Document Understanding^TM. Bien qu'Helix Extractor 1.0 fonctionne de manière similaire aux modèles précédents, il a été formé à l'aide d'une grande variété de documents. Cela lui permet de traiter les types de documents courants avec peu voire pas d'entraînement. Ce qui distingue le LLM Helix Extractor 1.0, c'est son architecture générative qui améliore considérablement la précision et simplifie l'extraction. De plus, vous pouvez également affiner le modèle à l'aide de vos ensembles de données uniques.

Pour obtenir de plus amples informations sur l'architecture de Helix Extractor 1.0 et les techniques utilisées pour l'entraînement, consultez la page Helix Extractor 1.0 de notre blog AI.

Disponibilité

Actuellement, UiPath Helix Extractor est uniquement disponible pour les locataires basés aux États-Unis (à l'exclusion de GxP et Government Cloud) dans les projets modernes Document Understanding.

The UiPath Helix Extractor est disponible pour les projets classiques et modernes lors de l’utilisation de points de terminaison publics dans les régions suivantes :

Les points de terminaison publics pour les modèles d’extraction en Europe sont basés sur Helix Extractor, à l’exception des états financiers.
Les points de terminaison publics suivants pour les modèles d'extraction sont basés sur l'extracteur Helix dans la région Japon :
- Factures Chine
- Factures, Japon
- Reçus Japon (Receipts Japan)

Améliorations par rapport à la génération précédente

Le LLM Helix Extractor offre de nombreuses améliorations par rapport aux modèles précédents.Il améliore la précision, en particulier avec les tables, s'adapte à diverses mises en page de documents pour réduire les efforts d'annotation et augmente les taux d'automatisation.

Les principales améliorations sont les suivantes :

Précision améliorée: le LLM Helix Extractor fournit un taux de précision plus élevé et un score F1 supérieur pour les documents semi-structurés tels que les factures, les reçus et les bons de commande. Cela garantit une extraction de données précise et cohérente.
Annotation simplifiée : le modèle réduit le travail manuel en ne nécessitant qu'une seule annotation par document, éliminant ainsi le besoin d'annoter chaque instance de champ sur chaque page.
Automatisation améliorée: avec une plus grande corrélation entre le niveau de confiance et la précision, le LLM de Helix Extractor améliore les taux d'automatisation tout en réduisant le nombre de documents envoyés à Action Center pour le même niveau de précision.

Selon nos tests internes, l'extracteur Helix a surpassé son prédécesseur en termes de performances. Il a réduit le taux de faux positifs d'environ 15 % et le taux de faux négatifs a chuté de près de 17 %.

Comment utiliser l'extracteur Helix

Le LLM Helix Extractor est disponible exclusivement pour les projets modernes Document Understanding.Malgré l'introduction de l'extracteur Helix, toutes les versions de projet existantes utiliseront toujours les versions de modèle actuelles. Cela garantit une transition transparente sans aucune interruption des workflows de production en cours.

Pour commencer à former un type de document existant sur Helix Extractor, désactivez et activez tous les champs dans quelques documents.

Choisissez le type de document que vous souhaitez entraîner sur l'extracteur Helix.
Sélectionnez un document.
Sélectionnez tous les champs du document et choisissez Supprimer (Delete).
Annotez tous les champs du document et sélectionnez Confirmer (Confirmer).

Remarque :
Répétez les étapes 3 et 4 jusqu'à ce que l'entraînement soit lancé sur le type de document choisi.

Comment vérifier si Helix Extractor est activé

Après avoir formé vos modèles sur Helix Extractor, vérifiez la version du modèle pour vous assurer que Helix Extractor est activé.

Accédez à la page Publier et créez une nouvelle version de projet.
Sélectionnez l'icône à trois points ⋮ située à côté de la version du projet, puis choisissez Modifier la version (Edit version) pour vérifier la version du modèle.

Remarque :
Tous les modèles version 24.7 et ultérieures sont des modèles UiPath Helix Extractor.

Optimisation des résultats

Les noms de champ que vous choisissez peuvent avoir un impact considérable sur les performances du modèle. Afin de garantir des résultats optimaux, utilisez le langage naturel et une grammaire appropriée pour les noms de champ. Vous ne devez utiliser que des acronymes largement reconnus tels que Numéro (No), Compte (Cpt), Adresse (Adr) et Appartement (Apt). Actuellement, seules les langues d’Europe occidentale sont prises en charge. Assurez-vous donc que les noms de champ choisis s’alignent sur ces langues. Évitez d’utiliser des noms non descriptifs, tels que « Colonne 3 », sauf si le document utilise spécifiquement cette terminologie.

Choix entre le type de modèle Helix Extractor et le modèle hérité

UiPath Helix Extractor prend actuellement en charge uniquement les langues de script latines.Pour former un modèle dans des langues utilisant des scripts différents du script latin, choisissez le type de modèle hérité. Si le modèle hérité est sélectionné, choisissez le modèle de base approprié à votre type de document.

Pour choisir entre le type de modèle Helix Extractor ou Héritage, accédez à l'onglet Paramètres dans le Gestionnaire de type de document et sélectionnez le type de modèle requis dans la liste déroulante Type de modèle .

Important :

Il est nécessaire de publier une nouvelle version du projet après le déploiement des modifications.

Limitations connues d'UiPath® Helix Extractor

Les limitations suivantes s'appliquent actuellement à UiPath Helix Extractor :

Les champs extraits doivent correspondre exactement au texte des documents. Ce processus n’inclut pas le résumé ou d’autres types d’analyse de texte.
Les types de document suivants ne sont actuellement pas basés sur Helix Extractor et fonctionnent toujours sur la génération précédente :
- États financiers
- Factures Chine
- Factures hébreu
- Factures, Japon

Astuce :

Les types de document qui ne sont pas actuellement pris en charge par le modèle Helix Extractor ont le message suivant dans la liste déroulante Ajouter un type de document : Le type de document sera formé à l'aide du modèle hérité.

UiPath Helix Extractor ne prend actuellement pas en charge les langues de script non latines.

Sommaire de la page

Disponibilité
Améliorations par rapport à la génération précédente
Comment utiliser l'extracteur Helix
Comment vérifier si Helix Extractor est activé
Optimisation des résultats
Choix entre le type de modèle Helix Extractor et le modèle hérité
Limitations connues d'UiPath® Helix Extractor

Cette page vous a-t-elle été utile ?

PrécédentUiPath Helix Extractor 2.0

SuivantInfrastructure

Disponibilité​

Améliorations par rapport à la génération précédente​

Comment utiliser l'extracteur Helix​

Comment vérifier si Helix Extractor est activé​

Optimisation des résultats​

Choix entre le type de modèle Helix Extractor et le modèle hérité​

Limitations connues d'UiPath® Helix Extractor​