Document Understanding

document-understanding

latest

false

Guide de l’utilisateur classique de Document Understanding

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Réglage

AI Center inclut la capacité d'affiner les modèles de ML à l'aide de données validées par un humain à l'aide de la Station de Validation.

Étant donné que votre workflow RPA traite les documents à l'aide d'un modèle ML existant, certains documents peuvent nécessiter une validation humaine à l'aide de l'activité Présenter la station de validation (Present Validation Station) (disponible sur les robots surveillés ou dans le navigateur à l'aide d'Action Center Orchestrator).

Les données validées générées dans la Station de validation peuvent être exportées à l'aide de l'activité Machine Learning Extractor Trainer et peuvent être utilisées pour affiner les modèles ML dans AI Center.

Nous ne recommandons pas d'entraîner des modèles ML à partir de zéro (c'est-à-dire en utilisant le paquet ML DocumentUnderstanding) en utilisant les données de la Station de validation, mais uniquement d'améliorer les modèles ML existants (y compris les modèles prêts à l'emploi).

Pour connaître les étapes détaillées nécessaires pour le peaufinage d'un modèle de ML, consultez la section Importer des documents de la documentation de Document Manager.

Pour plus d'informations sur la création d'un ensemble de données à affiner, cliquez ici.

Important :

Il est souvent supposé à tort que la façon d'utiliser les données de la Station de validation consiste à réentraîner de manière répétée la version précédente du modèle, de sorte que le lot actuel est utilisé pour former le package X.1 afin d'obtenir la version X.2. Ensuite, le batch suivant s'entraîne sur la version X.2 pour obtenir la version X.3 et ainsi de suite. C'est la mauvaise façon d'utiliser le produit. Chaque lot de la Station de validation doit être importé dans la même session Document Manager que les données d'origine labellisées manuellement, créant ainsi un ensemble de données plus volumineux, qui doit être utilisé pour toujours s'entraîner sur la versionX.0 du paquet ML.

Cette page vous a-t-elle été utile ?

PrécédentPipelines complets

SuivantLa boucle de réglage automatique (aperçu public)