- Vue d'ensemble (Overview)
- Construction de modèles
- Validation du modèle
- Déploiement du modèle
- API
- Questions fréquemment posées
- Questions fréquemment posées

Guide de l'utilisateur des documents complexes et non structurés
Comment les clients et partenaires peuvent-ils accéder à la fonctionnalité Extraction et traitement intelligents (IXP) Documents complexes et non structurés ?
Les clients et les partenaires peuvent enregistrer leur intérêt sur le portail Insider, car la fonctionnalité Documents complexes et non structurés est actuellement disponible dans le programme d'aperçu. Nous examinons régulièrement les inscriptions. Les clients et partenaires sélectionnés sont informés pour rejoindre le programme de prévisualisation. Veillez à fournir autant de détails que possible sur le cas d'utilisation.
Quand la fonctionnalité sera-t-elle officiellement disponible en général ?
La date cible pour la publication officielle de la fonctionnalité Documents complexes et non structurés est fin juillet 2025. Certains clients peuvent participer à une mise à disposition générale contrôlée pendant le reste de la période de prévisualisation. Tous les cas d'utilisation disponibles contrôlés devront être approuvés par l'équipe Produit et pris en charge par leurs équipes de comptes respectives.
La fonctionnalité est-elle disponible pour les utilisateurs de la communauté ?
Oui, la fonctionnalité est disponible pour les utilisateurs de Community qui ont uniquement accès à une fonctionnalité restreinte, et tous les locataires ou projets sont soumis à des limites de moment de conception et de runtime prédéfinies.Pour de plus amples détails, vérifiez les sections Moment de la conception et Runtime.
Quelles sont les options de déploiement d'Extraction et traitement intelligents (IXP) ? La capacité est-elle disponible localement ?
À l'heure actuelle, les capacités de Communications Mining et Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) sont disponibles uniquement dans UiPath® Automation Cloud™.
Document Understanding est disponible dans les déploiements d'Automation Cloud, d'Automation Suite et de manière autonome. Pour plus d'informations sur les options de déploiement de Document Understanding, consultez la section Choix du type de déploiement.
La capacité est-elle disponible dans toutes les régions ?
À l’heure actuelle, la fonctionnalité Documents complexes et non structurés est généralement disponible pour les États-Unis et l’Europe, et disponible dans l’aperçu exclusif pour les régions du Canada, du Japon et de l’Australie.
Quelles langues sont prises en charge dans cette capacité ?
Les utilisateurs peuvent télécharger des documents et créer des modèles dans n’importe quel langue prise en charge par le modèle sélectionné dans Extraction et traitement intelligents (IXP).
Quels formats de fichiers sont pris en charge dans la fonctionnalité ?
Actuellement, cette fonctionnalité prend en charge les formats de fichier PNG, JPG ou JPEG, PDF et TIF ou TIFF.
Le service Extraction et traitement intelligents (IXP) utilise-t-il une IA spécialisée ou générative ?
Communications Mining utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
Document Understanding utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
L'extraction générative des Documents complexes et non structurés utilise l'IA générative par le biais de LLM tiers. Il n'est pas possible d'utiliser cette fonctionnalité sans IA générative.
CommPath et DocPath sont-ils disponibles dans IXP ?
CommPath est disponible dans Communications Mining lorsque vous utilisez la fonctionnalité Extraction générative.
DocPath est disponible dans Document Understanding, uniquement dans l’expérience Modern. Il n’est pas disponible dans l’expérience classique Document Understanding.
Aucun des deux n'est disponible dans la fonctionnalité Extraction générative des Documents complexes et non structurés.
Est-ce qu'Extraction et traitement intelligents (IXP) passe par AI Trust Layer (AITL) ?
Oui, toutes les fonctionnalités IXP qui utilisent des LLM tiers passent par l’ITL d’UiPath. CommPath et DocPath sont les modèles propriétaires d’UiPath et ne passent pas par l’AITL.
Quels sont les LLM utilisés par la fonctionnalité ?
Les modèles GPT-4o vision et Gemini sont disponibles dans la fonctionnalité Documents complexes et non structurés. Le modèle Gemini est disponible en tant que fonctionnalité de prétraitement intelligent des données tabulaires.
La capacité permet-elle d'activer son propre abonnement (BYO) ?
Pas actuellement, mais l'abonnement BYO sera pris en charge dans les versions futures.
Puis-je migrer mon cas d'utilisation de l'expérience classique Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas d'utilisation de l'expérience moderne Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas des activités Extracteur génératif de Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
En phase de conception, existe-t-il des limites pour cette capacité ?
Les limites de la phase de conception sont les suivantes :
- Nombre de champs par groupe de champs : jusqu'à 32 champs.
- Nombre de caractères par nom de champ : jusqu'à 128 caractères.
- Nombre de caractères par instruction d'invite : jusqu'à 2 048 caractères. Cela s'applique à toutes les invites, y compris les instructions générales, les instructions de groupe de champs, les instructions de champ et les instructions de type de champ.
Puis-je créer des champs génériques dans la fonctionnalité Documents ?
Non, il n'existe pas de champ générique dans Extraction et traitement intelligents (IXP). Tous les champs doivent appartenir à un groupe de champs. Chaque groupe de champs représente un tableau distinct, où les champs représentent les colonnes du tableau. Cependant, il est possible de définir un groupe de champs au niveau parent représentant un type de document et d'ajouter des champs plus généraux sous forme de tableau sous ce groupe de champs.
Les modèles de Documents complexes et non structurés du service Extraction et traitement intelligents (IXP) améliorent-ils les performances avec la labélisation ou les annotations ?
Non, le modèle n'apprend pas encore directement à partir des annotations de l'utilisateur. Actuellement, la façon d'améliorer les performances de votre modèle est de modifier vos instructions d'invite ou la configuration de votre modèle. Nous étudions différentes solutions, notamment l'apprentissage en contexte, l'amélioration des retours d'instructions et les modèles ajustables.
Pourquoi dois-je annoter des documents si cela n'améliore pas les performances du modèle ?
Il reste important de valider et d'annoter les documents pour établir la vérité du terrain pour l'évaluation des performances du modèle, qui est capturée dans les métriques de performances intégrées de la page Mesurer.
Combien de documents dois-je importer pour tester mes instructions ?
Vous devez télécharger un échantillon représentatif de vos documents pour couvrir toutes les variations possibles. Cela doit correspondre à au moins 20 à 30 documents différents. Nous vous recommandons d'examiner les prédictions initiales de deux à trois documents pour ensuite décider si vous devez modifier vos instructions avant d'augmenter progressivement l'échantillon de test à 10, 20, 30, X documents. Il s'agira alors d'un processus itératif.
Combien de documents dois-je annoter pour obtenir des mesures de performances fiables ?
Nous vous recommandons de valider pour chaque champ au moins dix documents ou dix exemples, ou les deux afin que le modèle puisse vous fournir des statistiques de validation significatives. Il s'agit du nombre minimum d'annotations, qui dépendront des exigences spécifiques du cas d'utilisation.
Les modèles de documents complexes et non structurés sont-ils consommés par des robots ou des API Document Understanding autonomes ?
Les modèles de Documents complexes et non structurés peuvent être consommés à la fois par des robots et par l'API Document Understanding Automation Cloud autonome.
Comment puis-je consommer des sorties de Documents complexes et non structurés ?
Les sorties des modèles peuvent être consommées par le biais d'API, d'activités Document Understanding ou d'activités IntelligentOCR. Veillez à ce que :
- Installez le package IOCR v6.23.2-preview ou version ultérieure et sélectionnez l'activité extracteur Document Understanding
- Installez le package Document Understanding v2.13.2-preview ou version ultérieure et sélectionnez l'activité Extraire les données du document
La fonctionnalité Extraction et traitement intelligents (IXP) Documents complexes et non structurés fournit-elle des scores de confiance ? Comment sont-ils calculés ?
Oui, nous fournissons des scores de confiance dans la réponse du modèle et dans Action Center (runtime), mais pas dans l'interface utilisateur d'Extraction et traitement intelligents (IXP) (au moment de la conception).Nous utilisons les probabilités de jetons renvoyées par la LLM pour estimer les valeurs de confiance du champ et du niveau d'extraction.
Les sorties des modèles de Documents complexes et non structurés peuvent-elles être consommées à partir de déploiements hybrides, c'est-à-dire sur place avec Orchestrator ou Automation Suite et le modèle Extraction et traitement intelligents (IXP) Cloud ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
Les sorties des modèles de Documents complexes et non structurés Extraction et traitement intelligents (IXP) peuvent-elles être consommées à partir de différentes organisations ou locataires, c'est-à-dire Production, Développement ou UAT ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
La Station de validation fonctionne-t-elle avec la fonctionnalité Documents complexes et non structurés ?
Oui, cela fonctionne de la même manière que les projets Document Understanding Moderne ou Classique. Toutefois, toutes les extractions doivent être validées sous forme de tableaux.
Le modèle de Documents complexes et non structurés apprend-il en fonction de la validation HITL d'Action Center ?
Non, il n'existe actuellement aucune boucle de rétroaction entre Action Center et les modèles de Documents complexes et non structurés.Nous prévoyons la prise en charge de cette option dans les futures versions, ainsi que dans les modèles ajustables.
Dans la pratique, Extraction et traitement intelligents (IXP) peut extraire de manière fiable jusqu'à environ 1 200 valeurs de champ par document.
Cela signifie que si un document nécessite l'extraction de plus de 1 200 valeurs de champ, le modèle peut atteindre sa limite de jetons. Cela peut se produire même si le document est bien dans les limites de page répertoriées dans cette section. Les travaux de recherche et de développement sont en cours pour prendre en charge des limites de valeur de champ plus élevées dans les versions futures.
Si les limites de jetons sont dépassées, les prédictions peuvent être incomplètes ou vides quel que soit le nombre de pages. Par exemple, un document de 80 pages avec 1 400 valeurs de champ extraites peut déclencher un déclencheur de limite de jetons dans l'interface utilisateur.À Runtime / runtime, lorsque la limite de jetons est dépassée, la réponse de l'API l'affichera en renvoyant les valeurs de confiance d'occurrence et d'extraction de 0.
Si les limites de pages sont dépassées, seules les pages dans les limites spécifiées ci-dessous sont traitées. Ces deux comportements s'appliquent à la fois à Gemini et à GPT-4o.
Les limites de runtime incluent :
- Nombre de pages par document :
- Pour Gemini, jusqu'à 500 pages.
- Pour GPT-4o, 50 pages et jusqu'à 150 pages à l'aide de la fonctionnalité d'aperçu privé itératif de l'appel.
- Limites de jetons - Les documents contenant beaucoup de données avec plus de 200 extractions, tels que les tables longues, atteindront probablement la limite de jetons.Si GPT4-o atteint sa limite, vous pouvez utiliser la fonctionnalité d'aperçu privé itératif de l'appel pour augmenter la sortie du champ. Gemini, cependant, dispose d'une limite de jetons de sortie plus élevée par défaut de sorte que les deux modèles peuvent renvoyer des quantités similaires de valeurs de champ : Gemini en un seul appel et GPT via plusieurs appels.
Cette fonctionnalité offre-t-elle des outils de surveillance ? Sont-ils différents des projets Document Understanding Modern ? Existe-t-il des dépendances par rapport à Insights ?
Actuellement, la fonctionnalité Documents complexes et non structurés ne fournit aucune fonctionnalité de surveillance, telle que la page Surveiller dans Projets modernes. Vous trouverez de plus amples informations sur les fonctionnalités de surveillance dans de futures versions.
Peut-on surveiller la consommation d’AI Units pour les projets de Documents complexes et non structurés ?
Actuellement, aucun suivi de la consommation par projet n’est disponible. Une fois entièrement intégrée, la consommation apparaîtra probablement dans le tableau de bord de la consommation d’AI Units et dans un tableau de bord distinct pour les Documents complexes et non structurés
Pouvons-nous détecter automatiquement la baisse des performances, par exemple, la dérive des données, des scores F1 inférieurs, etc. ?
Pour l'instant, nous ne fournissons aucune notification ni aucune alerte sur les performances des modèles.
À quelle fréquence les utilisateurs doivent-ils mettre à jour leurs modèles ou leurs instructions de saisie ?
Cela dépend de chaque cas d'utilisation, mais vous devez affiner vos instructions lorsque vos extractions sont sous-performantes.