- Vue d'ensemble (Overview)
- Construction de modèles
- Validation du modèle
- Déploiement du modèle
- Questions fréquemment posées
- Questions fréquemment posées

Guide de l'utilisateur des documents complexes et non structurés
Comment les clients et partenaires peuvent-ils accéder à la fonctionnalité Extraction et traitement intelligents (IXP) Documents complexes et non structurés ?
Les clients et les partenaires peuvent enregistrer leur intérêt sur le portail Insider, car la fonctionnalité Documents complexes et non structurés est actuellement disponible dans le programme d'aperçu. Nous examinons régulièrement les inscriptions. Les clients et partenaires sélectionnés sont informés pour rejoindre le programme de prévisualisation. Veillez à fournir autant de détails que possible sur le cas d'utilisation.
Quand la fonctionnalité sera-t-elle officiellement disponible en général ?
La date cible pour la publication officielle de la fonctionnalité Documents complexes et non structurés est fin juillet 2025. Certains clients peuvent participer à une mise à disposition générale contrôlée pendant le reste de la période de prévisualisation. Tous les cas d'utilisation disponibles contrôlés devront être approuvés par l'équipe Produit et pris en charge par leurs équipes de comptes respectives.
La fonctionnalité est-elle disponible pour les utilisateurs de la communauté ?
Yes, the capability is available for Community users, who only have access to a restricted functionality, and all tenants or projects are subject to pre-defined design-time and runtime limits. For more details, check the Design-time and Runtime sections.
Quelles sont les options de déploiement d'Extraction et traitement intelligents (IXP) ? La capacité est-elle disponible localement ?
À l'heure actuelle, les capacités de Communications Mining et Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) sont disponibles uniquement dans UiPath® Automation Cloud™.
Document Understanding est disponible dans les déploiements d'Automation Cloud, d'Automation Suite et de manière autonome. Pour plus d'informations sur les options de déploiement de Document Understanding, consultez la section Choix du type de déploiement.
La capacité est-elle disponible dans toutes les régions ?
À l’heure actuelle, la fonctionnalité Documents complexes et non structurés est généralement disponible pour les États-Unis et l’Europe, et disponible dans l’aperçu exclusif pour les régions du Canada, du Japon et de l’Australie.
Quelles langues sont prises en charge dans cette capacité ?
Les utilisateurs peuvent télécharger des documents et créer des modèles dans n’importe quel langue prise en charge par le modèle sélectionné dans Extraction et traitement intelligents (IXP).
Quels formats de fichiers sont pris en charge dans la fonctionnalité ?
Actuellement, cette fonctionnalité prend en charge les formats de fichier PNG, JPG ou JPEG, PDF et TIF ou TIFF.
Le service Extraction et traitement intelligents (IXP) utilise-t-il une IA spécialisée ou générative ?
Communications Mining utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
Document Understanding utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
L'extraction générative des Documents complexes et non structurés utilise l'IA générative par le biais de LLM tiers. Il n'est pas possible d'utiliser cette fonctionnalité sans IA générative.
CommPath et DocPath sont-ils disponibles dans Extraction et traitement intelligents (IXP) ?
CommPath est disponible dans Communications Mining lorsque vous utilisez la fonctionnalité Extraction générative.
DocPath est disponible dans Document Understanding, uniquement dans l’expérience Moderne. Elle n’est pas disponible dans l’expérience Document Understanding Classique.
Aucun des deux n'est disponible dans la fonctionnalité Extraction générative des Documents complexes et non structurés.
Est-ce qu'Extraction et traitement intelligents (IXP) passe par AI Trust Layer (AITL) ?
Oui, toutes les fonctionnalités du service Extraction et traitement intelligents (IXP) qui utilisent des LLM tiers passent par UiPath AITL. CommPath et DocPath sont les modèles propriétaires d'UiPath et ne passent pas par l'AITL.
Quels sont les LLM utilisés par la fonctionnalité ?
Les modèles GPT-4o vision et Gemini sont disponibles dans la fonctionnalité Documents complexes et non structurés. Le modèle Gemini est disponible en tant que fonctionnalité de prétraitement intelligent des données tabulaires.
La capacité permet-elle d'activer son propre abonnement (BYO) ?
Pas actuellement, mais l'abonnement BYO sera pris en charge dans les versions futures.
Puis-je migrer mon cas d'utilisation de l'expérience classique Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas d'utilisation de l'expérience moderne Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas des activités Extracteur génératif de Document Understanding vers la fonctionnalité Documents complexes et non structurés d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
En phase de conception, existe-t-il des limites pour cette capacité ?
Les limites de la phase de conception sont les suivantes :
- Nombre de champs par groupe de champs : jusqu'à 32 champs.
- Nombre de caractères par nom de champ : jusqu'à 128 caractères.
- Nombre de caractères par instruction d'invite : jusqu'à 2 048 caractères. Cela s'applique à toutes les invites, y compris les instructions générales, les instructions de groupe de champs, les instructions de champ et les instructions de type de champ.
Puis-je créer des champs génériques dans la fonctionnalité Documents ?
Non, il n'existe pas de champ générique dans Extraction et traitement intelligents (IXP). Tous les champs doivent appartenir à un groupe de champs. Chaque groupe de champs représente un tableau distinct, où les champs représentent les colonnes du tableau. Cependant, il est possible de définir un groupe de champs au niveau parent représentant un type de document et d'ajouter des champs plus généraux sous forme de tableau sous ce groupe de champs.
Les modèles de Documents complexes et non structurés du service Extraction et traitement intelligents (IXP) améliorent-ils les performances avec la labélisation ou les annotations ?
Non, le modèle n'apprend pas encore directement à partir des annotations de l'utilisateur. Actuellement, la façon d'améliorer les performances de votre modèle est de modifier vos instructions d'invite ou la configuration de votre modèle. Nous étudions différentes solutions, notamment l'apprentissage en contexte, l'amélioration des retours d'instructions et les modèles ajustables.
Pourquoi dois-je annoter des documents si cela n'améliore pas les performances du modèle ?
Il reste important de valider et d'annoter les documents pour établir la vérité du terrain pour l'évaluation des performances du modèle, qui est capturée dans les métriques de performances intégrées de la page Mesurer.
Combien de documents dois-je importer pour tester mes instructions ?
Vous devez télécharger un échantillon représentatif de vos documents pour couvrir toutes les variations possibles. Cela doit correspondre à au moins 20 à 30 documents différents. Nous vous recommandons d'examiner les prédictions initiales de deux à trois documents pour ensuite décider si vous devez modifier vos instructions avant d'augmenter progressivement l'échantillon de test à 10, 20, 30, X documents. Il s'agira alors d'un processus itératif.
Combien de documents dois-je annoter pour obtenir des mesures de performances fiables ?
Nous vous recommandons de valider pour chaque champ au moins dix documents ou dix exemples, ou les deux afin que le modèle puisse vous fournir des statistiques de validation significatives. Il s'agit du nombre minimum d'annotations, qui dépendront des exigences spécifiques du cas d'utilisation.
Les modèles de documents complexes et non structurés sont-ils consommés par des robots ou des API Document Understanding autonomes ?
Les modèles de Documents complexes et non structurés peuvent être consommés à la fois par des robots et par l'API Document Understanding Automation Cloud autonome.
Comment puis-je consommer des sorties de Documents complexes et non structurés ?
Les sorties des modèles peuvent être consommées par le biais d'API, d'activités Document Understanding ou d'activités IntelligentOCR. Veillez à ce que :
- Installez le package IOCR v6.23.2-preview ou version ultérieure et sélectionnez l'activité extracteur Document Understanding
- Installez le package Document Understanding v2.13.2-preview ou version ultérieure et sélectionnez l'activité Extraire les données du document
La fonctionnalité Extraction et traitement intelligents (IXP) Documents complexes et non structurés fournit-elle des scores de confiance ? Comment sont-ils calculés ?
Yes, we provide confidence scores in the model response and in Action Center (runtime), but not in the IXP user interface (design-time). We use the token probabilities returned by the LLM to estimate field and extraction level confidences.
Les sorties des modèles de Documents complexes et non structurés peuvent-elles être consommées à partir de déploiements hybrides, c'est-à-dire sur place avec Orchestrator ou Automation Suite et le modèle Extraction et traitement intelligents (IXP) Cloud ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
Les sorties des modèles de Documents complexes et non structurés Extraction et traitement intelligents (IXP) peuvent-elles être consommées à partir de différentes organisations ou locataires, c'est-à-dire Production, Développement ou UAT ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
La Station de validation fonctionne-t-elle avec la fonctionnalité Documents complexes et non structurés ?
Oui, cela fonctionne de la même manière que les projets Document Understanding Moderne ou Classique. Toutefois, toutes les extractions doivent être validées sous forme de tableaux.
Le modèle de Documents complexes et non structurés apprend-il en fonction de la validation HITL d'Action Center ?
Non, il n'existe actuellement aucune boucle de rétroaction entre Action Center et les modèles de Documents complexes et non structurés.Nous prévoyons la prise en charge de cette option dans les futures versions, ainsi que dans les modèles ajustables.
In practice, IXP can reliably extract up to approximately 1,200 field values per document.
This means that if a document requires more than 1,200 field values to be extracted, the model may reach its token limit. This can happen even if the document is well within the page limits listed in this section. Research and development work is ongoing to support higher field value limits in future releases.
If token limits are exceeded, predictions may be incomplete or empty regardless of the number of pages. For example, an 80-page document with 1,400 extracted field values may trigger a token-limit warning in the user interface. At runtime, when the token limit is exceeded, the API response will show this by returning occurrence and extraction confidence values of 0.
If page limits are exceeded, only the pages within the specified limits below are processed. Both of these behaviors apply to both Gemini and GPT-4o.
Runtime limits include:
- Nombre de pages par document:
- Pour Gemini, jusqu'à 500 pages.
- For GPT-4o, 50 pages and up to 150 pages using the iterative calling private preview feature.
- Token limits - Data-heavy documents with more than 200 extractions, such as lengthy tables, will likely reach the token limit. If GPT4-o reaches its limit, you can use the iterative calling private preview feature to increase the field output. Gemini, however, has a higher output token limit by default, so both models can return similar amounts of field values—Gemini in a single call, and GPT through multiple calls.
Cette fonctionnalité offre-t-elle des outils de surveillance ? Sont-ils différents des projets Document Understanding Modern ? Existe-t-il des dépendances par rapport à Insights ?
Actuellement, la fonctionnalité Documents complexes et non structurés ne fournit aucune fonctionnalité de surveillance, telle que la page Surveiller dans Projets modernes. Vous trouverez de plus amples informations sur les fonctionnalités de surveillance dans de futures versions.
Peut-on surveiller la consommation d’AI Units pour les projets de Documents complexes et non structurés ?
Actuellement, aucun suivi de la consommation par projet n’est disponible. Une fois entièrement intégrée, la consommation apparaîtra probablement dans le tableau de bord de la consommation d’AI Units et dans un tableau de bord distinct pour les Documents complexes et non structurés
Pouvons-nous détecter automatiquement la baisse des performances, par exemple, la dérive des données, des scores F1 inférieurs, etc. ?
Pour l'instant, nous ne fournissons aucune notification ni aucune alerte sur les performances des modèles.
À quelle fréquence les utilisateurs doivent-ils mettre à jour leurs modèles ou leurs instructions de saisie ?
Cela dépend de chaque cas d'utilisation, mais vous devez affiner vos instructions lorsque vos extractions sont sous-performantes.