- Vue d'ensemble (Overview)
- Construction de modèles
- Validation du modèle
- Déploiement du modèle
- Questions fréquemment posées
- Questions fréquemment posées

Guide de l'utilisateur des documents non structurés et complexes
Questions fréquemment posées
linkAccès et disponibilité
linkComment les clients et partenaires peuvent-ils accéder à la fonctionnalité Extraction et traitement intelligents (IXP) Documents non structurés et complexes ?
Les clients et les partenaires peuvent enregistrer leur intérêt sur le portail Insider, car la fonctionnalité Documents non structurés et complexes est actuellement disponible dans le programme d'aperçu. Nous examinons régulièrement les inscriptions. Les clients et partenaires sélectionnés sont informés pour rejoindre le programme de prévisualisation. Veillez à fournir autant de détails que possible sur le cas d'utilisation.
Quand la fonctionnalité sera-t-elle officiellement disponible en général ?
La date cible pour la publication officielle de la fonctionnalité Documents non structurés et complexes est fin juillet 2025. Certains clients peuvent participer à une mise à disposition générale contrôlée pendant le reste de la période de prévisualisation. Tous les cas d'utilisation disponibles contrôlés devront être approuvés par l'équipe Produit et pris en charge par leurs équipes de comptes respectives.
La fonctionnalité est-elle disponible pour les utilisateurs de la communauté ?
Oui, la fonctionnalité est disponible pour les utilisateurs Community, qui n’ont accès qu’à une fonctionnalité restreinte. Tous les locataires ou projets sont soumis à des limites prédéfinies de temps de conception et de temps d’exécution. Pour plus d’informations, consultez les sections Temps de conception et Temps d’exécution.
Quelles sont les options de déploiement d'Extraction et traitement intelligents (IXP) ? La capacité est-elle disponible localement ?
À l'heure actuelle, les capacités de Communications Mining et Documents non structurés et complexes d'Extraction et traitement intelligents (IXP) sont disponibles uniquement dans UiPath® Automation Cloud™.
Document Understanding est disponible dans les déploiements d'Automation Cloud, d'Automation Suite et de manière autonome. Pour plus d'informations sur les options de déploiement de Document Understanding, consultez la section Choix du type de déploiement.
La capacité est-elle disponible dans toutes les régions ?
À l’heure actuelle, la fonctionnalité Documents non structurés et complexes est généralement disponible pour les États-Unis et l’Europe, et disponible dans l’aperçu exclusif pour les régions du Canada, du Japon et de l’Australie.
Quelles langues sont prises en charge dans cette capacité ?
Les utilisateurs peuvent télécharger des documents et créer des modèles dans n’importe quel langue prise en charge par le modèle sélectionné dans Extraction et traitement intelligents (IXP).
Quels formats de fichiers sont pris en charge dans la fonctionnalité ?
Actuellement, cette fonctionnalité prend en charge les formats de fichier PNG, JPG ou JPEG, PDF et TIF ou TIFF.
Données et sécurité
linkLe service Extraction et traitement intelligents (IXP) utilise-t-il une IA spécialisée ou générative ?
Communications Mining utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
Document Understanding utilise des fonctionnalités spécialisées d'IA et d'IA générative, où toutes les fonctionnalités d'IA générative peuvent être désactivées si nécessaire.
L'extraction générative des documents non structurés et complexes utilise l'IA générative par le biais de LLM tiers. Il n'est pas possible d'utiliser cette fonctionnalité sans IA générative.
CommPath et DocPath sont-ils disponibles dans Extraction et traitement intelligents (IXP) ?
CommPath est disponible dans Communications Mining lorsque vous utilisez la fonctionnalité Extraction générative.
DocPath est disponible dans Document Understanding, uniquement dans l’expérience Moderne. Elle n’est pas disponible dans l’expérience Document Understanding Classique.
Aucun des deux n'est disponible dans la fonctionnalité Extraction générative des documents non structurés et complexes.
Est-ce qu'Extraction et traitement intelligents (IXP) passe par AI Trust Layer (AITL) ?
Oui, toutes les fonctionnalités du service Extraction et traitement intelligents (IXP) qui utilisent des LLM tiers passent par UiPath AITL. CommPath et DocPath sont les modèles propriétaires d'UiPath et ne passent pas par l'AITL.
Quels sont les LLM utilisés par la fonctionnalité ?
Les modèles GPT4o vision et Gemini sont disponibles dans la fonctionnalité Documents non structurés et complexes. Le modèle Gemini est disponible en tant que fonctionnalité de prétraitement intelligent des données tabulaires.
La capacité permet-elle d'activer son propre abonnement (BYO) ?
Pas actuellement, mais l'abonnement BYO sera pris en charge dans les versions futures.
Migration
linkPuis-je migrer mon cas d'utilisation de l'expérience classique Document Understanding vers la fonctionnalité Documents non structurés et complexes d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas d'utilisation de l'expérience moderne Document Understanding vers la fonctionnalité Documents non structurés et complexes d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Puis-je migrer mon cas des activités Extracteur génératif de Document Understanding vers la fonctionnalité Documents non structurés et complexes d'Extraction et traitement intelligents (IXP) ?
Pas encore, mais les fonctionnalités d'importation et d'exportation seront disponibles dans de futures versions.
Heure de conception
linkEn phase de conception, existe-t-il des limites pour cette capacité ?
Les limites de la phase de conception sont les suivantes :
- Nombre de champs par groupe de champs : jusqu'à 32 champs.
- Nombre de caractères par nom de champ : jusqu'à 32 caractères (à augmenter dans les versions futures).
- Nombre de caractères par instruction d'invite : jusqu'à 2 048 caractères. Cela s'applique à toutes les invites, y compris les instructions générales, les instructions de groupe de champs, les instructions de champ et les instructions de type de champ.
Puis-je créer des champs génériques dans la fonctionnalité Documents ?
Non, il n'existe pas de champ générique dans Extraction et traitement intelligents (IXP). Tous les champs doivent appartenir à un groupe de champs. Chaque groupe de champs représente un tableau distinct, où les champs représentent les colonnes du tableau. Cependant, il est possible de définir un groupe de champs au niveau parent représentant un type de document et d'ajouter des champs plus généraux sous forme de tableau sous ce groupe de champs.
Les modèles de documents non structurés et complexes du service Extraction et traitement intelligents (IXP) améliorent-ils les performances avec la labélisation ou les annotations ?
Non, le modèle n'apprend pas encore directement à partir des annotations de l'utilisateur. Actuellement, la façon d'améliorer les performances de votre modèle est de modifier vos instructions d'invite ou la configuration de votre modèle. Nous étudions différentes solutions, notamment l'apprentissage en contexte, l'amélioration des retours d'instructions et les modèles ajustables.
Pourquoi dois-je annoter des documents si cela n'améliore pas les performances du modèle ?
Il reste important de valider et d'annoter les documents pour établir la vérité du terrain pour l'évaluation des performances du modèle, qui est capturée dans les métriques de performances intégrées de la page Mesurer.
Combien de documents dois-je importer pour tester mes instructions ?
Vous devez télécharger un échantillon représentatif de vos documents pour couvrir toutes les variations possibles. Cela doit correspondre à au moins 20 à 30 documents différents. Nous vous recommandons d'examiner les prédictions initiales de deux à trois documents pour ensuite décider si vous devez modifier vos instructions avant d'augmenter progressivement l'échantillon de test à 10, 20, 30, X documents. Il s'agira alors d'un processus itératif.
Combien de documents dois-je annoter pour obtenir des mesures de performances fiables ?
Nous vous recommandons de valider pour chaque champ au moins dix documents ou dix exemples, ou les deux afin que le modèle puisse vous fournir des statistiques de validation significatives. Il s'agit du nombre minimum d'annotations, qui dépendront des exigences spécifiques du cas d'utilisation.
Exécution
linkExiste-t-il des limites d’exécution pour la capacité Documents non structurés et complexes ?
Les limites d’exécution sont les suivantes :
-
Nombre de pages par document : jusqu’à 150 pages. Les documents de plus de 50 pages nécessiteront une fonctionnalité de boucle, qui est actuellement en aperçu privé et dont l’accès est disponible sur demande.
Limites de jetons : les documents lourds de données et comportant plus de 200 extractions, tels que les tableaux longs, risquent d’atteindre la limite de jetons. Ces documents nécessiteront une fonctionnalité de boucle, qui est actuellement en aperçu privé dont l’accès est disponible sur demande.
Dans une version antérieure à la disponibilité générale, ces limites doivent toutes deux être considérablement augmentées. L'augmentation de la limite d'un document sera le produit du nombre de pages et du nombre de valeurs de champ qui doivent être extraites. Si la combinaison de ces deux éléments est suffisamment élevée, la limite maximale sera atteinte, mais on s'attend à prendre en charge des documents de 100 à 200 pages et un grand nombre de valeurs de champ nécessitant une extraction.
Il n'existe aucune limite stricte aux valeurs des champs à extraire, car cela dépend du document. Toutefois, si la limite du jeton est atteinte, un indicateur est produit dans la réponse de l'API pour toutes les prédictions de documents d'exécution dans lesquelles l'occurrence et la confiance d'extraction sont toutes deux renvoyées à zéro.
Pour le moment, si plus de 50 pages sont envoyées sans la fonctionnalité de boucle, seules les 50 premières pages sont utilisées. Si les limites de jetons sont atteintes, des prédictions vides sont renvoyées.
Les modèles de documents complexes et non structurés sont-ils consommés par des robots ou des API Document Understanding autonomes ?
Les modèles de documents non structurés et complexes peuvent être consommés à la fois par des robots et par l'API Document Understanding Automation Cloud autonome.
Comment puis-je consommer des sorties de documents non structurés et complexes ?
Les sorties des modèles peuvent être consommées par le biais d'API, d'activités Document Understanding ou d'activités IntelligentOCR. Veillez à ce que :
- Installez le package IOCR v6.23.2-preview ou version ultérieure et sélectionnez l'activité extracteur Document Understanding
- Installez le package Document Understanding v2.13.2-preview ou version ultérieure et sélectionnez l'activité Extraire les données du document
La fonctionnalité Extraction et traitement intelligents (IXP) Documents non structurés et complexes fournit-elle des scores de confiance ? Comment sont-ils calculés ?
Oui, nous produisons des scores de confiance dans la réponse du modèle et dans Action Center (lors de l'exécution), mais pas dans l'interface utilisateur Extraction et traitement intelligents (IXP) (conception). Nous utilisons les probabilités de jetons renvoyées par la LLM pour estimer les valeurs de confiance du champ et du niveau d'extraction.
Les sorties des modèles de documents non structurés et complexes peuvent-elles être consommées à partir de déploiements hybrides, c'est-à-dire sur place avec Orchestrator ou Automation Suite et le modèle Extraction et traitement intelligents (IXP) Cloud ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
Les sorties des modèles de documents non structurés et complexes Extraction et traitement intelligents (IXP) peuvent-elles être consommées à partir de différentes organisations ou locataires, c'est-à-dire Production, Développement ou UAT ?
Oui, cela est pris en charge par les applications externes. Pour plus d'informations, consultez la section Applis OAuth.
La Station de validation fonctionne-t-elle avec la fonctionnalité Documents non structurés et complexes ?
Oui, cela fonctionne de la même manière que les projets Document Understanding Moderne ou Classique. Toutefois, toutes les extractions doivent être validées sous forme de tableaux.
Le modèle de documents non structurés et complexes apprend-il en fonction de la validation HITL d'Action Center ?
Non, il n'existe actuellement aucune boucle de rétroaction entre Action Center et les modèles de documents non structurés et complexes. Nous prévoyons la prise en charge de cette option dans les futures versions, ainsi que dans les modèles ajustables.
Maintenance et surveillance
linkCette fonctionnalité offre-t-elle des outils de surveillance ? Sont-ils différents des projets Document Understanding Modern ? Existe-t-il des dépendances par rapport à Insights ?
Actuellement, la fonctionnalité Documents non structurés et complexes ne fournit aucune fonctionnalité de surveillance, telle que la page Surveiller dans Projets modernes. Vous trouverez de plus amples informations sur les fonctionnalités de surveillance dans de futures versions.
Peut-on surveiller la consommation d’AI Units pour les projets de documents non structurés et complexes ?
Actuellement, aucun suivi de la consommation par projet n’est disponible. Une fois entièrement intégrée, la consommation apparaîtra probablement dans le tableau de bord de la consommation d’AI Units et dans un tableau de bord distinct pour les documents non structurés et complexes
Pouvons-nous détecter automatiquement la baisse des performances, par exemple, la dérive des données, des scores F1 inférieurs, etc. ?
Pour l'instant, nous ne fournissons aucune notification ni aucune alerte sur les performances des modèles.
À quelle fréquence les utilisateurs doivent-ils mettre à jour leurs modèles ou leurs instructions de saisie ?
Cela dépend de chaque cas d'utilisation, mais vous devez affiner vos instructions lorsque vos extractions sont sous-performantes.