- Introduction
- Types de fonctionnalités
- Choisir la fonctionnalité appropriée
- Contrôle et administration de l'accès
- Licences
- Questions fréquemment posées

Aperçu de l'extraction et du traitement intelligents (IXP)
- Données de communication (via Communications Mining™)
- Documents non structurés et complexes (via Generative Extraction for Unstructured Documents™)
- Documents structurés et semi-structurés (via Document Understanding™)
Pour traiter les communications, utilisez Données de communication.
Pour traiter des documents, utilisez les fonctionnalités suivantes :
- La fonctionnalité Documents non structurés et complexes d’IXP. Vous pouvez utiliser cette fonctionnalité pour traiter des documents comptant jusqu’à 50 pages. Actuellement, la prise en charge des documents entre 50 et 150 pages est en version préliminaire. Il s’agit d’une limite temporaire qui sera augmentée dans les versions futures.
- Les activités d’Extraction générative Document Understanding, qui sont disponibles uniquement dans Studio Web et Studio Desktop. Vous pouvez utiliser ces activités pour traiter des documents contenant plus de 50 pages.
- L'expérience classique ou moderne de Document Understanding™.
Utilisez toutes les fonctionnalités applicables si votre charge de travail contient à la fois des communications et des documents. Par exemple, traitez les e-mails à l'aide de la fonctionnalité Communications Mining accessible dans l'onglet Données de communication et les pièces jointes en fonction des types de document. Voici quelques approches possibles :
- Option 1 : Données de communication et documents structurés et semi-structurés.
- Option 2 : Données de communication et documents non structurés et complexes.
- Option 3 : Données de communication, documents structurés et semi-structurés et documents non structurés et complexes.
Pour de plus amples informations à ce sujet, consultez la section Choisir la fonctionnalité appropriée.
Toutes les communications non structurées succinctes telles que les e-mails, messages, tickets d'assistance, avis, etc., doivent être traitées à l'aide de la fonctionnalité Données de communication, accessible dans Communications Mining™.
L'extraction des données de communication repose sur une combinaison d'IA spécialisée et d'IA générative permettant d'améliorer l'expérience utilisateur et les délais de valorisation.
Vous pouvez désactiver toutes les capacités d'IA générative incluses dans cette fonctionnalité, telles que l'annotation générative et l'extraction générative, au niveau de l'ensemble de données dans Communications Mining.
La fonctionnalité Documents non structurés et complexes, ainsi que les activités d'extraction générative de Document Understanding, sont adaptées aux documents non structurés et complexes.
Ces documents contiennent des paragraphes de texte libre et des éléments complexes, par exemple :
- Tableaux complexes
- Graphiques
- Graphiques
- Cases à cocher
- Encadrés
- Signatures
- Écriture manuscrite et plus encore.
Les documents non structurés se présentent souvent dans différents formats ou mises en page et peuvent nécessiter des schémas d'extraction différents. Une même pile de documents, par exemple une demande de prêt hypothécaire, peut comporter plusieurs types de documents, comme une preuve d'identité, une preuve d'adresse ou des relevés bancaires.Un tel document combiné peut nécessiter une Extraction générative s'il n'est pas divisé en types de documents distincts.
En outre, vous devrez peut-être extraire des valeurs qui ne sont pas explicitement présentes dans les documents, autrement dit, il faut les déduire.Voici quelques exemples de valeurs déduites :
- Des valeurs qui ne figurent nulle part dans un document, mais qui sont induites dans son contexte.
- Des valeurs qui doivent être concaténées entre différentes zones d'un document.
- Des valeurs qui s'étendent sur plusieurs paragraphes, lignes ou colonnes.
Les activités IXP et Extraction générative de Document Understanding s'appuient sur les fonctionnalités d'IA générative. Par conséquent, il n'est pas possible d'utiliser ces produits sans activer l'IA générative. Si les politiques de votre organisation vous empêchent d'utiliser les fonctionnalités d'IA générative en production, utilisez des projets classiques ou modernes dans Document Understanding™.
La capacité IXP pour les documents non structurés et complexes prend actuellement en charge des documents jusqu’à 50 pages. Actuellement, la prise en charge des documents entre 50 et 150 pages est en version préliminaire. En attendant, si vous devez traiter des documents non structurés de plus de 50 pages, vous pouvez utiliser les activités d’extraction générative de Document Understanding avec la génération augmentée par récupération (RAG, pour Retrieval Augmented Generation) intégrée avec ces documents.
Les activités d'extraction générative de Document Understanding sont accessibles uniquement par le biais de Studio Web ou de Studio Desktop.Les extracteurs suivants sont disponibles au sein de cette fonctionnalité :
- Mise en page simple de document long : optimisée pour les documents longs contenant principalement du texte et des titres. Utilise la version GPT4-turbo AI Trust Layer LLM. Prend uniquement en charge le traitement de texte, dispose d'un RAG intégré et d'une limite de 500 pages par document.
- Layout complexe de document long (Aperçu) : optimisé pour les documents longs contenant des éléments complexes tels que des tableaux, des images, de l'écriture manuscrite, des éléments de formulaire et des zones flottantes. Utilise le LLM GPT-4o AI Trust Layer. Prend en charge le traitement de texte et d'images, dispose d'une RAG intégrée, limite de 500 pages par document.
- Mise en page complexe de document court (Aperçu) – optimisée pour les documents courts ou semi-structurés contenant des éléments complexes tels que des tableaux, des images, de l'écriture manuscrite, des éléments de formulaire ou des cases flottantes. Utilise le LLM GPT-4o AI Trust Layer. Prend en charge le traitement de texte et d'images, ne dispose pas de RAG intégrée, limite de 20 pages par document.
La fonctionnalité Documents complexes et non structurés offre les avantages suivants, entre autres :
- Interface utilisateur pour l'annotation et la validation des documents.
- Statistiques de performance et scores de confiance de toutes les extractions.
- Capacité d'itérer rapidement le schéma d'extraction et les instructions des requêtes.
- Possibilité d'enregistrer et de comparer différentes versions de modèles.
-
Possibilité de choisir entre différents grands modèles de langage (LLM). Actuellement, IXP ne prend en charge que GPT-4o. Toutefois, d'autres modèles seront disponibles dans les versions futures.
- Paramètres de modèle configurables, tels que Température, Seed, etc.
La fonctionnalité Documents structurés et semi-structurés d'UiPath® IXP tire parti des projets Document Understanding™ classiques et modernes.Ces projets conviennent mieux aux documents structurés ou semi-structurés et tendent à posséder une mise en page identique ou très similaire, sans aucun élément complexe.
Les expériences classiques et modernes de Document Understanding utilisent une combinaison de modèles spécialisés prêts à l'emploi et de fonctionnalités d'IA générative. Vous pouvez gérer toutes les fonctionnalités d'IA générative au sein de cette fonctionnalité, telles que la classification automatique et l'annotation générative, depuis la politique AI Trust Layer.
Pour de plus amples informations sur le choix d'un projet classique ou moderne, consultez Choisir le type de projet.