- Notes de publication de Document Understanding
- Mars 2026
- Février 2026
- Janvier 2026
- Notes de version des paquets ML et des points de terminaison publics

Notes de publication de Document Understanding
Correction d'un bug
Amélioration de la fiabilité de l’extraction pour des fournisseurs spécifiques
Les modèles d’extraction tels que LayoutLM et Helix n’ignorent plus des champs spécifiques pour certains fournisseurs de documents. L’extraction du champ se comporte désormais de manière cohérente entre les fournisseurs pris en charge.
Document Understanding API v2 (aperçu)
L’API Document Understanding v2 ajoute l’extraction et la validation basées sur la taxonomie, l’évaluation des règles métier, la prise en charge étendue des langues non latines et la prise en charge FieldGroup d’Extraction et traitement intelligents (IXP) dans le résultat de l’extraction.
Nouveautés
- Découverte retourne la taxonomie associée dans la réponse afin que vous puissiez l’utiliser pour guider l’extraction et la validation.
- L’extraction et la validation acceptent la taxonomie en tant que paramètre d’entrée. Cela permet l’extraction partielle, les remplacements de type de données et une personnalisation de la validation supplémentaire (par exemple, modification des raccourcis clavier de champ ou de la couleur d’affichage).
- L’API évalue les règles métier définies dans la taxonomie pendant l’extraction et la validation pour garantir que les données extraites sont conformes aux exigences configurées telles que les champs obligatoires et les valeurs autorisées.
- Les projets prédéfinis prennent désormais en charge l’extraction basée sur des balises à l’aide d’une seule balise nommée Production.
- Le résultat de l’extraction Extraction et traitement intelligents (IXP) est désormais retourné en tant que FieldGroups au lieu de tables. Avec FieldGroups, chaque champ préserve son type de données Extraction et traitement intelligents (IXP) réel (par exemple,
Date,Number,MonetaryQuantity). - Un nouveau projet prédéfini offre une prise en charge améliorée des jeux de caractères non latins.
Changements radicaux
Lors de la mise à niveau de l’API Document Understanding v1 vers v2, mettez à jour vos automatisations pour les modifications suivantes :
- Les routes basées sur des balises utilisent désormais
/projects/{projectId}/tags/{tag}/.... Les demandes utilisant la structure de routage précédente renvoient 400 Bad Request dans v2. - La propriété
fieldsa été supprimée des réponses de découverte.Utilisez plutôttaxonomy. - Les routes de découverte retournent désormais
tagsau lieu detag. - Les résultats de l’extraction Extraction et traitement intelligents (IXP) sont désormais retournés en tant que FieldGroups au lieu de Tables, ce qui nécessite des mises à jour si votre automatisation traite actuellement les résultats de l’extraction comme des tables pour gérer la nouvelle structure et les types de données FieldGroup.
- Mettez à jour la logique qui vérifie FieldType == Table.Dans v2, ces entrées retournent FieldType == FieldGroup.Si votre analyseur gère uniquement Table, il ignorera les données.
Groupes de champs et prise en charge de la quantité monétaire (aperçu)
La prise en charge des groupes de champs et de la quantité monétaire dans la Station de validation, les activités et les API est désormais disponible en aperçu.
Les groupes de champs permettent l’affichage des structures de champs hiérarchiques dans la Station de validation, permettant une Organization logique des données extraites. Les groupes peuvent être à une seule valeur, à plusieurs valeurs ou mixtes, composés de champs et de tables. Les groupes de champs préservent la structure hiérarchique des données extraites, ce qui facilite et accélère la validation des paquets de documents multi-pages volumineux.
Le nouveau type de champ MonetaryQuantity introduit des types de données de montant et de devise dédiés, éliminant les incohérences de type de données entre l’extraction et la validation.
Cette amélioration aligne le modèle de type de données Document Understanding sur les Documents complexes et non structurés Extraction et traitement intelligents (IXP).
Résolution de bogues
- Correction d’un Problème dans lequel le contrôle de validation dans les Apps (personnalisées) et les Apps d’action (personnalisées) déclenchait l’événement de rappel du composant Sur prêt trop tôt, entraînant l’échec d’opérations telles que la définition des valeurs de champ dans le workflow Sur prêt.
- Correction d’un Problème dans lequel les exceptions de concession de licence OpenAI étaient incorrectement exposées.
Autorisations d’accès au champ
En fonction d’un rôle, vous pouvez affecter des autorisations d’accès au champ.- L'autorisation Fields.Create permet à un utilisateur de créer un champ.
- L’autorisation Fields.Delete permet à un utilisateur de supprimer un champ existant.
- L'autorisation Fields.Read permet à un utilisateur d'afficher un champ.
- L’autorisation Fields.Update permet à un utilisateur de mettre à jour un champ existant.
Les utilisateurs ayant le rôle Annotateur de données Document Understanding ou le rôle Visionneuse Document Understanding disposent uniquement de l’autorisation Fields.Read.
Les utilisateurs ayant les rôles Développeur Document Understanding, Formateur de modèle Document Understanding ou Administrator de projet Document Understanding disposent de toutes les autorisations de champ disponibles.
Autorisation de projets au niveau du locataire
Une nouvelle autorisation Projets est disponible au niveau du locataire. La création de projet est désormais contrôlée au niveau du locataire via l’autorisation Projects.Create tandis que les autorisations au niveau du projet sont limitées à lire, mettre à jour et supprimer des Actions en fonction de l’affectation de rôle.
Les utilisateurs disposant du rôle Administrator Document Understanding peuvent créer des projets à l’aide de la nouvelle autorisation Projects.Create.
Pour plus d’informations, consultez la page Contrôle d’accès en fonction des rôles.