- Notes de publication de Document Understanding
- Notes de version des paquets ML et des points de terminaison publics
- Mises à jour générales des paquets ML et des points de terminaison publics
- Historique des versions des paquets ML et des points de terminaison publics

Notes de publication de Document Understanding
Nouveautés
- Les points de terminaison publics pour les modèles d'extraction au Japon, à l'exception des états financiers, sont désormais basés sur DocPath, .
- Les points de terminaison publics pour le Japon incluent désormais les reçus 2, les factures2 et les informations de clôture des prêt hypothécaires aux États-Unis. Pour plus d’informations, accédez à la documentation et développez le tableau pour obtenir une liste complète et déroulante. Nous vous recommandons de vous assurer que votre activité est connectée au bon point de terminaison en fonction de chaque région de serveur.
Date de publication : 14 août 2025
Nouveautés
Nous sommes ravis d'annoncer la sortie d'une précision améliorée pour les points de terminaison publics basés sur UiPath DocPath en Europe.
- 9465
- Factures Chine
- Factures hébreu
- Factures, Japon
- Reçus Japon (Receipts Japan)
Avec cet ajout, tous les modèles sont désormais basés sur UiPath DocPath en Europe, à l'exception des états financiers.
Nouveaux types de documents
- Factures2 : ce type de document est formé pour extraire les principales données d'une grande variété de types de factures, notamment les factures standard, les notes de crédit, les factures indiennes et les factures d'expédition. Le schéma amélioré se compose de 55 champs réguliers, de deux tableaux structurés : un pour les éléments de ligne (13 colonnes) et un pour les détails de paiement bancaire (9 colonnes) et d'un classifieur de devises.
- Reçus2 : Ce type de document est entraîné pour extraire des données clés à partir d'un large éventail de types de reçus, y compris, sans s'y limiter, les reçus de parking, billets de train, factures d'hôtel, achats à l'aéroport, repas, reçus de pharmacie, reçus électroniques, etc.Le schéma amélioré se compose de 60 champs réguliers et d'un tableau structuré d'éléments à 6 colonnes.
- Déclaration de clôture de prêt hypothécaire aux États-Unis : ce type de document est entraîné pour extraire des données clés à partir des formulaires standards de déclaration de clôture utilisés aux États-Unis. Le schéma comprend 20 champs classiques couvrant les informations sur l'emprunteur, les détails du bien, les conditions du prêt, les récapitulatifs de transaction et les montants à verser à la clôture.
Notes de publication : 23 juin 2025
Cette mise à jour apporte plusieurs améliorations à notre moteur de reconnaissance optique des caractères (OCR), visant à améliorer sa précision et sa fiabilité dans une variété de styles d'entrée plus étendue :
-
Meilleure détection de l’écriture manuscrite.
-
Distinction plus claire entre les caractères « O » et « 0 » dans les polices à chasse fixe.
-
Amélioration de la reconnaissance du texte imprimé en matrice de points.
Ces améliorations renforcent la fiabilité d’une grande variété de types de documents.
Notes de publication : 19 mai 2025
Vous pouvez désormais également utiliser le type de document Reçus Japon par le biais d’API et d’activités IntelligentOCR et Document Understanding. Cette option est disponible pour tous les locataires basés dans la région du Japon.
Date de publication : 11 avril 2025
Suppression des modèles prêts à l’emploi antérieurs à 2023.4
À mesure que nous publions de nouvelles alternatives et des solutions améliorées, nous avons supprimé la prise en charge des modèles prêts à l’emploi, notamment UiPath Document Understanding OCR et OCR_CPU, les paquets ML d’extraction de données, et DocumentClassifier.
Le tableau suivant décrit le plan de suppression.
| Fonctionnalité ou capacité | Suppression annoncée en | Supprimé le | Remarques |
|---|---|---|---|
| Paquets ML prêts à l’emploi antérieurs à 2023.4 | Avril 2025 | Avril 2025 | Nous vous recommandons d’utiliser la dernière version des paquets ML prêts à l’emploi. |
Pour plus d'informations sur les obsolescences, consultez le calendrier d'obsolescence dans le guide de présentation.
Date de publication : 19 mars 2025
Améliorations
- La détection globale des cases à cocher, de l’écriture manuscrite et du texte imprimé est améliorée.
- La précision de la reconnaissance de l’écriture est améliorée.
- La détection des tampons a été améliorée pour les tampons japonais.
- La taille et la précision de positionnement des boîtes de délimitation sont améliorées.
Date de publication : 28 novembre 2024
Nouveau type de document
Cette version introduit un nouveau type de document, Reçus Japon. Ce nouveau point de terminaison public peut extraire des détails clés de divers types de documents tels que les reçus de caisse ordinaires, les reçus de restaurants, les hôtels, les trains, les parkings et d’autres types de reçus rédigés en japonais.
Points de terminaison publics pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan) basés sur UiPath DocPath
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan). Cette nouvelle génération de points de terminaison, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.
Améliorations de Factures Japon (Invoices Japan)
- Champs réguliers :
- Montant net réduit (Net amount reduced)
- Taxe réduite (Tax reduced)
- Montant net non réduit
- Taxe non réduite (Tax non-reduced)
- Montant de la retenue à la source (Withholding tax amount)
- Dépôt (Deposit)
- Champs de colonnes :
- Taux de taxation de l'élément (Item tax rate)
- Taxe d'enregistrement de l'élément (Item registration tax)
- Coût de l'élément (Item fee)
Date de publication : 29 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
Améliorations
Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez UiPath Extended Languages OCR ou l'OCR chinois, coréen ou japonais, la sortie correspondra à des blocs de mots réguliers au lieu de caractères individuels.
Date de publication : 15 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
Améliorations
- La précision du paquet ML Factures Japon (Invoices Japan) a été améliorée.
- Nous avons amélioré l'espacement et l'analyse des mots lorsque des caractères chinois, japonais ou coréen sont mélangés avec des caractères latins, de la ponctuation et des nombres dans les documents.
- Nous avons corrigé un problème qui faisait que les pipelines d'entraînement AI Center signalaient des scores élevés inexacts pour les types de champ
ID NumberetPhone Number. Cela garantit que les scores rapportés correspondent aux scores réels.
Date de publication : 3 octobre 2024
Nous avons le plaisir d'annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en disponibilité générale. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l'Inde, ainsi que dans des langues utilisant l'alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Date de publication : 17 septembre 2024
Amélioration des performances et nouveaux points de terminaison du modèle inscrits sur UiPath DocPath
Cette version améliore la précision et les performances des modèles basés sur UiPath DocPath, le nouveau LLM UiPath. De plus, les modèles suivants sont désormais également basés sur UiPath DocPath :
- 709
- 941x
- 1040x
- 3 949
- 3949a
Point de terminaison du modèle redirigé vers l’ancienne génération
En raison de problèmes de performances, le point de terminaison du modèle État financier (Financial Statement) est redirigé vers l’ancienne génération.
Modèle d’aperçu supprimé
Le modèle 990 (Aperçu) (990 (Preview)) est supprimé des points de terminaison publics et des paquets ML d’extraction de données.
Date de publication : 8 juillet 2024
L’OCR UiPath pour le chinois, le japonais et le coréen sera obsolète à partir de janvier 2025. Nous recommandons d’utiliser plutôt UiPath Extended Languages OCR.
Consultez la page Calendrier d’obsolescence pour plus d’informations sur les obsolescences et les suppressions à venir.
Date de publication : 12 juin 2024
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour les factures et les reçus. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures Chine
- Factures hébreu
- Factures, Japon
Consultez les notes de publication pour les futures annonces.
Date de publication : 29 mai 2024
Nous sommes ravis d'annoncer le lancement de points de terminaison améliorés pour nos paquets ML pré-entraînés prêts à l'emploi. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath®, offre davantage de précision ainsi que des performances améliorées.
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures
- Factures Chine
- Factures hébreu
- Factures, Japon
- Reçus
Consultez les notes de publication pour les futures annonces.
Date de publication : 28 mars 2024
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en Aperçu public. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Date de publication : 27 avril 2023
Les paquets ML versions v23.4 et supérieures ont maintenant la possibilité de s’entraîner à l’aide de Frozen Backbone. Cette nouvelle approche s’entraîne plus rapidement et donne de meilleurs résultats pour les ensembles d’entraînement de petite taille ou à faible diversité inférieurs à 400 pages. Vous pouvez remplacer ce comportement en utilisant les nouvelles variables d’environnement du pipeline d’entraînement documentées dans la documentation officielle.
Date de publication : 29 novembre 2022
L’abandon prochain du paquet ML pré-entraîné Factures Australie a été annoncé. Nous vous recommandons d’utiliser plutôt le paquet ML Factures. Vous trouverez ici plus de détails à ce sujet.
Date de publication : 27 juin 2022
Publié dans les points de terminaison
Le point de terminaison de la classification ML est désormais disponible en aperçu public.
Points de terminaison
Date de publication : 20 juin 2022
Publié dans les points de terminaison
Le point de terminaison public de l’OCR UiPath pour le chinois, le japonais et le coréen est désormais disponible pour tous.
Paquets ML Extraction de données
Date de sortie : 6 juin 2022
Date de publication dans AI Center Cloud | Paquets ML d’extraction de données
Une nouvelle méthode OCR, UiPath Chinese, Japanese, Korean OCR, est désormais disponible et peut être appliquée aux projets nouveaux ou déjà créés à partir du service Document Understanding, sur cloud uniquement.
- Améliorations des points de terminaison publics UiPath DocPath
- Nouveautés
- Améliorations des points de terminaison publics UiPath DocPath
- Nouveautés
- Nouveaux types de documents
- Fonctionnalités de reconnaissance de caractères améliorées
- Document de type Reçus Japon disponible via des API et activités
- Suppression des modèles prêts à l’emploi antérieurs à 2023.4
- Suppression des modèles prêts à l’emploi antérieurs à 2023.4
- Publication du point de terminaison public d’OCR UiPath Document
- Améliorations
- Version des points de terminaison publics UiPath DocPath
- Nouveau type de document
- Points de terminaison publics pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan) basés sur UiPath DocPath
- Améliorations de Factures Japon (Invoices Japan)
- Version des points de terminaison publics de Factures Japon (Invoices Japan)
- Améliorations
- Nouvelle version des points de terminaison publics Factures Japon (Invoices Japan)
- Améliorations
- UiPath Extended Languages OCR en disponibilité générale
- Nouveaux points de terminaison publics basés sur UiPath® DocPath
- Amélioration des performances et nouveaux points de terminaison du modèle inscrits sur UiPath DocPath
- Point de terminaison du modèle redirigé vers l’ancienne génération
- Modèle d’aperçu supprimé
- Obsolescence de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison publics pour les factures et les reçus basés sur UiPath® DocPath
- Points de terminaison publics basés sur DocPath
- Outil de reconnaissance optique de caractères UiPath Extended Languages OCR en aperçu public
- Entraînement de Frozen Backbone
- Obsolescence de Factures Australie
- Aperçu public du point de terminaison de la classification ML
- Publication de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison
- Paquets ML Extraction de données