- Document Understanding pour Automation Cloud et Test Cloud
- Document Understanding pour Automation Cloud et Test Cloud pour le secteur public
- Document Understanding pour Automation Cloud et Test Cloud dédiés
- Paquets ML et points de terminaison publics
- Mises à jour générales des paquets ML et des points de terminaison publics
- Historique des versions des paquets ML et des points de terminaison publics
Notes de publication de Document Understanding
Publication du point de terminaison public d’OCR UiPath Document
Date de publication : 29 avril 2026
Amélioration
- The UiPath Document OCR model now better detects signatures in documents where multiple nearby signatures overlap with each other.
Correction d'un bug
- Text previously obscured by overlapping signatures is now correctly recognized and included in the digitization output.
Publication du point de terminaison public d’OCR UiPath Document
Date de publication : 20 janvier 2026
Améliorations
- Gestion améliorée des noms d'entreprise affichés sous forme de logos ou de texte stylisé pendant l'OCR dans Document Understanding.
- Gestion améliorée de l'OCR pour les numéros ID arabes contenant des chiffres arabes. Cette mise à jour améliore la reconnaissance des chiffres dans les formats d'ID arabes pris en charge, ce qui aide à réduire les incidents où des caractères étaient manquants ou incorrectement reconnus pendant l'extraction.
Publication du point de terminaison public d’OCR UiPath Document
.Date de publication : 4 décembre 2025
Améliorations
Ajout de la prise en charge des signes diacritiques hawaïens pour améliorer la précision de la reconnaissance dans les documents contenant du Text en langue hawaïenne.
Améliorations des points de terminaison publics UiPath Helix Extractor
Date de version : 7 novembre 2025
Nouveautés
- Les points de terminaison publics pour les modèles d'extraction aux États-Unis, à l'exception des états financiers, sont désormais basés sur l'extracteur Helix.
- Les points de terminaison publics pour les États-Unis incluent désormais Reçus2, Factures2, Reçus Japon, et Informations de clôture des prêts aux États-Unis. Pour plus d'informations, accédez à la documentation Points de terminaison publics et développez la table pour obtenir une liste complète et déroulante. Nous vous recommandons de vous assurer que votre activité est connectée au bon point de terminaison en fonction de chaque région de serveur.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Améliorations des points de terminaison publics UiPath Helix Extractor
Nouveautés
- Les points de terminaison publics pour les modèles d'extraction au Japon, à l'exception des états financiers, sont désormais basés sur Helix Extractor.
- Les points de terminaison publics pour le Japon incluent désormais les reçus 2, les factures2 et les informations de clôture des prêt hypothécaires aux États-Unis. Pour plus d'informations, accédez à la documentation Points de terminaison publics et développez la table pour obtenir une liste complète et déroulante. Nous vous recommandons de vous assurer que votre activité est connectée au bon point de terminaison en fonction de chaque région de serveur.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Améliorations des points de terminaison publics UiPath Helix Extractor
Date de publication : 14 août 2025
Nouveautés
Nous sommes heureux d'annoncer la publication d'une précision améliorée pour les points de terminaison publics basés sur UiPath Helix Extractor dans la région Europe.
Avec cette publication, les modèles suivants sont désormais également basés sur UiPath Helix Extractor dans la région Europe :
- 9465
- Factures Chine
- Factures hébreu
- Factures, Japon
- Reçus Japon (Receipts Japan)
Avec cet ajout, tous les modèles sont désormais basés sur UiPath Helix Extractor dans la région Europe, à l’exception des états financiers.
Nouveaux types de documents
Cette version apporte les nouveaux types de documents suivants :
- Factures2: ce type de document est entraîné pour extraire des points de données clés à partir d’une grande variété de types de factures, notamment des factures standard, des notes de crédit, des factures indiennes et des factures d’expédition. Le schéma amélioré se compose de 55 champs réguliers, de deux tables structurées et d'un classifieur de devise.
- Reçus2: ce type de document est entraîné pour extraire des points de données clés à partir d'un large éventail de types de reçus, y compris, mais sans s'y limiter, les reçus de parking, les tickets de parking, les factures d'hôtel, les factures d'hôtel, les parkings, les reçus de pharmacie, les reçus électroniques, etc. Le schéma amélioré se compose de 60 champs réguliers et d'un tableau structuré d'éléments avec 6 colonnes.
- Informations de clôture de prêt hypothécaire aux États-Unis: ce type de document est entraîné pour extraire les points de données clés des formulaires de déclaration de clôture de prêt aux États-Unis. Le schéma comprend 20 champs réguliers capturant les détails de l’emprunteur, les informations sur la propriété, les conditions de prêt, les résumés de transaction et les chiffres de clôture.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Fonctionnalités de reconnaissance de caractères améliorées
Notes de version : 23 juin 2025
Cette mise à jour apporte plusieurs améliorations à notre moteur de reconnaissance optique des caractères (OCR), visant à améliorer sa précision et sa fiabilité dans une variété de styles d'entrée plus étendue :
- Meilleure détection de l’écriture manuscrite.
- Distinction plus claire entre les caractères « O » et « 0 » dans les polices à chasse fixe.
- Amélioration de la reconnaissance du texte imprimé en matrice de points.
Ces améliorations renforcent la fiabilité d’une grande variété de types de documents.
Document de type Reçus Japon disponible via des API et activités
Notes de version : 19 mai 2025
Vous pouvez désormais également utiliser le type de document Reçus Japon par le biais d’API et d’activités IntelligentOCR et Document Understanding. Cette option est disponible pour tous les locataires basés dans la région du Japon.
Suppression des modèles prêts à l’emploi antérieurs à 2023.4
Date de sortie : 11 avril 2025
Suppression des modèles prêts à l’emploi antérieurs à 2023.4
À mesure que nous publions de nouvelles alternatives et des solutions améliorées, nous avons supprimé la prise en charge des modèles prêts à l’emploi, notamment UiPath Document Understanding OCR et OCR_CPU, les paquets ML d’extraction de données, et DocumentClassifier.
Le tableau suivant décrit le plan de suppression.
| Fonctionnalité ou capacité | Suppression annoncée en | Supprimé le | Remarques |
|---|---|---|---|
| Paquets ML prêts à l’emploi antérieurs à 2023.4 | Avril 2025 | Avril 2025 | Nous vous recommandons d’utiliser la dernière version des paquets ML prêts à l’emploi. |
Pour plus d'informations sur les obsolescences, consultez le calendrier d'obsolescence dans le guide de présentation.
Publication du point de terminaison public d’OCR UiPath Document
Date de publication : 19 mars 2025
Améliorations
- La détection globale des cases à cocher, de l’écriture manuscrite et du texte imprimé est améliorée.
- La précision de la reconnaissance de l’écriture est améliorée.
- La détection des tampons a été améliorée pour les tampons japonais.
- La taille et la précision de positionnement des boîtes de délimitation sont améliorées.
Version des points de terminaison publics UiPath Helix Extractor
Date de publication : 28 novembre 2024
Nouveau type de document
Cette version introduit un nouveau type de document, Reçus Japon. Ce nouveau point de terminaison public peut extraire des détails clés de divers types de documents tels que les reçus de caisse ordinaires, les reçus de restaurants, les hôtels, les trains, les parkings et d’autres types de reçus rédigés en japonais.
Points de terminaison publics pour Invoices China et Invoices Japan basés sur UiPath Helix Extractor
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan). Cette nouvelle génération de points de terminaison, basée sur UiPath Helix Extractor, le nouveau UiPath LLM, apporte une précision et des performances améliorées.
Améliorations de Factures Japon (Invoices Japan)
Nous avons apporté des améliorations considérables au point de terminaison public Factures Japon (Invoices Japan) en ajoutant de nouveaux champs, tels que :
- Champs réguliers :
- Montant net réduit (Net amount reduced)
- Taxe réduite (Tax reduced)
- Montant net non réduit
- Taxe non réduite (Tax non-reduced)
- Montant de la retenue à la source (Withholding tax amount)
- Dépôt (Deposit)
- Champs de colonnes :
- Taux de taxation de l'élément (Item tax rate)
- Taxe d'enregistrement de l'élément (Item registration tax)
- Coût de l'élément (Item fee)
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Version des points de terminaison publics de Factures Japon (Invoices Japan)
Date de publication : 29 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
Améliorations
Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez UiPath Extended Languages OCR ou l'OCR chinois, coréen ou japonais, la sortie correspondra à des blocs de mots réguliers au lieu de caractères individuels.
Nouvelle version des points de terminaison publics Factures Japon (Invoices Japan)
Date de publication : 15 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
Améliorations
- La précision du paquet ML Factures Japon (Invoices Japan) a été améliorée.
- Nous avons amélioré l'espacement et l'analyse des mots lorsque des caractères chinois, japonais ou coréen sont mélangés avec des caractères latins, de la ponctuation et des nombres dans les documents.
- Nous avons corrigé un problème qui faisait que les pipelines d'entraînement AI Center signalaient des scores élevés inexacts pour les types de champ
ID NumberetPhone Number. Cela garantit que les scores rapportés correspondent aux scores réels.
UiPath Extended Languages OCR en disponibilité générale
Date de publication : 3 octobre 2024
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais disponible pour tous. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l'Inde, ainsi que dans des langues utilisant l'alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Nouveaux points de terminaison publics basés sur UiPath® Helix Extractor
Date de publication : 17 septembre 2024
Performances améliorées et nouveaux points de terminaison de modèle inscrits sur UiPath Helix Extractor
Cette version propose une précision et des performances améliorées pour les modèles basés sur l’ UiPath Helix Extractor, le nouveau LLM UiPath. De plus, les modèles suivants sont désormais également basés sur le UiPath Helix Extractor :
- 709
- 941x
- 1040x
- 3 949
- 3949a
Point de terminaison du modèle redirigé vers l’ancienne génération
En raison de problèmes de performances, le point de terminaison du modèle État financier (Financial Statement) est redirigé vers l’ancienne génération.
Modèle d’aperçu supprimé
Le modèle 990 (Aperçu) (990 (Preview)) est supprimé des points de terminaison publics et des paquets ML d’extraction de données.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Obsolescence de l’OCR UiPath pour le chinois, le japonais et le coréen
Date de publication : 8 juillet 2024
L'OCR UiPath pour le chinois, le japonais et le coréen sera obsolète à partir de janvier 2025. Nous recommandons d'utiliser à la place l'outil de reconnaissance optique de caractères UiPath Extended Languages.
Consultez la page Calendrier d’obsolescence pour plus d’informations sur les obsolescences et les suppressions à venir.
Points de terminaison publics pour Invoices et Receipts basés sur UiPath® Helix Extractor
Date de publication : 12 juin 2024
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour les factures et les reçus. Cette nouvelle génération basée sur UiPath Helix Extractor, le nouveau UiPath LLM, apporte une précision et des performances améliorées.
Nous remplaçons progressivement nos modèles par une nouvelle génération de modèles. Pour l’instant, tous les points de terminaison publics sont basés sur Helix Extractor, à l’ exception des points de terminaison suivants :
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures Chine
- Factures hébreu
- Factures, Japon
Consultez les notes de publication pour les futures annonces.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Points de terminaison publics basés sur Helix Extractor
Date de publication : 29 mai 2024
Nous sommes ravis d’annoncer le lancement de points de terminaison améliorés pour nos paquets ML pré-entraînés prêts à l’emploi. Cette nouvelle génération, basée sur l’ UiPath Helix Extractor, le nouveau LLM UiPath®, offre davantage de précision ainsi que des performances améliorées.
Nous remplaçons progressivement nos modèles par une nouvelle génération de modèles. Pour l’instant, tous les points de terminaison publics sont basés sur Helix Extractor, à l’ exception des points de terminaison suivants :
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures
- Factures Chine
- Factures hébreu
- Factures, Japon
- Reçus
Consultez les notes de publication pour les futures annonces.
Erratum - ajouté le 16 janvier 2025 : dans le cadre de notre alignement continu de l'évolution des produits et du portefeuille, nous avons mis à jour le nom du produit en exécutant UiPath Helix Extractor. Toutes les références de ce document reflètent ce changement.
Outil de reconnaissance optique de caractères UiPath Extended Languages OCR en aperçu public
Date de publication : 28 mars 2024
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en Aperçu public. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l'Inde, ainsi que dans des langues utilisant l'alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Entraînement de Frozen Backbone
Date de publication : 27 avril 2023
Les paquets ML versions v23.4 et supérieures ont maintenant la possibilité de s’entraîner à l’aide de Frozen Backbone. Cette nouvelle approche s’entraîne plus rapidement et donne de meilleurs résultats pour les ensembles d’entraînement de petite taille ou à faible diversité inférieurs à 400 pages. Vous pouvez remplacer ce comportement en utilisant les nouvelles variables d’environnement du pipeline d’entraînement documentées dans la documentation officielle.
Obsolescence de Factures Australie
Date de publication : 29 novembre 2022
L’abandon prochain du paquet ML pré-entraîné Factures Australie a été annoncé. Nous vous recommandons d’utiliser plutôt le paquet ML Factures. Vous trouverez ici plus de détails à ce sujet.
Aperçu public du point de terminaison de la classification ML
Date de publication : 27 juin 2022
Publié dans les points de terminaison
Le point de terminaison de la classification ML est désormais disponible en aperçu public.
Publication de l’OCR UiPath pour le chinois, le japonais et le coréen
Points de terminaison
Date de publication : 20 juin 2022
Publié dans les points de terminaison
Le point de terminaison public de l’OCR UiPath pour le chinois, le japonais et le coréen est désormais disponible pour tous.
Paquets ML Extraction de données
Date de sortie : 6 juin 2022
Date de publication dans AI Center Cloud | Paquets ML d’extraction de données
Une nouvelle méthode OCR, UiPath Chinese, Japanese, Korean OCR, est désormais disponible et peut être appliquée aux projets nouveaux ou déjà créés à partir du service Document Understanding, sur cloud uniquement.
- Publication du point de terminaison public d’OCR UiPath Document
- Amélioration
- Correction d'un bug
- Publication du point de terminaison public d’OCR UiPath Document
- Améliorations
- Publication du point de terminaison public d’OCR UiPath Document
- Améliorations
- Améliorations des points de terminaison publics UiPath Helix Extractor
- Nouveautés
- Améliorations des points de terminaison publics UiPath Helix Extractor
- Nouveautés
- Améliorations des points de terminaison publics UiPath Helix Extractor
- Nouveautés
- Nouveaux types de documents
- Fonctionnalités de reconnaissance de caractères améliorées
- Document de type Reçus Japon disponible via des API et activités
- Suppression des modèles prêts à l’emploi antérieurs à 2023.4
- Suppression des modèles prêts à l’emploi antérieurs à 2023.4
- Publication du point de terminaison public d’OCR UiPath Document
- Améliorations
- Version des points de terminaison publics UiPath Helix Extractor
- Nouveau type de document
- Points de terminaison publics pour Invoices China et Invoices Japan basés sur UiPath Helix Extractor
- Améliorations de Factures Japon (Invoices Japan)
- Version des points de terminaison publics de Factures Japon (Invoices Japan)
- Améliorations
- Nouvelle version des points de terminaison publics Factures Japon (Invoices Japan)
- Améliorations
- UiPath Extended Languages OCR en disponibilité générale
- Nouveaux points de terminaison publics basés sur UiPath® Helix Extractor
- Performances améliorées et nouveaux points de terminaison de modèle inscrits sur UiPath Helix Extractor
- Point de terminaison du modèle redirigé vers l’ancienne génération
- Modèle d’aperçu supprimé
- Obsolescence de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison publics pour Invoices et Receipts basés sur UiPath® Helix Extractor
- Points de terminaison publics basés sur Helix Extractor
- Outil de reconnaissance optique de caractères UiPath Extended Languages OCR en aperçu public
- Entraînement de Frozen Backbone
- Obsolescence de Factures Australie
- Aperçu public du point de terminaison de la classification ML
- Publication de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison
- Paquets ML Extraction de données