document-understanding
latest
false
  • Notes de publication de Document Understanding
  • Notes de version des paquets ML et des points de terminaison publics
    • Mises à jour générales des paquets ML et des points de terminaison publics
    • Historique des versions des paquets ML et des points de terminaison publics
UiPath logo, featuring letters U and I in white

Notes de publication de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 12 déc. 2024

Mises à jour générales des paquets ML et des points de terminaison publics

Version des points de terminaison publics UiPath DocPath

Date de publication : 28 novembre 2024

Nouveau type de document

Cette version introduit un nouveau type de document, Reçus Japon (Receipts Japan). Ce nouveau point de terminaison public peut extraire des informations clés à partir de divers types de documents tels que les reçus de caisse enregistreuse standard, les notes de restaurant, les factures d'hôtel, les reçus de train, de parking et autres types de reçus écrits en japonais.

Points de terminaison publics pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan) basés sur UiPath DocPath

Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan). Cette nouvelle génération de points de terminaison, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.

Améliorations de Factures Japon (Invoices Japan)

Nous avons apporté des améliorations considérables au point de terminaison public Factures Japon (Invoices Japan) en ajoutant de nouveaux champs, tels que :
  • Champs réguliers :
    • Montant net réduit (Net amount reduced)
    • Taxe réduite (Tax reduced)
    • Montant net non réduit
    • Taxe non réduite (Tax non-reduced)
    • Montant de la retenue à la source (Withholding tax amount)
    • Dépôt (Deposit)
  • Champs de colonnes :
    • Taux de taxation de l'élément (Item tax rate)
    • Taxe d'enregistrement de l'élément (Item registration tax)
    • Coût de l'élément (Item fee)

Version des points de terminaison publics de Factures Japon (Invoices Japan)

Date de publication : 29 octobre 2024

Publié dans les points de terminaison pour Factures Japon (Invoices Japan)

Améliorations

Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez UiPath Extended Languages OCR ou l'OCR chinois, coréen ou japonais, la sortie correspondra à des blocs de mots réguliers au lieu de caractères individuels.

Nouvelle version des points de terminaison publics Factures Japon (Invoices Japan)

Date de publication : 15 octobre 2024

Publié dans les points de terminaison pour Factures Japon (Invoices Japan)

Améliorations

  • La précision du paquet ML Factures Japon (Invoices Japan) a été améliorée.
  • Nous avons amélioré l'espacement et l'analyse des mots lorsque des caractères chinois, japonais ou coréen sont mélangés avec des caractères latins, de la ponctuation et des nombres dans les documents.
  • Nous avons corrigé un problème qui faisait que les pipelines d'entraînement AI Center signalaient des scores élevés inexacts pour les types de champ ID Number et Phone Number. Cela garantit que les scores rapportés correspondent aux scores réels.

UiPath Extended Languages OCR en disponibilité générale

Date de publication : 3 octobre 2024

Nous avons le plaisir d'annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en disponibilité générale. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l'Inde, ainsi que dans des langues utilisant l'alphabet cyrillique et le grec.

L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.

Nouveaux points de terminaison publics basés sur UiPath® DocPath

Date de publication : 17 septembre 2024

Amélioration des performances et nouveaux points de terminaison du modèle inscrits sur UiPath DocPath

Cette version améliore la précision et les performances des modèles basés sur UiPath DocPath, le nouveau LLM UiPath. De plus, les modèles suivants sont désormais également basés sur UiPath DocPath :

  • 709
  • 941x
  • 1040x
  • 3 949
  • 3949a

Point de terminaison du modèle redirigé vers l’ancienne génération

En raison de problèmes de performances, le point de terminaison du modèle État financier (Financial Statement) est redirigé vers l’ancienne génération.

Modèle d’aperçu supprimé

Le modèle 990 (Aperçu) (990 (Preview)) est supprimé des points de terminaison publics et des paquets ML d’extraction de données.

Obsolescence de l’OCR UiPath pour le chinois, le japonais et le coréen

Date de publication : 8 juillet 2024

L’OCR UiPath pour le chinois, le japonais et le coréen sera obsolète à partir de janvier 2025. Nous recommandons d’utiliser plutôt UiPath Extended Languages OCR.

Consultez la page Calendrier d’obsolescence pour plus d’informations sur les obsolescences et les suppressions à venir.

Points de terminaison publics pour les factures et les reçus basés sur UiPath® DocPath

Date de publication : 12 juin 2024

Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour les factures et les reçus. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.

Nous remplaçons progressivement nos modèles par une nouvelle génération de modèles. Pour l’instant, tous les points de terminaison publics sont basés sur DocPath, à l’exception des points de terminaison suivants :
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • Factures Chine
  • Factures hébreu
  • Factures, Japon

Consultez les notes de publication pour les futures annonces.

Points de terminaison publics basés sur DocPath

Date de publication : 29 mai 2024

Nous sommes ravis d'annoncer le lancement de points de terminaison améliorés pour nos paquets ML pré-entraînés prêts à l'emploi. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath®, offre davantage de précision ainsi que des performances améliorées.

Nous remplaçons progressivement nos modèles par une nouvelle génération de modèles. Pour l’instant, tous les points de terminaison publics sont basés sur DocPath, à l’exception des points de terminaison suivants :
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • Factures
  • Factures Chine
  • Factures hébreu
  • Factures, Japon
  • Reçus

Consultez les notes de publication pour les futures annonces.

Outil de reconnaissance optique de caractères UiPath Extended Languages OCR en aperçu public

Date de publication : 28 mars 2024

Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en Aperçu public. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.

L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.

Entraînement de Frozen Backbone

Date de publication : 27 avril 2023

Les paquets ML versions v23.4 et supérieures ont maintenant la possibilité de s’entraîner à l’aide de Frozen Backbone. Cette nouvelle approche s’entraîne plus rapidement et donne de meilleurs résultats pour les ensembles d’entraînement de petite taille ou à faible diversité inférieurs à 400 pages. Vous pouvez remplacer ce comportement en utilisant les nouvelles variables d’environnement du pipeline d’entraînement documentées dans la documentation officielle.

Obsolescence de Factures Australie

Date de publication : 29 novembre 2022

L’abandon prochain du paquet ML pré-entraîné Factures Australie a été annoncé. Nous vous recommandons d’utiliser plutôt le paquet ML Factures. Vous trouverez ici plus de détails à ce sujet.

Aperçu public du point de terminaison de la classification ML

Date de publication : 27 juin 2022

Publié dans les points de terminaison

Le point de terminaison de la classification ML est désormais disponible en aperçu public.

Publication de l’OCR UiPath pour le chinois, le japonais et le coréen

Points de terminaison

Date de publication : 20 juin 2022

Publié dans les points de terminaison

Le point de terminaison public de l’OCR UiPath pour le chinois, le japonais et le coréen est désormais disponible pour tous.

Paquets ML Extraction de données

Date de sortie : 6 juin 2022

Date de publication dans AI Center Cloud | Paquets ML d’extraction de données

Une nouvelle méthode OCR, UiPath Chinese, Japanese, Korean OCR, est désormais disponible et peut être appliquée aux projets nouveaux ou déjà créés à partir du service Document Understanding, sur cloud uniquement.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.