- Notes de publication de Document Understanding
- Notes de version des paquets ML et des points de terminaison publics
- Mises à jour générales des paquets ML et des points de terminaison publics
- Historique des versions des paquets ML et des points de terminaison publics
Notes de publication de Document Understanding
Mises à jour générales des paquets ML et des points de terminaison publics
Date de publication : 28 novembre 2024
Cette version introduit un nouveau type de document, Reçus Japon (Receipts Japan). Ce nouveau point de terminaison public peut extraire des informations clés à partir de divers types de documents tels que les reçus de caisse enregistreuse standard, les notes de restaurant, les factures d'hôtel, les reçus de train, de parking et autres types de reçus écrits en japonais.
Points de terminaison publics pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan) basés sur UiPath DocPath
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan). Cette nouvelle génération de points de terminaison, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.
- Champs réguliers :
- Montant net réduit (Net amount reduced)
- Taxe réduite (Tax reduced)
- Montant net non réduit
- Taxe non réduite (Tax non-reduced)
- Montant de la retenue à la source (Withholding tax amount)
- Dépôt (Deposit)
- Champs de colonnes :
- Taux de taxation de l'élément (Item tax rate)
- Taxe d'enregistrement de l'élément (Item registration tax)
- Coût de l'élément (Item fee)
Date de publication : 29 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez UiPath Extended Languages OCR ou l'OCR chinois, coréen ou japonais, la sortie correspondra à des blocs de mots réguliers au lieu de caractères individuels.
Date de publication : 15 octobre 2024
Publié dans les points de terminaison pour Factures Japon (Invoices Japan)
- La précision du paquet ML Factures Japon (Invoices Japan) a été améliorée.
- Nous avons amélioré l'espacement et l'analyse des mots lorsque des caractères chinois, japonais ou coréen sont mélangés avec des caractères latins, de la ponctuation et des nombres dans les documents.
- Nous avons corrigé un problème qui faisait que les pipelines d'entraînement AI Center signalaient des scores élevés inexacts pour les types de champ
ID Number
etPhone Number
. Cela garantit que les scores rapportés correspondent aux scores réels.
Date de publication : 3 octobre 2024
Nous avons le plaisir d'annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en disponibilité générale. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l'Inde, ainsi que dans des langues utilisant l'alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Date de publication : 17 septembre 2024
Amélioration des performances et nouveaux points de terminaison du modèle inscrits sur UiPath DocPath
Cette version améliore la précision et les performances des modèles basés sur UiPath DocPath, le nouveau LLM UiPath. De plus, les modèles suivants sont désormais également basés sur UiPath DocPath :
- 709
- 941x
- 1040x
- 3 949
- 3949a
En raison de problèmes de performances, le point de terminaison du modèle État financier (Financial Statement) est redirigé vers l’ancienne génération.
Date de publication : 8 juillet 2024
L’OCR UiPath pour le chinois, le japonais et le coréen sera obsolète à partir de janvier 2025. Nous recommandons d’utiliser plutôt UiPath Extended Languages OCR.
Consultez la page Calendrier d’obsolescence pour plus d’informations sur les obsolescences et les suppressions à venir.
Date de publication : 12 juin 2024
Nous avons le plaisir de vous annoncer la publication de points de terminaison améliorés pour les factures et les reçus. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath, offre davantage de précision ainsi que des performances améliorées.
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures Chine
- Factures hébreu
- Factures, Japon
Consultez les notes de publication pour les futures annonces.
Date de publication : 29 mai 2024
Nous sommes ravis d'annoncer le lancement de points de terminaison améliorés pour nos paquets ML pré-entraînés prêts à l'emploi. Cette nouvelle génération, basée sur UiPath DocPath, le nouveau LLM UiPath®, offre davantage de précision ainsi que des performances améliorées.
- 709
- 941x
- 1040x
- 3949a
- 9465
- Factures
- Factures Chine
- Factures hébreu
- Factures, Japon
- Reçus
Consultez les notes de publication pour les futures annonces.
Date de publication : 28 mars 2024
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais en Aperçu public. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.
L’outil de reconnaissance optique de caractères UiPath Extended Languages OCR est pour le moment uniquement disponible en tant que point de terminaison public.
Date de publication : 27 avril 2023
Les paquets ML versions v23.4 et supérieures ont maintenant la possibilité de s’entraîner à l’aide de Frozen Backbone. Cette nouvelle approche s’entraîne plus rapidement et donne de meilleurs résultats pour les ensembles d’entraînement de petite taille ou à faible diversité inférieurs à 400 pages. Vous pouvez remplacer ce comportement en utilisant les nouvelles variables d’environnement du pipeline d’entraînement documentées dans la documentation officielle.
Date de publication : 29 novembre 2022
L’abandon prochain du paquet ML pré-entraîné Factures Australie a été annoncé. Nous vous recommandons d’utiliser plutôt le paquet ML Factures. Vous trouverez ici plus de détails à ce sujet.
Date de publication : 27 juin 2022
Publié dans les points de terminaison
Le point de terminaison de la classification ML est désormais disponible en aperçu public.
Date de publication : 20 juin 2022
Publié dans les points de terminaison
Le point de terminaison public de l’OCR UiPath pour le chinois, le japonais et le coréen est désormais disponible pour tous.
Date de sortie : 6 juin 2022
Date de publication dans AI Center Cloud | Paquets ML d’extraction de données
Une nouvelle méthode OCR, UiPath Chinese, Japanese, Korean OCR, est désormais disponible et peut être appliquée aux projets nouveaux ou déjà créés à partir du service Document Understanding, sur cloud uniquement.
- Version des points de terminaison publics UiPath DocPath
- Nouveau type de document
- Points de terminaison publics pour Factures Chine (Invoices China) et Factures Japon (Invoices Japan) basés sur UiPath DocPath
- Améliorations de Factures Japon (Invoices Japan)
- Version des points de terminaison publics de Factures Japon (Invoices Japan)
- Améliorations
- Nouvelle version des points de terminaison publics Factures Japon (Invoices Japan)
- Améliorations
- UiPath Extended Languages OCR en disponibilité générale
- Nouveaux points de terminaison publics basés sur UiPath® DocPath
- Amélioration des performances et nouveaux points de terminaison du modèle inscrits sur UiPath DocPath
- Point de terminaison du modèle redirigé vers l’ancienne génération
- Modèle d’aperçu supprimé
- Obsolescence de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison publics pour les factures et les reçus basés sur UiPath® DocPath
- Points de terminaison publics basés sur DocPath
- Outil de reconnaissance optique de caractères UiPath Extended Languages OCR en aperçu public
- Entraînement de Frozen Backbone
- Obsolescence de Factures Australie
- Aperçu public du point de terminaison de la classification ML
- Publication de l’OCR UiPath pour le chinois, le japonais et le coréen
- Points de terminaison
- Paquets ML Extraction de données