- Document Understanding for Automation Cloud and Test Cloud
- Document Understanding for Automation Cloud and Test Cloud Public Sector
- Document Understanding for Automation Cloud and Test Cloud Dedicated
- ML packages and public endpoints
- Pacotes de ML gerais e atualizações de pontos de extremidade públicos
- Pacotes de ML e histórico de versões de pontos de extremidade públicos

Notas de versão do Document Understanding
Pacotes de ML gerais e atualizações de pontos de extremidade públicos
Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
Data de lançamento: 20 de janeiro de 2026
Melhorias
- Tratamento aprimorado de nomes de empresas exibidos como logotipos ou texto estilizado durante o OCR no Document Understanding.
- Tratamento de OCR aprimorado para números de identificação arábicos contendo algarismos arábicos. Essa atualização melhora o reconhecimento de dígitos em formatos de ID arábicos compatíveis, ajudando a reduzir os casos em que os caracteres estavam ausentes ou reconhecidos incorretamente durante a extração.
Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
Data de lançamento: 4 de dezembro de 2025
Melhorias
Adicionado suporte para diacríticos em havaiano para melhorar a Precisão do reconhecimento em documentos que contêm Text em idioma havaiano.
UiPath Helix Extractor public endpoints improvements
Data de lançamento: 7 de novembro de 2025
Novidades
- Public endpoints for extraction models in the United States, with the exception of Financial Statements, are now based on the Helix Extractor.
- Public endpoints for the United States now include Receipts2, Invoices2, Receipts Japan, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Helix Extractor public endpoints improvements
Novidades
- Public endpoints for extraction models in Japan, with the exception of Financial Statements, are now based on the Helix Extractor.
- Public endpoints for Japan now include Receipts2, Invoices2, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Helix Extractor public endpoints improvements
Data de lançamento: 14 de agosto de 2025
Novidades
We are excited to announce the release of improved accuracy for public endpoints based on the UiPath Helix Extractor in Europe region.
With this release, the following models are now based on the UiPath Helix Extractor in Europe region as well:
- 9465
- Faturas da China
- Faturas em hebraico
- Faturas do Japão
- Recibos Japão
With this addition, all models are now based on the UiPath Helix Extractor in Europe region, except for Financial Statements.
Novos tipos de documentos
Esta versão traz os seguintes novos tipos de documentos:
- Invoices2: this document type is trained to extract key data points from a wide variety of invoice types, including standard invoices, credit notes, Indian invoices, and shipping invoices. The enhanced schema consists of 55 regular fields, two structured tables—one for line items (13 columns) and one for bank payment details (9 columns)—and a currency classifier.
- Receipts2: this document type is trained to extract key data points from a wide range of receipt types, including but not limited to parking receipts, train tickets, hotel bills, airport purchases, meals, pharmacy receipts, electronic receipts, and more. The enhanced schema consists of 60 regular fields and a structured table of items with 6 columns.
- US Mortgage Closing Disclosures: this document type is trained to extract key data points from standard US closing disclosure forms. The schema includes 20 regular fields capturing borrower details, property information, loan terms, transaction summaries, and cash to close figures.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Recursos de reconhecimento de caracteres aprimorados
Notas de versão: 23 de junho de 2025
Essa atualização traz um conjunto de melhorias para nosso mecanismo de Reconhecimento Ótico de Caracteres (OCR), com o objetivo de aumentar a precisão e a confiabilidade em uma gama mais ampla de estilos de entrada:
- Melhor detecção de escrita manual.
- Distinção mais clara entre "O" e "0" em fontes monoespaço.
- Reconhecimento aprimorado do texto impresso de matriz de pontos.
Essas melhorias aumentam a confiabilidade em vários tipos de documentos.
Tipo de documento Recibos do Japão disponível por meio de APIs e atividades
Notas de versão: 19 de maio de 2025
You can now use the Receipts Japan document type through APIs and IntelligentOCR and Document Understanding activities as well. This is available for all tenants based in the Japan region.
Remoção de modelos prontos para uso mais antigos que 2023.4
Data de lançamento: 11 de abril de 2025
Remoção de modelos prontos para uso mais antigos que 2023.4
À medida que lançamos novas alternativas e soluções aprimoradas, removemos o suporte a modelos prontos para uso, incluindo UiPath Document Understanding OCR e OCR_CPU, pacotes de ML de extração de dados e DocumentClassifier.
A tabela a seguir descreve o plano de remoção.
| Recurso ou funcionalidade | Remoção anunciada em | Removido em | Observações |
|---|---|---|---|
| Pacotes de ML prontos para uso mais antigos que 2023.4. | Abril de 2025 | Abril de 2025 | Recomendamos usar a versão mais recente dos pacotes de ML prontos para uso. |
For more information on deprecations, check the Deprecation timeline in the Overview guide.
Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
Data de lançamento: 19 de março de 2025
Melhorias
- Caixas de seleção gerais, escrita à mão e a detecção de texto impresso é aprimorada.
- A precisão do reconhecimento de escrita manual é aprimorada.
- A detecção de carimbos é aprimorada para carimbos japoneses.
- O tamanho das caixas de limite e a precisão de posicionamento são aprimorados.
UiPath Helix Extractor public endpoints release
Data de lançamento: 28 de novembro de 2024
Tipo do novo documento
Esta versão introduz um novo tipo de documento, Recibos Japão. Esse novo ponto de extremidade público pode extrair detalhes importantes de uma variedade de tipos de documentos, como recibos de caixa registradora regulares, restaurantes, hotéis, trem, estacionamento e outros tipos de recibos escritos em japonês.
Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
We are excited to announce the release of improved endpoints for Invoices China and Invoices Japan. This new generation of endpoints, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
Melhorias nas faturas do Japão
We have made significant improvements to the Invoices Japan public endpoint, adding new fields, such as:
- Campos regulares:
- Valor líquido reduzido
- Imposto reduzido
- Valor líquido não reduzido
- Imposto não reduzido
- Montante do imposto retido na fonte
- Depósito
- Campos de coluna:
- Taxa de imposto do item
- Imposto de registro de item
- Taxa do item
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Lançamento dos pontos de extremidade públicos de Faturas no Japão
Data de lançamento: 29 de outubro de 2024
Lançado em pontos de extremidade para Faturas do Japão
Melhorias
Fizemos melhorias significativas em nosso processo de digitalização de documentos. Agora, ao usar o UiPath Extended Languages OCR ou o OCR em chinês, coreano e japonês, a saída será caixas de palavras regulares em vez de caracteres individuais.
Lançamento de novos pontos de extremidade públicos para faturas no Japão.
Data de lançamento: 15 de outubro de 2024
Lançado em pontos de extremidade para Faturas do Japão
Melhorias
- A precisão do pacote de ML de Faturas do Japão foi melhorada.
- Melhoramos o espaçamento e a análise de palavras quando os caracteres chinês, japonês ou coreano são misturados com caracteres latinos, pontuação e números em documentos.
- Corrigimos um problema que estava fazendo com que os pipelines de treinamento do AI Center relatassem pontuações altas de forma incorreta para tipos de campo
ID NumberePhone Number.Isso garante que as pontuações relatadas correspondam às pontuações reais.
UiPath Extended Languages OCR em disponibilidade geral
Data de lançamento: 3 de outubro de 2024
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in general availability. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.
The UiPath Extended Languages OCR is currently only available as a public endpoint.
New public endpoints based on UiPath® Helix Extractor
Data de lançamento: 17 de setembro de 2024
Improved performance and new model endpoints enrolled on UiPath Helix Extractor
This release brings enhanced accuracy and performance for models based on the UiPath Helix Extractor, the new UiPath LLM. Furthermore, the following models are now based on the UiPath Helix Extractor as well:
- 709
- 941x
- 1040x
- 3949
- 3949a
Ponto de extremidade do modelo redirecionado para a geração antiga
Due to performance issues, the Financial Statement model endpoint is redirected to the old generation.
Modelo de pré-visualização removido
The 990 (Preview) model is removed from both public endpoints and Data Extraction ML packages.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Descontinuação de OCR da UiPath para chinês, japonês e coreano
Data de lançamento: 8 de julho de 2024
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead.
Check the Deprecation timeline page for more information about upcoming deprecations and removals.
Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor
Data de lançamento: 12 de junho de 2024
We are excited to announce the release of improved endpoints for Invoices and Receipts. This new generation, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:
- 709
- 941x
- 1040x
- 3949a
- 9465
- Faturas da China
- Faturas em hebraico
- Faturas do Japão
Verifique as notas de versão para anúncios futuros.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
Public endpoints based on Helix Extractor
Data de lançamento: 29 de maio de 2024
We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on the UiPath Helix Extractor, the new UiPath® LLM, brings enhanced accuracy and performance.
We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:
- 709
- 941x
- 1040x
- 3949a
- 9465
- Faturas
- Faturas da China
- Faturas em hebraico
- Faturas do Japão
- Recebimentos
Verifique as notas de versão para anúncios futuros.
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
UiPath Extended Languages OCR em visualização pública
Data de lançamento: 28 de março de 2024
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in Public Preview. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.
The UiPath Extended Languages OCR is currently only available as a public endpoint.
Treinamento do Backbone congelado
Data de lançamento: 27 de abril de 2023
The ML packages versions v23.4 and higher, now have the option to train using Frozen Backbone. This new approach trains faster and gives better results for small or low diversity training sets below 400 pages. You can override this behavior by using the new Training Pipeline environment variables documented in the official documentation.
Descontinuação de faturas da Austrália
Data de lançamento: 29 de novembro de 2022
An upcoming deprecation is announced for the Invoices Australia pre-trained ML package. We recommend using instead the Invoices ML package instead. Here you can find more details about it.
Visualização pública do ponto de extremidade de classificação de ML
Data de lançamento: 27 de junho de 2022
Lançado nos Endpoints
The ML Classification endpoint is now available in public preview.
Versão de OCR da UiPath em chinês, japonês e coreano
Pontos de Extremidade
Data de lançamento: 20 de junho de 2022
Lançado nos Endpoints
The UiPath Chinese, Japanese, Korean OCR public endpoint has become generally available.
Pacotes de ML de extração de dados
Data de lançamento: 6 de junho de 2022
Lançado no AI Center Cloud, para pacotes de ML de extração de dados
A new OCR method, UiPath Chinese, Japanese, Korean OCR, is now available and can be applied to new or already created projects from Document Understanding, cloud only.
- Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
- Melhorias
- Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
- Melhorias
- UiPath Helix Extractor public endpoints improvements
- Novidades
- UiPath Helix Extractor public endpoints improvements
- Novidades
- UiPath Helix Extractor public endpoints improvements
- Novidades
- Novos tipos de documentos
- Recursos de reconhecimento de caracteres aprimorados
- Tipo de documento Recibos do Japão disponível por meio de APIs e atividades
- Remoção de modelos prontos para uso mais antigos que 2023.4
- Remoção de modelos prontos para uso mais antigos que 2023.4
- Lançamento do ponto de extremidade público de OCR de Documentos da UiPath
- Melhorias
- UiPath Helix Extractor public endpoints release
- Tipo do novo documento
- Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
- Melhorias nas faturas do Japão
- Lançamento dos pontos de extremidade públicos de Faturas no Japão
- Melhorias
- Lançamento de novos pontos de extremidade públicos para faturas no Japão.
- Melhorias
- UiPath Extended Languages OCR em disponibilidade geral
- New public endpoints based on UiPath® Helix Extractor
- Improved performance and new model endpoints enrolled on UiPath Helix Extractor
- Ponto de extremidade do modelo redirecionado para a geração antiga
- Modelo de pré-visualização removido
- Descontinuação de OCR da UiPath para chinês, japonês e coreano
- Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor
- Public endpoints based on Helix Extractor
- UiPath Extended Languages OCR em visualização pública
- Treinamento do Backbone congelado
- Descontinuação de faturas da Austrália
- Visualização pública do ponto de extremidade de classificação de ML
- Versão de OCR da UiPath em chinês, japonês e coreano
- Pontos de Extremidade
- Pacotes de ML de extração de dados