UiPath Documentation
document-understanding
latest
false
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Notas de versão do Document Understanding

Última atualização 23 de abr de 2026

Pacotes de ML e histórico de versões de pontos de extremidade públicos

v25.2.2

UiPath Document Understanding OCR

Data de lançamento: 6 de agosto de 2025

Released in UiPath Document Understanding OCR and endpoints | v25.2.2

Correções de bugs

Corrigimos um problema em que o modelo detectava incorretamente várias caixas de texto em imagens com fundos ruidosos.

Melhorias

Melhoramos a detecção de escrita à mão em certos formulários para campos relacionados a datas que incluem dias, meses e anos. O modelo anterior às vezes agrupava esses campos em uma única palavra, diminuindo o desempenho da detecção.

v25.2.0

UiPath Document Understanding OCR

Data de lançamento: 11 de fevereiro de 2025

Released in UiPath Document Understanding OCR and endpoints | v25.2.0

Errata

Adicionado 20 de fevereiro de 2025

Observação:

New functionalities that were previously announced, such as new support for circled, underlined, and crossed-out boxes, are not available yet.

Melhorias

Com esta nova versão, você pode esperar uma melhoria no desempenho do reconhecimento de manuscrito em seus documentos.

A funcionalidade de detecção de caixas de seleção também foi aprimorada.

A latência é reduzida para conjuntos de dados de todos os tamanhos.

v24.11.3

UiPath Document Understanding OCR

Data de lançamento: 27 de novembro de 2024

Released in UiPath Document Understanding OCR and endpoints | v24.11.3

Melhorias

Nesta versão, aprimoramos a precisão e o desempenho para vários tipos de texto. Isso inclui texto impresso em imagens muito grandes ou de baixa resolução, bem como texto manuscrito.

O reconhecimento de caixas de seleção, especialmente aquelas representadas por quadrados ou retângulos totalmente pretos, é significativamente aprimorado. Além disso, também ajustamos a detecção de assinaturas.

v24.10.3

Extração de Dados

Data de lançamento: 27 de maio de 2025

Released in Data Extraction ML packages | v24.10.3

Observação:

Erratum - added 24 June 2025: The improvements and fixes included in the v24.10.3 release have been reverted due to unforeseen issues. For the latest information and updates, follow our release notes.

Melhorias
  • Melhoramos a análise de números para lidar melhor com números onde os espaços são usados como elementos decorativos ou como separadores decimais.
  • Aprimoramos a análise de datas para adicionar suporte para datas de idioma malaio.
Correções de bugs
  • Corrigimos problemas que causavam uma ordenação incorreta das palavras em valores extraídos em campos regulares.
  • Corrigimos um problema em que o texto em japonês não era extraído de documentos na orientação paisagem.

v24.9.1

UiPath Document Understanding OCR

Data de lançamento: 3 de outubro de 2024

Released in UiPath Document Understanding OCR and endpoints | v24.9.1

Melhorias

Essa versão traz precisão e melhorias de desempenho para reconhecimento de caligrafia.

v24.7

UiPath Document OCR

Data de lançamento: 23 de julho de 2024

Released in UiPath Document Understanding OCR and endpoints (including UiPath Document Understanding OCR_CPU) | v24.7

Melhorias
  • The accuracy for the Azerbaijani language is improved by adding recognition for the əƏ characters.
  • O reconhecimento e a detecção para o Magnetic Ink Character Recognition (MIRC) foram melhorados, trazendo precisão aprimorada, especialmente para verificações.
  • Anteriormente, os números não eram reconhecidos em algumas instâncias quando um espaço era usado como separador. Isso agora foi aprimorado, e os números agora são reconhecidos quando o espaço é usado como separador.
Correções de bugs

A pontuação de confiança para o UiPath Document Understanding OCR foi melhorada, especialmente quando usada em imagens de baixa qualidade. Em fluxos de trabalho onde a pontuação de confiança é usada para decidir se os documentos precisam de validação humana no Action Center, essa melhoria pode resultar em um número maior de documentos em validação.

v24.4.4

Extração de Dados

Data de lançamento: 3 de outubro de 2024

Released in Data Extraction ML packages | v24.4.4

Correções de bugs
  • Corrigimos um problema que estava fazendo com que os pipelines de treinamento do AI Center relatassem pontuações altas de forma incorreta para tipos de campo ID Number e Phone Number.Isso garante que as pontuações relatadas correspondam às pontuações reais.
  • Corrigimos um problema que estava relacionado à análise de valores em campos em japonês quando o OCR de Idiomas Estendidos estava em uso.

v24.4.3

DocumentUnderstanding e Extração de dados

Data de lançamento: 14 de agosto de 2024

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v24.4.3

Melhorias

Improved field text formatting for Chinese, Japanese, and Korean languages when using the UiPath® Extended Languages OCR in the digitization step.

v24.4.2

InvoicesIndia e pontos de extremidade

Data de lançamento: 23 de julho de 2024

Released in endpoints and InvoicesIndia ML package | v24.4.2

Correções de bugs

Corrigimos um problema relacionado à análise de números em faturas indianas.

v24.4.1

DocumentUnderstanding, FaturasJapão e pontos de extremidade

Data de lançamento: 20 de junho de 2024

Released in endpoints + DocumentUnderstanding + InvoicesJapan ML package | v24.4.1

Correções de bugs

Corrigimos um problema relacionado a datas em campos de coluna especificamente para o idioma japonês.

v24.4.0

DocumentClassifier e Extração de dados

Data de lançamento: 24 de maio de 2024

Lançado em:

  • DocumentUnderstanding + Data Extraction ML packages | v24.4.0
  • DocumentClassifier ML packages | v24.4.0
Novidades

Os seguintes novos pacotes de ML agora estão em visualização pública:

Melhorias

Essa versão também traz melhorias para vários outros pacotes de ML:

  • Accuracy for the Invoices Japan ML package is improved. There are also 11 new fields for the Invoices Japan model. For the complete list of extracted fields, check the Out-of-the-box models details file.
  • The performance for the Payslips model is improved.
  • New IDs are available for the ID Cards ML package:
    • Cartões de identidade Aadhaar
    • Cartões de identidade da Arábia Saudita
    • Cartões PAN
  • New fields are available for the UB04 ML package. For the complete list of extracted fields, check the Out-of-the-box models details file.
  • New fields are available for the Checks ML package. For the complete list of extracted fields, check the Out-of-the-box models details file.

Erratum - added 20 June 2024: Added information regarding a bug fix related to the parsing of Japanese dates.

Erratum - added 28 May 2024: Added more information on several improvements.

v24.3.2

Pontos de extremidade do DocumentUnderstandingOCR

Data de lançamento: 13 de março de 2024

Released in DocumentUnderstandingOCR Endpoints | v24.3.2

Uma nova versão do Document Understanding OCR agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:

  • A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
  • A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.

v24.2.1

Pontos de extremidade do DocumentUnderstandingOCR

Data de lançamento: 9 de fevereiro de 2024

Released in DocumentUnderstandingOCR Endpoints | v24.2.1

Estamos empolgados por anunciar que a compatibilidade com árabe (ARA) para o UiPath Document Understanding OCR agora está em visualização pública.

v24.2.0

Extração de Dados

Data de lançamento: 1 de abril de 2024

Released in Data Extraction ML Packages | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:

  • 1040 Schedule C
  • 1040 Schedule D
  • 1040 Schedule E
  • UB04

Document Classifier

Data de lançamento: 4 de março de 2024

Released in DocumentClassifier ML Packages | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:

  • 1040 Schedule C
  • 1040 Schedule D
  • 1040 Schedule E
  • UB04

v23.10.5

UiPath Document Understanding OCR

Data de lançamento: 15 de outubro de 2024

Released in UiPath Document Understanding OCR and endpoints | v23.10.5

Melhorias

Essa versão traz precisão e melhorias de desempenho para reconhecimento de caligrafia.

Correções de bugs

Corrigimos um problema no qual as caixas de anotação eram retornadas horizontalmente, mesmo que alguns documentos estivessem ligeiramente inclinados, causando o desalinhamento na anotação.

v23.10.4

Extração de Dados

Data de lançamento: 28 de março de 2024

Lançado em Pacotes de ML de extração de dados | v23.10.4

Uma nova versão para os pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:

  • A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
  • A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.
  • A precisão para conjuntos de dados menores que 400 páginas foi melhorada.

v23.10.3

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 12 de fevereiro de 2024

Released in Endpoints + DocumentUnderstanding + Data Extraction ML Packages | v23.10.3

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados que faz parte do AI Center agora está disponível para uso geral.

Essa nova versão traz uma correção de bug relacionada à extração de valores de texto bidirecionais (da esquerda para a direita e da direita para a esquerda).

Observação:

Currently, our platform does not have localization for right-to-left languages (such as Hebrew or Arabic). As a result, when combined with punctuation marks or special characters, text in those languages which appears in annotation interface (Document Manager) or validation interface (Validation Station in Action Center) is not displayed correctly. However, if the values of the strings are entered into an application which has right-to-left reading mode enabled, the text should be displayed correctly. A typical example is Notepad, where right-to-left reading order is enabled.

v23.10.2

DocumentUnderstanding e Extração de dados

Data de lançamento: 23 de janeiro de 2024

Released in DocumentUnderstanding + Data Extraction ML packages | v23.10.2

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Esta versão traz uma correção de bug que ocasionalmente fazia com que o treinamento falhasse.

v23.10.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 26 de outubro de 2023

Released in Endpoints + DocumentUnderstanding + Data Extraction ML packages | v23.10.0

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Estamos trabalhando constantemente para melhorar sua experiência com o Document Understanding. Para esta versão, nos certificamos de trazer pequenas melhorias de segurança e estabilidade para nosso produto.

UiPath Document Understanding OCR

Data de lançamento: 2 de outubro de 2023

Released in UiPath Document Understanding OCR | v23.10

Temos o prazer de anunciar que hebraico (HEB) agora é suportado pelo UiPath Document Understanding OCR.

v23.7.0

DocumentUnderstanding e Extração de dados

Data de lançamento: 3 de agosto de 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.7.0

  • In documents where a table runs across many pages, a table row (a line item) gets split across 2 pages, in some cases even more. The previous model versions assumed that each page break was also a row-break, and it broke items into multiple pieces. The current model version fixes this issue. To benefit from this feature in a workflow, you need to use the DocumentUnderstanding.ML.Activities package version 1.23.0-preview, and the 23.7.0 model version in that particular workflow.
  • Os modelos agora têm um tempo de previsão por página mais rápido e usam RAM de forma mais eficiente, permitindo o processamento de documentos maiores.

v23.6.0

DocumentUnderstanding e pontos de extremidade

Data de lançamento: 13 de junho de 2023

Released in DocumentUnderstanding + endpoints | v23.6.0

Melhoramos a precisão do pacote de ML do UiPathDocumentOCR.

v23.4.1

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 23 de maio de 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.4.1

Corrigimos um problema que afetava o treinamento do modelo.

v23.4.5

Document Understanding

Data de lançamento: 21 de abril de 2023

Released in DocumentUnderstanding | v23.4.5

Melhoramos o modelo de texto digitado geral e aprimoramos a funcionalidade de reconhecimento de caixa de seleção.

v23.4.2

Document Understanding

Data de lançamento: 24 de março de 2023

Released in DocumentUnderstanding | v23.4.2

O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco. Aqui está a lista completa dos novos idiomas suportados: dinamarquês, sueco, norueguês, finlandês, polonês, húngaro, checo, eslovaco, estoniano, letão, lituano, esloveno, croata, sérvio, turco.

v23.4.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 10 de maio de 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.4.0

O UiPath Document OCR agora está disponível como um pacote pré-treinado pronto para uso e está disponível para GPU e CPU. Isso permite que os clientes que preferem evitar o uso de pontos de extremidade públicos implementem o UiPath Document OCR em seus próprios tenants, em um ambiente isolado.

Uma lista de sete novos pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral. Aqui está a lista dos sete novos modelos:

  • Certificado de Constituição/ Situação Regular
  • Certificado de origem
  • Certificado de produto infantil
  • CMS1500
  • Declaração de Conformidade da UE
  • Envio de Notas Fiscais
  • Contracheques

DocumentClassifier e pontos de extremidade

Data de lançamento: 26 de abril de 2023

Released in Endpoints + DocumentClassifier ML packages | v23.4.0

Adicionamos novos tipos de documentos ao Pacote de ML do DocumentClassifier, fizemos melhorias gerais e corrigimos alguns pequenos bugs.

v23.2.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 23 de fevereiro de 2023

Released in Endpoints + DocumentUnderstanding + Data Extraction ML packages | v23.2.0

O que há de novo e melhorias

Uma nova versão dos pacotes de ML pré-treinados prontos para uso (23.1.0) e seus pontos de extremidade públicos foram lançados, agora usando a arquitetura de ponta baseada em Transformers do LayoutLM, que é mais poderosa e aumenta a precisão em geral, especialmente em campos de coluna (tabelas).

Essa melhoria tornou os pacotes de ML pré-treinados prontos para uso mais potentes, o que significa que você pode experimentar latência mais longa para treinamento e previsões.

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

An upcoming removal is announced for the Manual edits feature used in the model evaluation. More information here.

Problemas conhecidos

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Errata 8 de maio de 2023

Problema conhecido

Um Fatal Python error: Segmentation fault é recebido ao executar um pipeline completo ou de treinamento. Recomendamos usar os pacotes de ML com a v23.4 até que esse bug seja corrigido.

Errata 20 de abril de 2023

A pontuação geral para todos os pipelines agora é precisa. Anteriormente era uma pontuação F1. Os artefatos de avaliação no AI Center ainda contêm precisão e pontuação F1, para comparabilidade reversa.

v23.1.0

DocumentClassifier e pontos de extremidade

Data de lançamento: 11 de janeiro de 2023

Released in Endpoints and DocumentClassifier | v23.1.0

Melhoramos as pontuações da F1 e agora também são exibidas para pipelines de treinamento.

A pasta Artefatos possui uma lista atualizada de artefatos.

O modelo DocumentClassifier agora prevê 25 classes, em vez de 26, devido à remoção da classe Notas de Entrega.

v22.12.2

Pontos de Extremidade

Data de lançamento: 16 de dezembro de 2022

Released in endpoints | v22.12.2

O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco.

v22.11.0

Document Understanding, Extração de dados e pontos de extremidade

Data de lançamento: 13 de dezembro de 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.11.0

Esta versão traz melhorias significativas para os endpoints públicos dos Pacotes de ML pré-treinados prontos para uso, o que significa que agora estamos usando a arquitetura Deep Learning baseada em LayoutLM mais recente.

This improvement provides better accuracy on all document types, especially for the Invoices model, and it also improves the accuracy on column fields and tables.

We added new extracted fields to the Invoices model that now have Shipping Date, Vendor email address, Bank name, Bank account number, IBAN, SWIFT Code, Bank Address, Bank Routing number, and Tax rate. You can check the list of extracted fields by accessing this page and clicking on the link available for each model.

As pontuações do modelo agora também são retornadas pelos pipelines de treinamento, não apenas pelos pipelines completos ou de avaliação.

As pontuações F1 agora estão disponíveis para cada campo de coluna. Anteriormente, as pontuações de F1 ficavam disponíveis apenas para todos os campos de coluna avaliados em conjunto.

v22.10.2

Pontos de Extremidade

Data de lançamento: 3 de fevereiro de 2023

Released in endpoints | v22.10.2

Atualizamos os pontos de extremidade públicos dos pacotes de ML pré-treinados prontos para uso e agora estamos usando a arquitetura de ponta baseada em LayoutLM Transformers.

v22.10.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 7 de outubro de 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.10.0

O que há de novo e melhorias

The following pretrained models are now listed as official, without the -Preview tag: InvoicesAustralia, InvoicesIndia, PurchaseOrders.

The DeliveryNotes model has been renamed as BillsOfLading.

Ten new pretrained models are now available: Acord25, 1040, Checks, Bank Statements, Financial statements, Packing Lists, Acord131, Acord126, Acord140, Vehicle Titles.

Correções de bugs

Várias correções de bugs foram feitas nos pacotes mencionados acima.

UiPath Document OCR

Data de lançamento: 4 de outubro de 2022

Released in UiPathDocumentOCR | v22.10.0 Cloud

Uma nova funcionalidade está disponível para detecção de códigos de barras e códigos QR.

Aprimoramentos de precisão foram feitos em strings longas, como endereços de e-mail e URLs, em fontes de largura fixa e na detecção de manuscritos e assinaturas.

A detecção de rotação de página também foi aprimorada.

v22.6.1-preview

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 10 de outubro de 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.6.1-preview

Essa versão traz várias correções de bugs para os pacotes e pontos de extremidade do DocumentUnderstanding e Extração de Dados.

v22.6.0-preview

DocumentUnderstanding e Extração de dados

Release date: 6 September 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.6.0-preview

There are 18 new Preview ML packages available with a more advanced model architecture for our DU ML Packages in AI Center. You can easily identify them by the Preview attached to the end of the package name, eg.: InvoicesPreview,PurchaseOrderPreview,Acord125Preview, etc.

We've updated the public endpoints list with all the new Preview ML packages and can be consulted Public Endpoints.

Vale a pena mencionar o fato de que esses modelos de visualização não consomem unidades DU/AI de seu direito de licenciamento.

Corrigido um bug no uso de habilidades privadas, agora a habilidade privada pode ser usada apenas com uma chave de API que pertence à mesma organização usando a instância do AI Center.

v22.5.2

DocumentUnderstanding e Extração de dados

Data de lançamento: 22 de julho de 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.5.2

Correções de bugs

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

Problema conhecido

There is a known issue for the Invoices package that ocassionally leads to an error when trying to run an auto-fine-tunning loop in AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 18 de julho de 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.5.1

Correções de bugs
  • Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
  • Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
  • Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
  • Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.5.0

AI Center cloud, Extração de dados

Data de lançamento: 16 de junho de 2022

Released in AI Center Cloud, Data Extraction ML packages | v22.5.0

Melhorias

O desempenho foi aprimorado para todos os pacotes de ML de extração de dados.

v22.4.3

DocumentUnderstanding e Extração de dados

Data de lançamento: 21 de julho de 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.4.3

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

v22.4.2

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 14 de julho de 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.4.2

Correções de bugs
  • Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
  • Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
  • Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
  • Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.4.1

AI Center cloud, Extração de dados

Data de lançamento: 3 de junho de 2022

Release date in AI Center Cloud, Data Extraction ML packages | v22.4.1

Correções de bugs

Corrigido um bug que ocorria ao executar um pipeline de avaliação em um modelo treinado com o especial line_detection mode, fazendo com que as previsões fossem diferentes de quando chamadas a partir da habilidade de ML.

v22.4.0

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 10 de maio de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.4.0

Novidades

Handwriting capabilities are now available for the UiPathDocumentOCR and the UiPathDocumentOCR_CPU packages, by integrating the HandwritingRecognitionOCR. The same capabilities can be found in the UiPath.OCR.LocalServer Studio package.

New architecture on extraction ML packages, with major benefits, especially to models trained using the DocumentUnderstanding ML package.

Utility Bills, W9, and Passports ML Packages are now available as GA. Five new out-of-the-box pre-trained ML packages are now available in -Preview to ease your work.

Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.

Document Search é uma nova funcionalidade disponível no Document Manager, que facilita a rotulagem de documentos com um número elevado de páginas.

Melhorias

Foram feitas melhorias nos pacotes de ML para extração de documentos no AI Center. O documento Excel de Avaliação recebeu novas planilhas, permitindo organizar e interpretar melhor os dados avaliados.

Pacotes de ML na instalação offline do Automation Suite receberam um novo pacote offline.

A precisão e o desempenho foram aprimorados para o UiPathDocumentOCR.

Correções de bugs

Várias correções em campos de data de análise, incluindo datas em campos de coluna, datas em documentos turcos, datas distantes no futuro.

v22.2.3

UiPathDocumentUnderstandingOCR

Data de lançamento: 7 de março de 2022

Released in UiPathDocumentOCR | v22.2.3

Capacidade superior

HandwritingRecognitionOCR integrado ao UiPathDocumentOCR. Em muitos casos, há uma mistura de campos. Ao integrar a capacidade de leitura de manuscrito, podemos aplicar o reconhecimento correto a cada campo: reconhecimento de impressão para texto impresso e reconhecimento de manuscrito para texto manuscrito.

Altough HandwritingRecognitionOCR can detect any handwriting, please know that it is trained and optimized only for English.

v22.1.6

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 14 de março de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.1.6

Correções de bugs

Corrigido um bug que estava causando a falha de um pipeline de treinamento ou de um pipeline completo no AI Center devido a um problema de pacote de ML no pré-processamento de dados para uma linha vazia.

v22.1.4

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 2 de março de 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.1.4

Novidades

The Utility Bills ML package is now generally available.

Melhorias

Melhor desempenho geral e escalabilidade.

Significant improvements on scores when training on the new version of the DocumentUnderstanding ML package as compared to previous versions.

As datas nos campos da coluna agora são analisadas corretamente.

A análise de data agora reconhece os nomes dos meses turcos.

Alterações

Alterado o comportamento para pipelines de treinamento e pipelines completos ao treinar na GPU versus na CPU. Os modelos 21.10.x treinados em CPUs eram menores, então treinavam mais rápido do que as versões anteriores, embora tivessem uma precisão um pouco menor do que antes.

Esse comportamento foi revertido com esta versão, portanto, o modelo que está sendo treinado na GPU e na CPU é exatamente o mesmo, e a velocidade de treinamento foi revertida para o que era antes de 2021.10, o que significa que o treinamento na CPU é novamente 10-20X mais lento do que na GPU.

v21.10.11

Extração de Dados

Data de lançamento: 23 de novembro de 2021

Released in Data Extraction ML packages | v21.10.11

Corrigido um bug que fazia com que os pipelines de treinamento e avaliação falhassem devido à lógica de pós-processamento de data.

v21.10.9

Extração de Dados

Data de lançamento: 24 de novembro de 2021

Released in Data Extraction ML packages | v21.10.9

Corrigido um bug que acarretava em erro de previsão durante a execução.

Extração de dados e pontos de extremidade

Data de lançamento: 22 de outubro de 2021

Released in Data Extraction ML packages and endpoints | v21.10.9

Novidades

The PurchaseOrders ML package is now Generally Available and it is ready to be used in your production scenarios.

InvoicesChina, DeliveryNotes, RemittanceAdvices, W2, and W9 ML packages are now in Public Preview. We recommend you check out these packages and start using them for the type of documents you need to process.

Melhorias

Avaliação em nível de documento implementada. Avaliação em nível de documento implementada. Isso representa o desempenho durante a execução em seu fluxo de trabalho de RPA.

A avaliação também pode ser feita em conjuntos de dados com menos campos do que o pacote de ML que está sendo avaliado. Isso facilita a avaliação de pacotes de ML pré-treinados prontos para uso.

Para avaliar o impacto que o OCR tem na precisão da extração, agora você pode executá-lo novamente ao rodar um pipeline de avaliação. Isso exige que o OCR seja configurado ao criar um pacote de ML e a variável de ambiente eval.redo_ocr precisa ser definida como verdadeira no pipeline de avaliação do AI Center.

O treinamento na CPU agora usa um modelo menor para obter uma aceleração de 5x-7x. No entanto, você deve esperar uma precisão menor em 0-5% na CPU.

Adicionadas colunas de Confiança Mínima e Taxa de Processamento Direto aos arquivos Evaluation.xlsx produzidos pelos Pipelines de Avaliação.

O pacote de ML UtilityBills foi substancialmente melhorado.

Melhoria na análise de endereços para endereços que pulam 1-2 linhas de texto.

Melhoria na extração de valores negativos, valores muito grandes (11 dígitos ou mais) ou datas distantes no futuro.

Adicionado suporte para caixas rotacionadas em recibos.

Aprimoramento de espaços concatenados.

Correções de bugs
  • Corrigido um bug que não estava retornando caracteres especiais em campos do tipo String.
  • Corrigido um bug para o Pacote de ML Passports, no qual a data escrita como um número ordinal (1º, 2º, 3º, 4º, etc.) não era analisada corretamente.
Problemas conhecidos

Retreinamento dos Pacotes de ML InvoicesJapan e InvoicesChina usando dados do Validation Station não é atualmente suportado. Como solução alternativa, use o Google Cloud OCR Vision.

Próximas descontinuações

Todos os endpoints públicos, exceto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier serão descontinuados para regiões fora da Europa Ocidental a partir de 1º de dezembro de 2021.

v21.10.5

Pontos de extremidade do UiPathDocumentOCR

Data de lançamento: 13 de dezembro de 2021

Released in UiPathDocumentOCR endpoints | v21.10.5

Melhorias

O UiPathDocumentOCR agora também está disponível na região de Cingapura.

v21.10.1

Extração de dados e pontos de extremidade para UiPathDocumentOCR

Data de lançamento: 24 de setembro de 2021

Released in Data Extraction and endpoints for UiPathDocumentOCR | v21.10.1

Melhorias

Adicionado suporte para texto rotacionado, mesmo que a rotação seja em ângulos diferentes para cada palavra.

Added support for vertical text. This improvement is available at the moment only for UiPath.IntelligentOCR.Activities, including Validation Station.Data Manager and Machine Learning Extractor do not support vertical text yet.

Melhoria da precisão em imagens ou fotos com ruído: por exemplo, recibos, carteiras de identidade ou passaportes.

v21.10

Pontos de extremidade do FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier

Data de lançamento: 13 de dezembro de 2021

Released FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier in Endpoints | v21.10

Melhorias

Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier agora também estão disponíveis na região de Cingapura.

v21.7

Extração de dados e pontos de extremidade para Reconhecimento de manuscrito

Data de lançamento: 11 de agosto de 2021

Released in Data Extraction and endpoints for Handwriting Recognition | v21.7

Melhorias

Capacidade de lidar com vários fragmentos em uma única solicitação (call) para o modelo.

Retreinamento de modelo e algumas outras alterações para melhor precisão do modelo.

Correções de bugs

Corrigido um bug que fazia o pod reiniciar quando não havia mais memória.

v21.6.3

UiPathDocumentOCR em pontos de extremidade

Data de lançamento: 9 de junho de 2021

Released in endpoints for UiPathDocumentOCR | v21.6.3

Melhorias

Detecção de dígito único aprimorada.

Precisão aprimorada em caracteres 1, I e l.

Detecção aprimorada de texto com pouco espaçamento.

v21.5.5

Extração de dados e pontos de extremidade

Data de lançamento: 18 de junho de 2021

Released in endpoints and Data Extraction ML packages | v21.5.5

Corrigido um bug que causava diferenças de previsão entre o Data Manager e a atividade Digitize Document.

v21.5.3

Extração de dados e pontos de extremidade

Data de lançamento: 8 de junho de 2021

Released in endpoints and Data Extraction ML packages | v21.5.3

Novidades

Para imagens de difícil leitura, como no caso de Documentos de identidade e Passaportes, dois novos pacotes pré-treinados e prontos para uso, respectivamente, foram lançados.

Melhorias

Campos de classificação retreináveis incorporados em nossos pacotes prontos para uso pré-treinados.

v21.4.7

Extração de dados e pontos de extremidade

Data de lançamento: 20 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.7

Análise de data aprimorada para pacotes de ML de extração de dados.

v21.4.5

Extração de dados e pontos de extremidade

Data de lançamento: 15 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.5

Novidades

Implantação de todos os endpoints públicos na região dos Estados Unidos.

Endpoints públicos implantados para Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier nas regiões do Canadá e Japão.

v21.4

Extração de dados e pontos de extremidade para HandwritingRecognition e DocumentClassifier

Data de lançamento: 9 de março de 2021

Released in Data Extraction ML packages & endpoints for HandwritingRecognition, DocumentClassifier, + Standalone Docker for UiPathDocumentOCR | v21.4

Novidades

HandwritingRecognition with improved recognition using spelling corrections and ability to read machine-printed text reaches general availability.

DocumentClassifier reaches general availability as well.

Melhorias no UiPathDocumentOCR para:

  • Botões de opção/detecção de caixa de seleção
  • Precisão em formulários de bolhas
  • Precisão geral

v21.1.8

Extração de dados e pontos de extremidade

Data de lançamento: 17 de fevereiro de 2021

Released in endpoints and Data Extraction ML packages | v21.1.8

Melhorias

Precisão melhorada.

InvoicesIndia e InvoicesAustralia já estão disponíveis para o público geral.

Endpoints públicos implantados na região da Austrália.

O argumento de edição não é mais necessário em URLs de endpoint. Por exemplo, https://du.uipath.com/ie/invoices funcionará tanto para tráfego enterprise quanto para community.

v20.11.3

Extração de Dados

Data de lançamento: 18 de dezembro de 2020

Released in Data Extraction ML packages | v20.11.3

Melhorias

Melhorias no treinamento da CPU para ser mais rápido e exigir menos memória.

Melhorias na análise de data para documentos não norte-americanos.

Reconhecimento de caixa de seleção para UiPathDocumentOCR, incluindo caixas de seleção impressas ou manuscritas.

v20.10.4

Extração de dados e pontos de extremidade

Data de lançamento: 10 de novembro de 2020

Released in endpoints and Data Extraction ML packages | v20.10.4

Novos recursos e melhorias

Um novo modelo para Faturas Japonesas.

Os pipelines de avaliação agora retornam métricas para campos de classificação também.

Suporte para Microsoft Read OCR versão 3.

Melhorias na formatação/análise de data para detectar formatos de dia/mês/ano versus formatos de mês/dia/ano.

Melhorias nas detecções de ponto decimal e separadores de milhares para análise correta de números.

O treinamento na CPU é compatível com todas as versões do AI Fabric.

Análise melhorada para os campos com tipo de conteúdo id-no.

Suporte apenas para campos de Classificação de treinamento (sem campos Regular ou Coluna).

O número máximo de campos permitidos aumentou de 32 para 40.

Relatório de níveis de confiança para campos de Coluna.

Problemas conhecidos

When creating a UiPath.DocumentUnderstanding.ML.Activities package in AI Center, the package name should not be any python reserved keyword, such as class , break, from, finally, global, None, etc. Note that this list is not exhaustive since the package name is used for class <pkg-name> and import <pkg-name>.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades