Document Understanding
Mais recente
falso
  • Notas de versão do Document Understanding
  • Notas de lançamento de pacotes de ML
    • Atualizações de pacotes de ML gerais
    • Histórico de versões dos pacotes de ML
Notas de versão do Document Understanding
Last updated 2 de jul de 2024

Histórico de versões dos pacotes de ML

v24.4.1

DocumentUnderstanding, InvoicesJapan, and endpoints

Data de lançamento: 20 de junho de 2024

Released in Endpoints + DocumentUnderstanding + InvoicesJapan ML package | v24.4.1

Correções de bugs

We fixed an issue related to dates in column fields specifically for the Japanese language.

v24.4.0

DocumentClassifier and Data Extraction

Data de lançamento: 24 de maio de 2024

Lançado em:
  • DocumentUnderstanding + Pacotes de ML de extração de dados | v24.4.0
  • Pacotes de ML do DocumentClassifier | v24.4.0

Novidades

Os seguintes novos pacotes de ML agora estão em visualização pública:

Melhorias

Essa versão também traz melhorias para vários outros pacotes de ML:
  • A precisão para o pacote de ML Faturas do Japão foi melhorada. Há também 11 novos campos para o modelo Faturas do Japão. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
  • O desempenho para o modelo Recibos de pagamentos foi melhorado.
  • Novos IDs estão disponíveis para o pacote de ML Cartões de identidade:
    • Cartões de identidade Aadhaar
    • Cartões de identidade da Arábia Saudita
    • Cartões PAN
  • Novos campos estão disponíveis para o pacote de ML UB04. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
  • Novos campos estão disponíveis para o pacote de ML Verificações. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.

Erratum - added 20 June 2024: Added information regarding a bug fix related to the parsing of Japanese dates.

Errata - adicionada em 28 de maio de 2024: adicionadas mais informações sobre várias melhorias.

v24.3.2

DocumentUnderstandingOCR endpoints

Data de lançamento: 13 de março de 2024

Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.3.2

Uma nova versão do Document Understanding OCR agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:
  • A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
  • A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.

v24.2.1

DocumentUnderstandingOCR endpoints

Release date: 9 February 2024

Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.2.1

Estamos empolgados por anunciar que a compatibilidade com árabe (ARA) para o UiPath Document Understanding OCR agora está em visualização pública.

v24.2.0

Extração de Dados

Release date: 1 April 2024

Lançado em Pacotes de ML de extração de dados | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:
  • 1040 Schedule C
  • 1040 Schedule D
  • 1040 Schedule E
  • UB04

Document Classifier

Release date: 4 March 2024

Lançado em Pacotes de ML do DocumentClassifier | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:
  • 1040 Schedule C
  • 1040 Schedule D
  • 1040 Schedule E
  • UB04

v23.10.4

Extração de Dados

Data de lançamento: 28 de março de 2024

Lançado em Pacotes de ML de extração de dados | v23.10.4

Uma nova versão para os pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:
  • A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
  • A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.
  • The accuracy for datasets smaller than 400 pages is improved.

v23.10.3

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 12 February 2024

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.3

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados que faz parte do AI Center agora está disponível para uso geral.

Essa nova versão traz uma correção de bug relacionada à extração de valores de texto bidirecionais (da esquerda para a direita e da direita para a esquerda).

Observação: atualmente, nossa plataforma não tem localização para idiomas da direita para a esquerda (como hebraico ou árabe). Com isso, quando combinado com marcas de pontuação ou caracteres especiais, o texto nesses idiomas que aparece na interface de anotação (Document Manager) ou na interface de validação (Estação de validação no Action Center) não é exibido corretamente. No entanto, se os valores das strings forem inseridos em um aplicativo que tenha o modo de leitura da direita para a esquerda habilitado, o texto deve ser exibido corretamente. Um exemplo típico é o Notepad, onde a ordem de leitura da direita para a esquerda está habilitada.

v23.10.2

DocumentUnderstanding and Data Extraction

Release date: 23 January 2024

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.2

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Esta versão traz uma correção de bug que ocasionalmente fazia com que o treinamento falhasse.

v23.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Data de lançamento: 26 de outubro de 2023

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.0

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Estamos trabalhando constantemente para melhorar sua experiência com o Document Understanding. Para esta versão, nos certificamos de trazer pequenas melhorias de segurança e estabilidade para nosso produto.

UiPath Document Understanding OCR

Data de lançamento: 2 de outubro de 2023

Released in UiPath Document Understanding OCR | v23.10

Temos o prazer de anunciar que hebraico (HEB) agora é suportado pelo UiPath Document Understanding OCR.

v23.7.0

DocumentUnderstanding and Data Extraction

Data de lançamento: 3 de agosto de 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.7.0

  • Em documentos onde uma tabela é executada em muitas páginas, uma linha de tabela (um item de linha) é dividida em 2 páginas, em alguns casos ainda mais. As versões do modelo anterior assumiam que cada quebra de página também era uma quebra de linha e quebravam itens em vários pedaços. A versão do modelo atual corrige esse problema. Para se beneficiar desta funcionalidade em um fluxo de trabalho, você precisa usar o pacote DocumentUnderstanding.ML.Activities versão 1.23.0-prévia e a versão do modelo 23.7.0 nesse fluxo de trabalho específico.
  • Os modelos agora têm um tempo de previsão por página mais rápido e usam RAM de forma mais eficiente, permitindo o processamento de documentos maiores.

v23.6.0

DocumentUnderstanding and endpoints

Data de lançamento: 13 de junho de 2023

Released in DocumentUnderstanding + endpoints | v23.6.0

We've improved the accuracy of the UiPathDocumentOCR ML package.

v23.4.1

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 May 2023

Lançado nos pacotes de ML do DocumentUnderstanding + Data Extraction | v23.4.1

Corrigimos um problema que afetava o treinamento do modelo.

v23.4.5

Document Understanding

Release date: 21 April 2023

Lançado no DocumentUnderstanding | V23.4.5

Melhoramos o modelo de texto digitado geral e aprimoramos a funcionalidade de reconhecimento de caixa de seleção.

v23.4.2

Document Understanding

Release date: 24 March 2023

Released in DocumentUnderstanding | v23.4.2

O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco. Aqui está a lista completa dos novos idiomas suportados: dinamarquês, sueco, norueguês, finlandês, polonês, húngaro, checo, eslovaco, estoniano, letão, lituano, esloveno, croata, sérvio, turco.

v23.4.0

DocumentUnderstanding, Data Extraction, and endpoints

Data de lançamento: 10 de maio de 2023

Lançado nos pacotes de ML do DocumentUnderstanding + Data Extraction | v23.4.0

The UiPath Document OCR is now available as an out-of-the-box pre-trained package, and it is available for both GPU and CPU usage. This enables customers who prefer to avoid using public endpoints to deploy UiPath Document OCR in their own tenants, in an isolated environment.

Uma lista de sete novos pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral. Aqui está a lista dos sete novos modelos:

  • Certificado de Constituição/ Situação Regular
  • Certificado de origem
  • Certificado de produto infantil
  • CMS1500
  • Declaração de Conformidade da UE
  • Envio de Notas Fiscais
  • Contracheques

DocumentClassifier and endpoints

Data de lançamento: 26 de abril de 2023

Lançado nos endpoints + Pacotes de ML DocumentClassifier | v23.4.0

We've added new document types to the DocumentClassifier ML Package, made general improvements, and fixed some small bugs.

v23.2.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 February 2023

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.2.0

O que há de novo e melhorias

A new version of the out-of-the-box pre-trained ML packages (23.1.0) and their public endpoints has been released, now using cutting edge LayoutLM Transformers based architecture, which is more powerful and increases accuracy overall, especially on column fields (tables).

This improvement has made the out-of-the-box pre-trained ML packages more powerful, meaning that you may experience longer latency for training and for predictions.

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Uma remoção futura é anunciada para a funcionalidade de edições manuais usada na avaliação do modelo. Mais informações aqui.

Problemas conhecidos

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Errata 8 de maio de 2023

Problema conhecido

Um Fatal Python error: Segmentation fault é recebido ao executar um pipeline completo ou de treinamento. Recomendamos usar os pacotes de ML com a v23.4 até que esse bug seja corrigido.

Errata 20 de abril de 2023

A pontuação geral para todos os pipelines agora é precisa. Anteriormente era uma pontuação F1. Os artefatos de avaliação no AI Center ainda contêm precisão e pontuação F1, para comparabilidade reversa.

v23.1.0

DocumentClassifier and endpoints

Release date: 11 January 2023

Lançado em Endpoints e DocumentClassifier | v23.1.0

Melhoramos as pontuações da F1 e agora também são exibidas para pipelines de treinamento.

A pasta Artefatos possui uma lista atualizada de artefatos.

O modelo DocumentClassifier agora prevê 25 classes, em vez de 26, devido à remoção da classe Notas de Entrega.

v22.12.2

Pontos de Extremidade

Release date: 16 December 2022

Released in endpoints | v22.12.2

O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco.

v22.11.0

Document Understanding, Data Extraction, and endpoints

Data de lançamento: 13 de dezembro de 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.11.0

Esta versão traz melhorias significativas para os endpoints públicos dos Pacotes de ML pré-treinados prontos para uso, o que significa que agora estamos usando a arquitetura Deep Learning baseada em LayoutLM mais recente.

Este aprimoramento proporciona maior precisão em todos os tipos de documentos, especialmente para o modelo de Faturas, e também melhora a precisão nos campos de colunas e tabelas.

Adicionamos novos campos extraídos ao modelo de Faturas, que agora inclui Data de envio, Endereço de e-mail do fornecedor, Nome do banco, Número da conta bancária, IBAN, Código SWIFT, Endereço do banco, Número de roteamento do banco e Taxa de imposto. Você pode conferir a lista de campos extraídos acessando esta página e clicando no link disponível para cada modelo.

As pontuações do modelo agora também são retornadas pelos pipelines de treinamento, não apenas pelos pipelines completos ou de avaliação.

As pontuações F1 agora estão disponíveis para cada campo de coluna. Anteriormente, as pontuações de F1 ficavam disponíveis apenas para todos os campos de coluna avaliados em conjunto.

v22.10.2

Pontos de Extremidade

Release date: 3 February 2023

Released in endpoints | v22.10.2

We've updated the public endpoints of the out-of-the-box pre-trained ML packages, and are now using cutting edge LayoutLM Transformers based architecture.

v22.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 7 October 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.10.0

O que há de novo e melhorias

Os seguintes modelos pré-treinados agora estão listados como oficiais, sem a tag -Preview: FaturasAustrália, FaturasÍndia, OrdensDeCompra.

The DeliveryNotes model has been renamed as BillsOfLading.

Dez novos modelos pré-treinados estão agora disponíveis: Acord25, 1040, Cheques, Extratos bancários, Demonstrativos financeiros, Romaneio de carga, Acord131, Acord126, Acord140, Título de veículo.

Correções de bugs

Várias correções de bugs foram feitas nos pacotes mencionados acima.

UiPath Document OCR

Release date: 4 October 2022

Released in UiPathDocumentOCR | v22.10.0 Cloud

Uma nova funcionalidade está disponível para detecção de códigos de barras e códigos QR.

Aprimoramentos de precisão foram feitos em strings longas, como endereços de e-mail e URLs, em fontes de largura fixa e na detecção de manuscritos e assinaturas.

A detecção de rotação de página também foi aprimorada.

v22.6.1-preview

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 10 October 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.6.1-preview

This release brings several bug fixes to the DocumentUnderstanding and Data Extraction packages and endpoints.

v22.6.0-preview

DocumentUnderstanding and Data Extraction

Release date: 6 September 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.6.0-preview

Há 18 novos pacotes de ML disponíveis em Visualização com uma arquitetura de modelo mais avançada para nossos pacotes de ML do DU no AI Center. Você pode facilmente identificá-los pelo termo Preview anexado ao final do nome do pacote, por exemplo: InvoicesPreview, PurchaseOrderPreview, Acord125Preview etc.

Atualizamos a lista de pontos de extremidades públicos com todos os novos pacotes de ML em Visualização, os quais podem ser consultados em Pontos de extremidade públicos.

Vale a pena mencionar o fato de que esses modelos de visualização não consomem unidades DU/AI de seu direito de licenciamento.

Corrigido um bug no uso de habilidades privadas, agora a habilidade privada pode ser usada apenas com uma chave de API que pertence à mesma organização usando a instância do AI Center.

v22.5.2

DocumentUnderstanding and Data Extraction

Release date: 22 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.5.2

Correções de bugs

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

Problema conhecido

There is a known issue for the Invoices package that ocassionally leads to an error when trying to run an auto-fine-tunning loop in AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 18 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.5.1

Correções de bugs

  • Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
  • Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
  • Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
  • Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.5.0

AI Center cloud, Data Extraction

Release date: 16 June 2022

Released in AI Center Cloud, Data Extraction ML packages | v22.5.0

Melhorias

O desempenho foi aprimorado para todos os pacotes de ML de extração de dados.

v22.4.3

DocumentUnderstanding and Data Extraction

Release date: 21 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.4.3

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

v22.4.2

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.4.2

Correções de bugs

  • Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
  • Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
  • Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
  • Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.4.1

AI Center cloud, Data Extraction

Release date: 3 June 2022

Release date in AI Center Cloud, Data Extraction ML packages | v22.4.1

Correções de bugs

Corrigido um bug que ocorria ao executar um pipeline de avaliação em um modelo treinado com o especial line_detection mode, fazendo com que as previsões fossem diferentes de quando chamadas a partir da habilidade de ML.

v22.4.0

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Data de lançamento: 10 de maio de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.4.0

Novidades

As habilidades de manuscrito agora estão disponíveis para os pacotes UiPathDocumentOCR e UiPathDocumentOCR_CPU, integrando o HandwritingRecognitionOCR. Os mesmos recursos podem ser encontrados no pacote UiPath.OCR.LocalServer do Studio.

New architecture on extraction ML packages, with major benefits, especially to models trained using the DocumentUnderstanding ML package.

Pacotes de ML de contas de serviços, W9 e passaportes agora estão disponíveis como GA. Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.

Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.

Document Search é uma nova funcionalidade disponível no Document Manager, que facilita a rotulagem de documentos com um número elevado de páginas.

Melhorias

Foram feitas melhorias nos pacotes de ML para extração de documentos no AI Center. O documento Excel de Avaliação recebeu novas planilhas, permitindo organizar e interpretar melhor os dados avaliados.

Pacotes de ML na instalação offline do Automation Suite receberam um novo pacote offline.

A precisão e o desempenho foram aprimorados para o UiPathDocumentOCR.

Correções de bugs

Várias correções em campos de data de análise, incluindo datas em campos de coluna, datas em documentos turcos, datas distantes no futuro.

v22.2.3

UiPathDocumentUnderstandingOCR

Release date: 7 March 2022

Released in UiPathDocumentOCR | v22.2.3

Capacidade superior

HandwritingRecognitionOCR integrado ao UiPathDocumentOCR. Em muitos casos, há uma mistura de campos. Ao integrar a capacidade de leitura de manuscrito, podemos aplicar o reconhecimento correto a cada campo: reconhecimento de impressão para texto impresso e reconhecimento de manuscrito para texto manuscrito.

Embora o HandwritingRecognitionOCR possa detectar qualquer manuscrito, tenha em mente que ele é treinado e otimizado apenas para inglês.

v22.1.6

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 March 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.1.6

Correções de bugs

Corrigido um bug que estava causando a falha de um pipeline de treinamento ou de um pipeline completo no AI Center devido a um problema de pacote de ML no pré-processamento de dados para uma linha vazia.

v22.1.4

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 2 March 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.1.4

Novidades

O pacote de ML para Contas de serviços públicos agora está disponível para público geral.

Melhorias

Melhor desempenho geral e escalabilidade.

Melhorias significativas nas pontuações ao treinar na nova versão do Pacote de ML DocumentUnderstanding em comparação às versões anteriores.

As datas nos campos da coluna agora são analisadas corretamente.

A análise de data agora reconhece os nomes dos meses turcos.

Alterações

Alterado o comportamento para pipelines de treinamento e pipelines completos ao treinar na GPU versus na CPU. Os modelos 21.10.x treinados em CPUs eram menores, então treinavam mais rápido do que as versões anteriores, embora tivessem uma precisão um pouco menor do que antes.

Esse comportamento foi revertido com esta versão, portanto, o modelo que está sendo treinado na GPU e na CPU é exatamente o mesmo, e a velocidade de treinamento foi revertida para o que era antes de 2021.10, o que significa que o treinamento na CPU é novamente 10-20X mais lento do que na GPU.

v21.10.11

Extração de Dados

Release date: 23 November 2021

Released in Data Extraction ML packages | v21.10.11

Corrigido um bug que fazia com que os pipelines de treinamento e avaliação falhassem devido à lógica de pós-processamento de data.

v21.10.9

Extração de Dados

Release date: 24 November 2021

Released in Data Extraction ML packages | v21.10.9

Corrigido um bug que acarretava em erro de previsão durante a execução.

Data Extraction and endpoints

Release date: 22 October 2021

Released in Data Extraction ML packages and endpoints | v21.10.9

Novidades

O Pacote de ML PurchaseOrders agora está disponível para o público geral e pronto para ser usado em seus cenários de produção.

Os Pacotes de ML InvoicesChina ,DeliveryNotes, RemittanceAdvices, W2 e W9 estão agora em Visualização pública. Recomendamos que você confira esses pacotes e comece a usá-los para o tipo de documento que precisa processar.

Melhorias

Avaliação em nível de documento implementada. Avaliação em nível de documento implementada. Isso representa o desempenho durante a execução em seu fluxo de trabalho de RPA.

A avaliação também pode ser feita em conjuntos de dados com menos campos do que o pacote de ML que está sendo avaliado. Isso facilita a avaliação de pacotes de ML pré-treinados prontos para uso.

Para avaliar o impacto que o OCR tem na precisão da extração, agora você pode executá-lo novamente ao rodar um pipeline de avaliação. Isso exige que o OCR seja configurado ao criar um pacote de ML e a variável de ambiente eval.redo_ocr precisa ser definida como verdadeira no pipeline de avaliação do AI Center.

O treinamento na CPU agora usa um modelo menor para obter uma aceleração de 5x-7x. No entanto, você deve esperar uma precisão menor em 0-5% na CPU.

Adicionadas colunas de Confiança Mínima e Taxa de Processamento Direto aos arquivos Evaluation.xlsx produzidos pelos Pipelines de Avaliação.

O pacote de ML UtilityBills foi substancialmente melhorado.

Melhoria na análise de endereços para endereços que pulam 1-2 linhas de texto.

Melhoria na extração de valores negativos, valores muito grandes (11 dígitos ou mais) ou datas distantes no futuro.

Adicionado suporte para caixas rotacionadas em recibos.

Aprimoramento de espaços concatenados.

Correções de bugs

  • Corrigido um bug que não estava retornando caracteres especiais em campos do tipo String.
  • Corrigido um bug para o Pacote de ML Passports, no qual a data escrita como um número ordinal (1º, 2º, 3º, 4º, etc.) não era analisada corretamente.

Problemas conhecidos

Retreinamento dos Pacotes de ML InvoicesJapan e InvoicesChina usando dados do Validation Station não é atualmente suportado. Como solução alternativa, use o Google Cloud OCR Vision.

Próximas descontinuações

Todos os endpoints públicos, exceto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier serão descontinuados para regiões fora da Europa Ocidental a partir de 1º de dezembro de 2021.

v21.10.5

UiPathDocumentOCR endpoints

Release date: 13 December 2021

Released in UiPathDocumentOCR endpoints | v21.10.5

Melhorias

O UiPathDocumentOCR agora também está disponível na região de Cingapura.

v21.10.1

Data Extraction and endpoints for UiPathDocumentOCR

Release date: 24 September 2021

Released in Data Extraction and endpoints for UiPathDocumentOCR | v21.10.1

Melhorias

Adicionado suporte para texto rotacionado, mesmo que a rotação seja em ângulos diferentes para cada palavra.

Suporte adicionado para texto vertical. Esta melhoria está disponível no momento apenas para UiPath.IntelligentOCR.Activities, incluindo a Estação de Validação; Data Manager e Machine Learning Extractor ainda não suportam texto vertical.

Melhoria da precisão em imagens ou fotos com ruído: por exemplo, recibos, carteiras de identidade ou passaportes.

v21.10

FormExtractor, IntelligentFormExtractor, and IntelligentKeywordClassifier endpoints

Release date: 13 December 2021

Released FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier in Endpoints | v21.10

Melhorias

Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier agora também estão disponíveis na região de Cingapura.

v21.7

Data Extraction and endpoints for Handwriting Recognition

Release date: 11 August 2021

Released in Data Extraction and endpoints for Handwriting Recognition | v21.7

Melhorias

Capacidade de lidar com vários fragmentos em uma única solicitação (call) para o modelo.

Retreinamento de modelo e algumas outras alterações para melhor precisão do modelo.

Correções de bugs

Corrigido um bug que fazia o pod reiniciar quando não havia mais memória.

v21.6.3

UiPathDocumentOCR in endpoints

Data de lançamento: 9 de junho de 2021

Released in endpoints for UiPathDocumentOCR | v21.6.3

Melhorias

Detecção de dígito único aprimorada.

Precisão aprimorada em caracteres 1, I e l.

Detecção aprimorada de texto com pouco espaçamento.

v21.5.5

Data Extraction and endpoints

Release date: 18 June 2021

Released in endpoints and Data Extraction ML packages | v21.5.5

Corrigido um bug que causava diferenças de previsão entre o Data Manager e a atividade Digitize Document.

v21.5.3

Data Extraction and endpoints

Release date: 8 June 2021

Released in endpoints and Data Extraction ML packages | v21.5.3

Novidades

Para imagens de difícil leitura, como no caso de Documentos de identidade e Passaportes, dois novos pacotes pré-treinados e prontos para uso, respectivamente, foram lançados.

Melhorias

Campos de classificação retreináveis incorporados em nossos pacotes prontos para uso pré-treinados.

v21.4.7

Data Extraction and endpoints

Data de lançamento: 20 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.7

Análise de data aprimorada para pacotes de ML de extração de dados.

v21.4.5

Data Extraction and endpoints

Data de lançamento: 15 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.5

Novidades

Implantação de todos os endpoints públicos na região dos Estados Unidos.

Endpoints públicos implantados para Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier nas regiões do Canadá e Japão.

v21.4

Data Extraction and endpoints for HandwritingRecognition and DocumentClassifier

Data de lançamento: 9 de março de 2021

Released in Data Extraction ML packages & endpoints for HandwritingRecognition, DocumentClassifier, + Standalone Docker for UiPathDocumentOCR | v21.4

Novidades

HandwritingRecognition with improved recognition using spelling corrections and ability to read machine-printed text reaches general availability.

DocumentClassifier reaches general availability as well.

Melhorias no UiPathDocumentOCR para:

  • Botões de opção/detecção de caixa de seleção
  • Precisão em formulários de bolhas
  • Precisão geral

v21.1.8

Data Extraction and endpoints

Release date: 17 February 2021

Released in endpoints and Data Extraction ML packages | v21.1.8

Melhorias

Precisão melhorada.

InvoicesIndia e InvoicesAustralia já estão disponíveis para o público geral.

Endpoints públicos implantados na região da Austrália.

O argumento de edição não é mais necessário em URLs de endpoint. Por exemplo, https://du.uipath.com/ie/invoices funcionará tanto para tráfego enterprise quanto para community.

v20.11.3

Extração de Dados

Data de lançamento: 18 de dezembro de 2020

Released in Data Extraction ML packages | v20.11.3

Melhorias

Melhorias no treinamento da CPU para ser mais rápido e exigir menos memória.

Melhorias na análise de data para documentos não norte-americanos.

Reconhecimento de caixa de seleção para UiPathDocumentOCR, incluindo caixas de seleção impressas ou manuscritas.

v20.10.4

Data Extraction and endpoints

Release date: 10 November 2020

Released in endpoints and Data Extraction ML packages | v20.10.4

Novos recursos e melhorias

Um novo modelo para Faturas Japonesas.

Os pipelines de avaliação agora retornam métricas para campos de classificação também.

Suporte para Microsoft Read OCR versão 3.

Melhorias na formatação/análise de data para detectar formatos de dia/mês/ano versus formatos de mês/dia/ano.

Melhorias nas detecções de ponto decimal e separadores de milhares para análise correta de números.

O treinamento na CPU é compatível com todas as versões do AI Fabric.

Análise melhorada para os campos com tipo de conteúdo id-no.

Suporte apenas para campos de Classificação de treinamento (sem campos Regular ou Coluna).

O número máximo de campos permitidos aumentou de 32 para 40.

Relatório de níveis de confiança para campos de Coluna.

Problemas conhecidos

Ao criar um pacote UiPath.DocumentUnderstanding.ML.Activities no AI Center, o nome do pacote não deve ser nenhuma palavra-chave reservada do python, como class, break, from, finally, global, None etc. Observe que esta lista não é exaustiva, pois o nome do pacote é usado para class <pkg-name> e import <pkg-name>.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.