document-understanding

LATEST

false

Notas de versão do Document Understanding
Pacotes de ML e notas de versão de pontos de extremidade públicos
- Pacotes de ML gerais e atualizações de pontos de extremidade públicos
- Pacotes de ML e histórico de versões de pontos de extremidade públicos

Notas de versão do Document Understanding

ENTREGA:

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

Last updated 31 de out de 2024

Pacotes de ML e histórico de versões de pontos de extremidade públicos

v24.9.1

UiPath Document Understanding OCR

Data de lançamento: 3 de outubro de 2024

Lançado no UiPath Document Understanding OCR e pontos de extremidade | V24.9.1

Melhorias

Esta versão traz melhorias de precisão e desempenho para reconhecimento de escrita à mão.

v24.7

UiPath Document OCR

Data de lançamento: 23 de julho de 2024

Lançado no UiPath Document Understanding OCR e pontos de extremidade (incluindo o UiPath Document Understanding OCR_CPU) | v24.7

Melhorias

A precisão para o idioma azerbaijano é melhorada adicionando reconhecimento para os caracteres əƏ.
O reconhecimento e a detecção para o Magnetic Ink Character Recognition (MIRC) foram melhorados, trazendo precisão aprimorada, especialmente para verificações.
Anteriormente, os números não eram reconhecidos em algumas instâncias quando um espaço era usado como separador. Isso agora foi aprimorado, e os números agora são reconhecidos quando o espaço é usado como separador.

Correções de bugs

A pontuação de confiança para o UiPath Document Understanding OCR foi melhorada, especialmente quando usada em imagens de baixa qualidade. Em fluxos de trabalho onde a pontuação de confiança é usada para decidir se os documentos precisam de validação humana no Action Center, essa melhoria pode resultar em um número maior de documentos em validação.

v24.4.4

Extração de Dados

Data de lançamento: 3 de outubro de 2024

Lançado em Pacotes de ML de extração de dados | V24.4.4

Correções de bugs

Corrigimos um problema que fazia com que os pipelines de treinamento do AI Center relatassem pontuações imprecisas para os tipos de campo ID Number e Phone Number . Isso garante que as pontuações relatadas correspondam às pontuações reais.
Corrigimos um problema relacionado à análise de valores em campos em japonês quando o OCR de idiomas estendido estava em uso.

v24.4.3

DocumentUnderstanding e Extração de dados

Data de lançamento: 14 de agosto de 2024

Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v24.4.3

Melhorias

Improved field text formatting for Chinese, Japanese, and Korean languages when using the UiPath® Extended Languages OCR in the digitization step.

v24.4.2

InvoicesIndia e pontos de extremidade

Data de lançamento: 23 de julho de 2024

Lançado em pontos de extremidade e pacote de ML InvoicesIndia | v24.4.2

Correções de bugs

Corrigimos um problema relacionado à análise de números em faturas indianas.

v24.4.1

DocumentUnderstanding, FaturasJapão e pontos de extremidade

Data de lançamento: 20 de junho de 2024

Lançado em pontos de extremidade + DocumentUnderstanding + Pacote de ML InvoicesJapan | v24.4.1

Correções de bugs

Corrigimos um problema relacionado a datas em campos de coluna especificamente para o idioma japonês.

v24.4.0

DocumentClassifier e Extração de dados

Data de lançamento: 24 de maio de 2024

Lançado em:

DocumentUnderstanding + Pacotes de ML de extração de dados | v24.4.0
Pacotes de ML do DocumentClassifier | v24.4.0

Novidades

Os seguintes novos pacotes de ML agora estão em visualização pública:

Melhorias

Essa versão também traz melhorias para vários outros pacotes de ML:

A precisão para o pacote de ML Faturas do Japão foi melhorada. Há também 11 novos campos para o modelo Faturas do Japão. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
O desempenho para o modelo Recibos de pagamentos foi melhorado.
Novos IDs estão disponíveis para o pacote de ML Cartões de identidade:
- Cartões de identidade Aadhaar
- Cartões de identidade da Arábia Saudita
- Cartões PAN
Novos campos estão disponíveis para o pacote de ML UB04. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
Novos campos estão disponíveis para o pacote de ML Verificações. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.

Errata - adicionada em 20 de junho de 2024: informações adicionadas sobre uma correção de bug relacionada à análise de datas em japonês.

Errata - adicionada em 28 de maio de 2024: adicionadas mais informações sobre várias melhorias.

v24.3.2

Pontos de extremidade do DocumentUnderstandingOCR

Data de lançamento: 13 de março de 2024

Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.3.2

Uma nova versão do Document Understanding OCR agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:

A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.

v24.2.1

Pontos de extremidade do DocumentUnderstandingOCR

Data de lançamento: 9 de fevereiro de 2024

Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.2.1

Estamos empolgados por anunciar que a compatibilidade com árabe (ARA) para o UiPath Document Understanding OCR agora está em visualização pública.

v24.2.0

Extração de Dados

Data de lançamento: 1 de abril de 2024

Lançado em Pacotes de ML de extração de dados | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:

1040 Schedule C
1040 Schedule D
1040 Schedule E
UB04

Document Classifier

Data de lançamento: 4 de março de 2024

Lançado em Pacotes de ML do DocumentClassifier | v24.2.0

Essa versão é compatível com os novos modelos disponíveis em visualização pública:

1040 Schedule C
1040 Schedule D
1040 Schedule E
UB04

v23.10.5

UiPath Document Understanding OCR

Data de lançamento: 15 de outubro de 2024

Lançado no UiPath Document Understanding OCR e pontos de extremidade | v23.10.5

Melhorias

Esta versão traz melhorias de precisão e desempenho para reconhecimento de escrita à mão.

Correções de bugs

Corrigimos um problema no qual as caixas de anotação eram retornadas na horizontal, mesmo que alguns documentos estivessem ligeiramente inclinados, causando desalinhamento na anotação.

v23.10.4

Extração de Dados

Data de lançamento: 28 de março de 2024

Lançado em Pacotes de ML de extração de dados | v23.10.4

Uma nova versão para os pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral.

Essa versão traz as seguintes melhorias:

A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.
A precisão para conjuntos de dados menores que 400 páginas foi melhorada.

v23.10.3

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 12 de fevereiro de 2024

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.3

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados que faz parte do AI Center agora está disponível para uso geral.

Essa nova versão traz uma correção de bug relacionada à extração de valores de texto bidirecionais (da esquerda para a direita e da direita para a esquerda).

Observação: atualmente, nossa plataforma não tem localização para idiomas da direita para a esquerda (como hebraico ou árabe). Com isso, quando combinado com marcas de pontuação ou caracteres especiais, o texto nesses idiomas que aparece na interface de anotação (Document Manager) ou na interface de validação (Estação de validação no Action Center) não é exibido corretamente. No entanto, se os valores das strings forem inseridos em um aplicativo que tenha o modo de leitura da direita para a esquerda habilitado, o texto deve ser exibido corretamente. Um exemplo típico é o Notepad, onde a ordem de leitura da direita para a esquerda está habilitada.

v23.10.2

DocumentUnderstanding e Extração de dados

Data de lançamento: 23 de janeiro de 2024

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.2

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Esta versão traz uma correção de bug que ocasionalmente fazia com que o treinamento falhasse.

v23.10.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 26 de outubro de 2023

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.0

Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.

Estamos trabalhando constantemente para melhorar sua experiência com o Document Understanding. Para esta versão, nos certificamos de trazer pequenas melhorias de segurança e estabilidade para nosso produto.

UiPath Document Understanding OCR

Data de lançamento: 2 de outubro de 2023

Lançado no UiPath Document Understanding OCR | v23.10

Temos o prazer de anunciar que hebraico (HEB) agora é suportado pelo UiPath Document Understanding OCR.

v23.7.0

DocumentUnderstanding e Extração de dados

Data de lançamento: 3 de agosto de 2023

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v23.7.0

Em documentos onde uma tabela é executada em muitas páginas, uma linha de tabela (um item de linha) é dividida em 2 páginas, em alguns casos ainda mais. As versões do modelo anterior assumiam que cada quebra de página também era uma quebra de linha e quebravam itens em vários pedaços. A versão do modelo atual corrige esse problema. Para se beneficiar desta funcionalidade em um fluxo de trabalho, você precisa usar o pacote DocumentUnderstanding.ML.Activities versão 1.23.0-prévia e a versão do modelo 23.7.0 nesse fluxo de trabalho específico.
Os modelos agora têm um tempo de previsão por página mais rápido e usam RAM de forma mais eficiente, permitindo o processamento de documentos maiores.

v23.6.0

DocumentUnderstanding e pontos de extremidade

Data de lançamento: 13 de junho de 2023

Lançado no DocumentUnderstanding + pontos de extremidade | v23.6.0

Melhoramos a precisão do pacote de ML do UiPathDocumentOCR.

v23.4.1

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 23 de maio de 2023

Lançado nos pacotes de ML do DocumentUnderstanding + Data Extraction | v23.4.1

Corrigimos um problema que afetava o treinamento do modelo.

v23.4.5

Document Understanding

Data de lançamento: 21 de abril de 2023

Lançado no DocumentUnderstanding | V23.4.5

Melhoramos o modelo de texto digitado geral e aprimoramos a funcionalidade de reconhecimento de caixa de seleção.

v23.4.2

Document Understanding

Data de lançamento: 24 de março de 2023

Lançado no DocumentUnderstanding | v23.4.2

O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco. Aqui está a lista completa dos novos idiomas suportados: dinamarquês, sueco, norueguês, finlandês, polonês, húngaro, checo, eslovaco, estoniano, letão, lituano, esloveno, croata, sérvio, turco.

v23.4.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 10 de maio de 2023

Lançado nos pacotes de ML do DocumentUnderstanding + Data Extraction | v23.4.0

O UiPath Document OCR agora está disponível como um pacote pré-treinado pronto para uso e está disponível para GPU e CPU. Isso permite que os clientes que preferem evitar o uso de pontos de extremidade públicos implementem o UiPath Document OCR em seus próprios tenants, em um ambiente isolado.

Uma lista de sete novos pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral. Aqui está a lista dos sete novos modelos:

Certificado de Constituição/ Situação Regular
Certificado de origem
Certificado de produto infantil
CMS1500
Declaração de Conformidade da UE
Envio de Notas Fiscais
Contracheques

DocumentClassifier e pontos de extremidade

Data de lançamento: 26 de abril de 2023

Lançado nos endpoints + Pacotes de ML DocumentClassifier | v23.4.0

Adicionamos novos tipos de documentos ao Pacote de ML do DocumentClassifier, fizemos melhorias gerais e corrigimos alguns pequenos bugs.

v23.2.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 23 de fevereiro de 2023

Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.2.0

O que há de novo e melhorias

Uma nova versão dos pacotes de ML pré-treinados prontos para uso (23.1.0) e seus pontos de extremidade públicos foram lançados, agora usando a arquitetura de ponta baseada em Transformers do LayoutLM, que é mais poderosa e aumenta a precisão em geral, especialmente em campos de coluna (tabelas).

Essa melhoria tornou os pacotes de ML pré-treinados prontos para uso mais potentes, o que significa que você pode experimentar latência mais longa para treinamento e previsões.

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Uma remoção futura é anunciada para o recurso de edições manuais usado na avaliação do modelo. Mais informações aqui.

Problemas conhecidos

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Errata 8 de maio de 2023

Problema conhecido

Um Fatal Python error: Segmentation fault é recebido ao executar um pipeline completo ou de treinamento. Recomendamos usar os pacotes de ML com a v23.4 até que esse bug seja corrigido.

Errata 20 de abril de 2023

A pontuação geral para todos os pipelines agora é precisa. Anteriormente era uma pontuação F1. Os artefatos de avaliação no AI Center ainda contêm precisão e pontuação F1, para comparabilidade reversa.

v23.1.0

DocumentClassifier e pontos de extremidade

Data de lançamento: 11 de janeiro de 2023

Lançado em Endpoints e DocumentClassifier | v23.1.0

Melhoramos as pontuações da F1 e agora também são exibidas para pipelines de treinamento.

A pasta Artefatos possui uma lista atualizada de artefatos.

O modelo DocumentClassifier agora prevê 25 classes, em vez de 26, devido à remoção da classe Notas de Entrega.

v22.12.2

Pontos de Extremidade

Data de lançamento: 16 de dezembro de 2022

Lançado em pontos de extremidade | v22.12.2

v22.11.0

Document Understanding, Extração de dados e pontos de extremidade

Data de lançamento: 13 de dezembro de 2022

Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.11.0

Esta versão traz melhorias significativas para os endpoints públicos dos Pacotes de ML pré-treinados prontos para uso, o que significa que agora estamos usando a arquitetura Deep Learning baseada em LayoutLM mais recente.

Este aprimoramento proporciona maior precisão em todos os tipos de documentos, especialmente para o modelo de Faturas, e também melhora a precisão nos campos de colunas e tabelas.

Adicionamos novos campos extraídos ao modelo de Faturas, que agora inclui Data de envio, Endereço de e-mail do fornecedor, Nome do banco, Número da conta bancária, IBAN, Código SWIFT, Endereço do banco, Número de roteamento do banco e Taxa de imposto. Você pode conferir a lista de campos extraídos acessando esta página e clicando no link disponível para cada modelo.

As pontuações do modelo agora também são retornadas pelos pipelines de treinamento, não apenas pelos pipelines completos ou de avaliação.

As pontuações F1 agora estão disponíveis para cada campo de coluna. Anteriormente, as pontuações de F1 ficavam disponíveis apenas para todos os campos de coluna avaliados em conjunto.

v22.10.2

Pontos de Extremidade

Data de lançamento: 3 de fevereiro de 2023

Lançado em pontos de extremidade | v22.10.2

Atualizamos os pontos de extremidade públicos dos pacotes de ML pré-treinados prontos para uso e agora estamos usando a arquitetura de ponta baseada em LayoutLM Transformers.

v22.10.0

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 7 de outubro de 2022

Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.10.0

O que há de novo e melhorias

Os seguintes modelos pré-treinados agora estão listados como oficiais, sem a tag -Preview: FaturasAustrália, FaturasÍndia, OrdensDeCompra.

O modelo DeliveryNotes foi renomeado como BillsOfLading.

Dez novos modelos pré-treinados estão agora disponíveis: Acord25, 1040, Cheques, Extratos bancários, Demonstrativos financeiros, Romaneio de carga, Acord131, Acord126, Acord140, Título de veículo.

Correções de bugs

Várias correções de bugs foram feitas nos pacotes mencionados acima.

UiPath Document OCR

Data de lançamento: 4 de outubro de 2022

Lançado no UiPathDocumentOCR | v22.10.0 Cloud

Uma nova funcionalidade está disponível para detecção de códigos de barras e códigos QR.

Aprimoramentos de precisão foram feitos em strings longas, como endereços de e-mail e URLs, em fontes de largura fixa e na detecção de manuscritos e assinaturas.

A detecção de rotação de página também foi aprimorada.

v22.6.1-preview

DocumentUnderstanding, Extração de dados e pontos de extremidade

Data de lançamento: 10 de outubro de 2022

Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.6.1-preview

Essa versão traz várias correções de bugs para os pacotes e pontos de extremidade do DocumentUnderstanding e Extração de Dados.

v22.6.0-preview

DocumentUnderstanding e Extração de dados

Release date: 6 September 2022

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v22.6.0-preview

Há 18 novos pacotes de ML disponíveis em Visualização com uma arquitetura de modelo mais avançada para nossos pacotes de ML do DU no AI Center. Você pode facilmente identificá-los pelo termo Preview anexado ao final do nome do pacote, por exemplo: InvoicesPreview, PurchaseOrderPreview, Acord125Preview etc.

Atualizamos a lista de pontos de extremidades públicos com todos os novos pacotes de ML em Visualização, os quais podem ser consultados em Pontos de extremidade públicos.

Vale a pena mencionar o fato de que esses modelos de visualização não consomem unidades DU/AI de seu direito de licenciamento.

Corrigido um bug no uso de habilidades privadas, agora a habilidade privada pode ser usada apenas com uma chave de API que pertence à mesma organização usando a instância do AI Center.

v22.5.2

DocumentUnderstanding e Extração de dados

Data de lançamento: 22 de julho de 2022

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v22.5.2

Correções de bugs

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

Problema conhecido

Há um problema conhecido para o pacote Faturas que ocasionalmente leva a um erro ao tentar executar um loop de ajuste automático no AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 18 de julho de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.5.1

Correções de bugs

Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.5.0

AI Center cloud, Extração de dados

Data de lançamento: 16 de junho de 2022

Lançado no AI Center Cloud, pacotes de ML de extração de dados | v22.5.0

Melhorias

O desempenho foi aprimorado para todos os pacotes de ML de extração de dados.

v22.4.3

DocumentUnderstanding e Extração de dados

Data de lançamento: 21 de julho de 2022

Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v22.4.3

Esse hotfix estabiliza a divisão de itens combinando os métodos eol classifier e line_detection em um único método.

v22.4.2

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 14 de julho de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.4.2

Correções de bugs

Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo evaluation_F1_invoices.txt nos pipelines Full/Evaluation no AI Center.
Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em evaluation_F1_invoices.txt file nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.

v22.4.1

AI Center cloud, Extração de dados

Data de lançamento: 3 de junho de 2022

Data de lançamento no AI Center Cloud, Pacotes de ML de extração de dados | v22.4.1

Correções de bugs

Corrigido um bug que ocorria ao executar um pipeline de avaliação em um modelo treinado com o especial line_detection mode, fazendo com que as previsões fossem diferentes de quando chamadas a partir da habilidade de ML.

v22.4.0

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 10 de maio de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.4.0

Novidades

As habilidades de manuscrito agora estão disponíveis para os pacotes UiPathDocumentOCR e UiPathDocumentOCR_CPU, integrando o HandwritingRecognitionOCR. Os mesmos recursos podem ser encontrados no pacote UiPath.OCR.LocalServer do Studio.

Nova arquitetura em pacotes de ML de extração, com grandes benefícios, especialmente para modelos treinados usando o pacote de ML do DocumentUnderstanding.

Pacotes de ML de contas de serviços, W9 e passaportes agora estão disponíveis como GA. Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.

Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.

Document Search é uma nova funcionalidade disponível no Document Manager, que facilita a rotulagem de documentos com um número elevado de páginas.

Melhorias

Foram feitas melhorias nos pacotes de ML para extração de documentos no AI Center. O documento Excel de Avaliação recebeu novas planilhas, permitindo organizar e interpretar melhor os dados avaliados.

Pacotes de ML na instalação offline do Automation Suite receberam um novo pacote offline.

A precisão e o desempenho foram aprimorados para o UiPathDocumentOCR.

Correções de bugs

Várias correções em campos de data de análise, incluindo datas em campos de coluna, datas em documentos turcos, datas distantes no futuro.

v22.2.3

UiPathDocumentUnderstandingOCR

Data de lançamento: 7 de março de 2022

Lançado no UiPathDocumentOCR | v22.2.3

Capacidade superior

HandwritingRecognitionOCR integrado ao UiPathDocumentOCR. Em muitos casos, há uma mistura de campos. Ao integrar a capacidade de leitura de manuscrito, podemos aplicar o reconhecimento correto a cada campo: reconhecimento de impressão para texto impresso e reconhecimento de manuscrito para texto manuscrito.

Embora o HandwritingRecognitionOCR possa detectar qualquer manuscrito, tenha em mente que ele é treinado e otimizado apenas para inglês.

v22.1.6

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 14 de março de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados

| v22.1.6

Correções de bugs

Corrigido um bug que estava causando a falha de um pipeline de treinamento ou de um pipeline completo no AI Center devido a um problema de pacote de ML no pré-processamento de dados para uma linha vazia.

v22.1.4

DocumentUnderstanding, DocumentClassifier e Extração de dados

Data de lançamento: 2 de março de 2022

Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.1.4

Novidades

O pacote de ML para Contas de serviços públicos agora está disponível para público geral.

Melhorias

Melhor desempenho geral e escalabilidade.

Melhorias significativas nas pontuações ao treinar na nova versão do Pacote de ML DocumentUnderstanding em comparação às versões anteriores.

As datas nos campos da coluna agora são analisadas corretamente.

A análise de data agora reconhece os nomes dos meses turcos.

Alterações

Alterado o comportamento para pipelines de treinamento e pipelines completos ao treinar na GPU versus na CPU. Os modelos 21.10.x treinados em CPUs eram menores, então treinavam mais rápido do que as versões anteriores, embora tivessem uma precisão um pouco menor do que antes.

Esse comportamento foi revertido com esta versão, portanto, o modelo que está sendo treinado na GPU e na CPU é exatamente o mesmo, e a velocidade de treinamento foi revertida para o que era antes de 2021.10, o que significa que o treinamento na CPU é novamente 10-20X mais lento do que na GPU.

v21.10.11

Extração de Dados

Data de lançamento: 23 de novembro de 2021

Lançado em Pacotes de ML de extração de dados | v21.10.11

Corrigido um bug que fazia com que os pipelines de treinamento e avaliação falhassem devido à lógica de pós-processamento de data.

v21.10.9

Extração de Dados

Data de lançamento: 24 de novembro de 2021

Lançado em Pacotes de ML de extração de dados | v21.10.9

Corrigido um bug que acarretava em erro de previsão durante a execução.

Extração de dados e pontos de extremidade

Data de lançamento: 22 de outubro de 2021

Lançado em pacotes e pontos de extremidade de ML de extração de dados | v21.10.9

Novidades

O Pacote de ML PurchaseOrders agora está disponível para o público geral e pronto para ser usado em seus cenários de produção.

Os Pacotes de ML InvoicesChina ,DeliveryNotes, RemittanceAdvices, W2 e W9 estão agora em Visualização pública. Recomendamos que você confira esses pacotes e comece a usá-los para o tipo de documento que precisa processar.

Melhorias

Avaliação em nível de documento implementada. Avaliação em nível de documento implementada. Isso representa o desempenho durante a execução em seu fluxo de trabalho de RPA.

A avaliação também pode ser feita em conjuntos de dados com menos campos do que o pacote de ML que está sendo avaliado. Isso facilita a avaliação de pacotes de ML pré-treinados prontos para uso.

Para avaliar o impacto que o OCR tem na precisão da extração, agora você pode executá-lo novamente ao rodar um pipeline de avaliação. Isso exige que o OCR seja configurado ao criar um pacote de ML e a variável de ambiente eval.redo_ocr precisa ser definida como verdadeira no pipeline de avaliação do AI Center.

O treinamento na CPU agora usa um modelo menor para obter uma aceleração de 5x-7x. No entanto, você deve esperar uma precisão menor em 0-5% na CPU.

Adicionadas colunas de Confiança Mínima e Taxa de Processamento Direto aos arquivos Evaluation.xlsx produzidos pelos Pipelines de Avaliação.

O pacote de ML UtilityBills foi substancialmente melhorado.

Melhoria na análise de endereços para endereços que pulam 1-2 linhas de texto.

Melhoria na extração de valores negativos, valores muito grandes (11 dígitos ou mais) ou datas distantes no futuro.

Adicionado suporte para caixas rotacionadas em recibos.

Aprimoramento de espaços concatenados.

Correções de bugs

Corrigido um bug que não estava retornando caracteres especiais em campos do tipo String.
Corrigido um bug para o Pacote de ML Passports, no qual a data escrita como um número ordinal (1º, 2º, 3º, 4º, etc.) não era analisada corretamente.

Problemas conhecidos

Retreinamento dos Pacotes de ML InvoicesJapan e InvoicesChina usando dados do Validation Station não é atualmente suportado. Como solução alternativa, use o Google Cloud OCR Vision.

Próximas descontinuações

Todos os endpoints públicos, exceto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier serão descontinuados para regiões fora da Europa Ocidental a partir de 1º de dezembro de 2021.

v21.10.5

Pontos de extremidade do UiPathDocumentOCR

Data de lançamento: 13 de dezembro de 2021

Lançado em pontos de extremidade do UiPathDocumentOCR | v21.10.5

Melhorias

O UiPathDocumentOCR agora também está disponível na região de Cingapura.

Endpoints públicos

v21.10.1

Extração de dados e pontos de extremidade para UiPathDocumentOCR

Data de lançamento: 24 de setembro de 2021

Lançado em Extração de dados e pontos de extremidade para o UiPathDocumentOCR | v21.10.1

Melhorias

Adicionado suporte para texto rotacionado, mesmo que a rotação seja em ângulos diferentes para cada palavra.

Suporte adicionado para texto vertical. Esta melhoria está disponível no momento apenas para UiPath.IntelligentOCR.Activities, incluindo a Estação de Validação; Data Manager e Machine Learning Extractor ainda não suportam texto vertical.

Melhoria da precisão em imagens ou fotos com ruído: por exemplo, recibos, carteiras de identidade ou passaportes.

v21.10

Pontos de extremidade do FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier

Data de lançamento: 13 de dezembro de 2021

Lançados FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier em pontos de extremidade | v21.10

Melhorias

Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier agora também estão disponíveis na região de Cingapura.

Endpoints públicos

v21.7

Extração de dados e pontos de extremidade para Reconhecimento de manuscrito

Data de lançamento: 11 de agosto de 2021

Lançado em Extração de dados e pontos de extremidade para Reconhecimento de manuscrito | v21.7

Melhorias

Capacidade de lidar com vários fragmentos em uma única solicitação (call) para o modelo.

Retreinamento de modelo e algumas outras alterações para melhor precisão do modelo.

Correções de bugs

Corrigido um bug que fazia o pod reiniciar quando não havia mais memória.

v21.6.3

UiPathDocumentOCR em pontos de extremidade

Data de lançamento: 9 de junho de 2021

Lançado em pontos de extremidade para UiPathDocumentOCR | v21.6.3

Melhorias

Detecção de dígito único aprimorada.

Precisão aprimorada em caracteres 1, I e l.

Detecção aprimorada de texto com pouco espaçamento.

v21.5.5

Extração de dados e pontos de extremidade

Data de lançamento: 18 de junho de 2021

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.5.5

Corrigido um bug que causava diferenças de previsão entre o Data Manager e a atividade Digitize Document.

v21.5.3

Extração de dados e pontos de extremidade

Data de lançamento: 8 de junho de 2021

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.5.3

Novidades

Para imagens de difícil leitura, como no caso de Documentos de identidade e Passaportes, dois novos pacotes pré-treinados e prontos para uso, respectivamente, foram lançados.

Melhorias

Campos de classificação retreináveis incorporados em nossos pacotes prontos para uso pré-treinados.

v21.4.7

Extração de dados e pontos de extremidade

Data de lançamento: 20 de abril de 2021

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.4.7

Análise de data aprimorada para pacotes de ML de extração de dados.

v21.4.5

Extração de dados e pontos de extremidade

Data de lançamento: 15 de abril de 2021

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.4.5

Novidades

Implantação de todos os endpoints públicos na região dos Estados Unidos.

Endpoints públicos implantados para Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier nas regiões do Canadá e Japão.

v21.4

Extração de dados e pontos de extremidade para HandwritingRecognition e DocumentClassifier

Data de lançamento: 9 de março de 2021

Lançado em Pacotes e pontos de extremidade de ML de extração de dados para HandwritingRecognition, DocumentClassifier, + Docker independente para UiPathDocumentOCR | v21.4

Novidades

HandwritingRecognition com reconhecimento aprimorado usando correções ortográficas e a capacidade de ler texto impresso por máquina atinge a disponibilidade geral.

DocumentClassifier também atinge a disponibilidade geral.

Melhorias no UiPathDocumentOCR para:

Botões de opção/detecção de caixa de seleção
Precisão em formulários de bolhas
Precisão geral

v21.1.8

Extração de dados e pontos de extremidade

Data de lançamento: 17 de fevereiro de 2021

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.1.8

Melhorias

Precisão melhorada.

InvoicesIndia e InvoicesAustralia já estão disponíveis para o público geral.

Endpoints públicos implantados na região da Austrália.

O argumento de edição não é mais necessário em URLs de endpoint. Por exemplo, https://du.uipath.com/ie/invoices funcionará tanto para tráfego enterprise quanto para community.

v20.11.3

Extração de Dados

Data de lançamento: 18 de dezembro de 2020

Lançado em Pacotes de ML de extração de dados | v20.11.3

Melhorias

Melhorias no treinamento da CPU para ser mais rápido e exigir menos memória.

Melhorias na análise de data para documentos não norte-americanos.

Reconhecimento de caixa de seleção para UiPathDocumentOCR, incluindo caixas de seleção impressas ou manuscritas.

v20.10.4

Extração de dados e pontos de extremidade

Data de lançamento: 10 de novembro de 2020

Lançado em pontos de extremidade e pacotes de ML de extração de dados | v20.10.4

Novos recursos e melhorias

Um novo modelo para Faturas Japonesas.

Os pipelines de avaliação agora retornam métricas para campos de classificação também.

Suporte para Microsoft Read OCR versão 3.

Melhorias na formatação/análise de data para detectar formatos de dia/mês/ano versus formatos de mês/dia/ano.

Melhorias nas detecções de ponto decimal e separadores de milhares para análise correta de números.

O treinamento na CPU é compatível com todas as versões do AI Fabric.

Análise melhorada para os campos com tipo de conteúdo id-no.

Suporte apenas para campos de Classificação de treinamento (sem campos Regular ou Coluna).

O número máximo de campos permitidos aumentou de 32 para 40.

Relatório de níveis de confiança para campos de Coluna.

Problemas conhecidos

Ao criar um pacote UiPath.DocumentUnderstanding.ML.Activities no AI Center, o nome do pacote não deve ser nenhuma palavra-chave reservada do python, como class, break, from, finally, global, None etc. Observe que esta lista não é exaustiva, pois o nome do pacote é usado para class <pkg-name> e import <pkg-name>.

Nesta página