- Notas de versão do Document Understanding
- Pacotes de ML e notas de versão de pontos de extremidade públicos
- Pacotes de ML gerais e atualizações de pontos de extremidade públicos
- Pacotes de ML e histórico de versões de pontos de extremidade públicos
Pacotes de ML e histórico de versões de pontos de extremidade públicos
Data de lançamento: 23 de julho de 2024
Lançado no UiPath Document Understanding OCR e pontos de extremidade (incluindo o UiPath Document Understanding OCR_CPU) | v24.7
Melhorias
- A precisão para o idioma azerbaijano é melhorada adicionando reconhecimento para os caracteres əƏ.
- O reconhecimento e a detecção para o Magnetic Ink Character Recognition (MIRC) foram melhorados, trazendo precisão aprimorada, especialmente para verificações.
- Anteriormente, os números não eram reconhecidos em algumas instâncias quando um espaço era usado como separador. Isso agora foi aprimorado, e os números agora são reconhecidos quando o espaço é usado como separador.
Correções de bugs
A pontuação de confiança para o UiPath Document Understanding OCR foi melhorada, especialmente quando usada em imagens de baixa qualidade. Em fluxos de trabalho onde a pontuação de confiança é usada para decidir se os documentos precisam de validação humana no Action Center, essa melhoria pode resultar em um número maior de documentos em validação.
Data de lançamento: 3 de outubro de 2024
Lançado em Pacotes de ML de extração de dados | V24.4.4
Correções de bugs
- Corrigimos um problema que fazia com que os pipelines de treinamento do AI Center relatassem pontuações imprecisas para os tipos de campo
ID Number
ePhone Number
. Isso garante que as pontuações relatadas correspondam às pontuações reais. - Corrigimos um problema relacionado à análise de valores em campos em japonês quando o OCR de idiomas estendido estava em uso.
Data de lançamento: 14 de agosto de 2024
Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v24.4.3
Melhorias
Improved field text formatting for Chinese, Japanese, and Korean languages when using the UiPath® Extended Languages OCR in the digitization step.
Data de lançamento: 20 de junho de 2024
Lançado em pontos de extremidade + DocumentUnderstanding + Pacote de ML InvoicesJapan | v24.4.1
Correções de bugs
Corrigimos um problema relacionado a datas em campos de coluna especificamente para o idioma japonês.
Data de lançamento: 24 de maio de 2024
- DocumentUnderstanding + Pacotes de ML de extração de dados | v24.4.0
- Pacotes de ML do DocumentClassifier | v24.4.0
Novidades
Melhorias
- A precisão para o pacote de ML Faturas do Japão foi melhorada. Há também 11 novos campos para o modelo Faturas do Japão. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
- O desempenho para o modelo Recibos de pagamentos foi melhorado.
- Novos IDs estão disponíveis para o pacote de ML Cartões de identidade:
- Cartões de identidade Aadhaar
- Cartões de identidade da Arábia Saudita
- Cartões PAN
- Novos campos estão disponíveis para o pacote de ML UB04. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
- Novos campos estão disponíveis para o pacote de ML Verificações. Para a lista completa de campos extraídos, consulte o arquivo Detalhes dos modelos prontos para uso.
Errata - adicionada em 20 de junho de 2024: informações adicionadas sobre uma correção de bug relacionada à análise de datas em japonês.
Errata - adicionada em 28 de maio de 2024: adicionadas mais informações sobre várias melhorias.
Data de lançamento: 13 de março de 2024
Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.3.2
Uma nova versão do Document Understanding OCR agora está disponível para uso geral.
- A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
- A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.
Data de lançamento: 9 de fevereiro de 2024
Lançado nos pontos de extremidade do DocumentUnderstandingOCR | v24.2.1
Estamos empolgados por anunciar que a compatibilidade com árabe (ARA) para o UiPath Document Understanding OCR agora está em visualização pública.
Data de lançamento: 1 de abril de 2024
Lançado em Pacotes de ML de extração de dados | v24.2.0
- 1040 Schedule C
- 1040 Schedule D
- 1040 Schedule E
- UB04
Data de lançamento: 15 de outubro de 2024
Lançado no UiPath Document Understanding OCR e pontos de extremidade | v23.10.5
Melhorias
Esta versão traz melhorias de precisão e desempenho para reconhecimento de escrita à mão.
Correções de bugs
Corrigimos um problema no qual as caixas de anotação eram retornadas na horizontal, mesmo que alguns documentos estivessem ligeiramente inclinados, causando desalinhamento na anotação.
Data de lançamento: 28 de março de 2024
Lançado em Pacotes de ML de extração de dados | v23.10.4
Uma nova versão para os pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral.
- A precisão do turco (TUR) foi melhorada. O desempenho de caracteres com diacríticos (como Ç, ç, Ğ, ğ, ğ, I, ı, İ, i, Ü, Ü, ü) foi melhorado.
- A precisão para números árabes orientais (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩) foi melhorada.
- A precisão para conjuntos de dados menores que 400 páginas foi melhorada.
Data de lançamento: 12 de fevereiro de 2024
Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.3
Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados que faz parte do AI Center agora está disponível para uso geral.
Essa nova versão traz uma correção de bug relacionada à extração de valores de texto bidirecionais (da esquerda para a direita e da direita para a esquerda).
Data de lançamento: 23 de janeiro de 2024
Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.2
Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.
Esta versão traz uma correção de bug que ocasionalmente fazia com que o treinamento falhasse.
Data de lançamento: 26 de outubro de 2023
Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.10.0
Uma nova versão para todos os pacotes de ML pré-treinados e pré-configurados agora está disponível para uso geral.
Estamos trabalhando constantemente para melhorar sua experiência com o Document Understanding. Para esta versão, nos certificamos de trazer pequenas melhorias de segurança e estabilidade para nosso produto.
Data de lançamento: 3 de agosto de 2023
Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v23.7.0
- Em documentos onde uma tabela é executada em muitas páginas, uma linha de tabela (um item de linha) é dividida em 2 páginas, em alguns casos ainda mais. As versões do modelo anterior assumiam que cada quebra de página também era uma quebra de linha e quebravam itens em vários pedaços. A versão do modelo atual corrige esse problema. Para se beneficiar desta funcionalidade em um fluxo de trabalho, você precisa usar o pacote DocumentUnderstanding.ML.Activities versão 1.23.0-prévia e a versão do modelo 23.7.0 nesse fluxo de trabalho específico.
- Os modelos agora têm um tempo de previsão por página mais rápido e usam RAM de forma mais eficiente, permitindo o processamento de documentos maiores.
Data de lançamento: 24 de março de 2023
Lançado no DocumentUnderstanding | v23.4.2
O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco. Aqui está a lista completa dos novos idiomas suportados: dinamarquês, sueco, norueguês, finlandês, polonês, húngaro, checo, eslovaco, estoniano, letão, lituano, esloveno, croata, sérvio, turco.
Data de lançamento: 10 de maio de 2023
Lançado nos pacotes de ML do DocumentUnderstanding + Data Extraction | v23.4.0
O UiPath Document OCR agora está disponível como um pacote pré-treinado pronto para uso e está disponível para GPU e CPU. Isso permite que os clientes que preferem evitar o uso de pontos de extremidade públicos implementem o UiPath Document OCR em seus próprios tenants, em um ambiente isolado.
Uma lista de sete novos pacotes de ML pré-treinados prontos para uso agora está disponível para uso geral. Aqui está a lista dos sete novos modelos:
- Certificado de Constituição/ Situação Regular
- Certificado de origem
- Certificado de produto infantil
- CMS1500
- Declaração de Conformidade da UE
- Envio de Notas Fiscais
- Contracheques
Data de lançamento: 23 de fevereiro de 2023
Lançado em Endpoints + DocumentUnderstanding + Pacotes de ML de extração de dados | v23.2.0
O que há de novo e melhorias
Uma nova versão dos pacotes de ML pré-treinados prontos para uso (23.1.0) e seus pontos de extremidade públicos foram lançados, agora usando a arquitetura de ponta baseada em Transformers do LayoutLM, que é mais poderosa e aumenta a precisão em geral, especialmente em campos de coluna (tabelas).
Essa melhoria tornou os pacotes de ML pré-treinados prontos para uso mais potentes, o que significa que você pode experimentar latência mais longa para treinamento e previsões.
For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.
We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.
Uma remoção futura é anunciada para o recurso de edições manuais usado na avaliação do modelo. Mais informações aqui.
Problemas conhecidos
The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.
Errata 8 de maio de 2023
Problema conhecido
Fatal Python error: Segmentation fault
é recebido ao executar um pipeline completo ou de treinamento. Recomendamos usar os pacotes de ML com a v23.4 até que esse bug seja corrigido.
Errata 20 de abril de 2023
A pontuação geral para todos os pipelines agora é precisa. Anteriormente era uma pontuação F1. Os artefatos de avaliação no AI Center ainda contêm precisão e pontuação F1, para comparabilidade reversa.
Data de lançamento: 11 de janeiro de 2023
Lançado em Endpoints e DocumentClassifier | v23.1.0
Melhoramos as pontuações da F1 e agora também são exibidas para pipelines de treinamento.
A pasta Artefatos possui uma lista atualizada de artefatos.
O modelo DocumentClassifier agora prevê 25 classes, em vez de 26, devido à remoção da classe Notas de Entrega.
Data de lançamento: 16 de dezembro de 2022
Lançado em pontos de extremidade | v22.12.2
O ponto de extremidade público UiPath Document OCR foi atualizado e agora oferece suporte a idiomas de escrita manual para alemão e francês, e suporte a idiomas impressos para dinamarquês, finlandês, norueguês e sueco.
Data de lançamento: 13 de dezembro de 2022
Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.11.0
Esta versão traz melhorias significativas para os endpoints públicos dos Pacotes de ML pré-treinados prontos para uso, o que significa que agora estamos usando a arquitetura Deep Learning baseada em LayoutLM mais recente.
Este aprimoramento proporciona maior precisão em todos os tipos de documentos, especialmente para o modelo de Faturas, e também melhora a precisão nos campos de colunas e tabelas.
Adicionamos novos campos extraídos ao modelo de Faturas, que agora inclui Data de envio, Endereço de e-mail do fornecedor, Nome do banco, Número da conta bancária, IBAN, Código SWIFT, Endereço do banco, Número de roteamento do banco e Taxa de imposto. Você pode conferir a lista de campos extraídos acessando esta página e clicando no link disponível para cada modelo.
As pontuações do modelo agora também são retornadas pelos pipelines de treinamento, não apenas pelos pipelines completos ou de avaliação.
As pontuações F1 agora estão disponíveis para cada campo de coluna. Anteriormente, as pontuações de F1 ficavam disponíveis apenas para todos os campos de coluna avaliados em conjunto.
Data de lançamento: 7 de outubro de 2022
Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.10.0
O que há de novo e melhorias
-Preview
: FaturasAustrália, FaturasÍndia, OrdensDeCompra.
O modelo DeliveryNotes foi renomeado como BillsOfLading.
Dez novos modelos pré-treinados estão agora disponíveis: Acord25, 1040, Cheques, Extratos bancários, Demonstrativos financeiros, Romaneio de carga, Acord131, Acord126, Acord140, Título de veículo.
Correções de bugs
Várias correções de bugs foram feitas nos pacotes mencionados acima.
Data de lançamento: 4 de outubro de 2022
Lançado no UiPathDocumentOCR | v22.10.0 Cloud
Uma nova funcionalidade está disponível para detecção de códigos de barras e códigos QR.
Aprimoramentos de precisão foram feitos em strings longas, como endereços de e-mail e URLs, em fontes de largura fixa e na detecção de manuscritos e assinaturas.
A detecção de rotação de página também foi aprimorada.
Data de lançamento: 10 de outubro de 2022
Lançado em pontos de extremidade + DocumentUnderstanding + Pacotes de ML de extração de dados | v22.6.1-preview
Essa versão traz várias correções de bugs para os pacotes e pontos de extremidade do DocumentUnderstanding e Extração de Dados.
Release date: 6 September 2022
Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v22.6.0-preview
Há 18 novos pacotes de ML disponíveis em Visualização com uma arquitetura de modelo mais avançada para nossos pacotes de ML do DU no AI Center. Você pode facilmente identificá-los pelo termo Preview anexado ao final do nome do pacote, por exemplo: InvoicesPreview, PurchaseOrderPreview, Acord125Preview etc.
Atualizamos a lista de pontos de extremidades públicos com todos os novos pacotes de ML em Visualização, os quais podem ser consultados em Pontos de extremidade públicos.
Vale a pena mencionar o fato de que esses modelos de visualização não consomem unidades DU/AI de seu direito de licenciamento.
Corrigido um bug no uso de habilidades privadas, agora a habilidade privada pode ser usada apenas com uma chave de API que pertence à mesma organização usando a instância do AI Center.
Data de lançamento: 22 de julho de 2022
Lançado no DocumentUnderstanding + Pacotes de ML de extração de dados | v22.5.2
Correções de bugs
eol classifier
e line_detection
em um único método.
Problema conhecido
Há um problema conhecido para o pacote Faturas que ocasionalmente leva a um erro ao tentar executar um loop de ajuste automático no AI Center.
Data de lançamento: 18 de julho de 2022
Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.5.1
Correções de bugs
- Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
- Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
- Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo
evaluation_F1_invoices.txt
nos pipelines Full/Evaluation no AI Center. - Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em
evaluation_F1_invoices.txt file
nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.
Data de lançamento: 14 de julho de 2022
Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.4.2
Correções de bugs
- Corrigido um bug que fazia com que os campos extraídos fossem mostrados na página errada no Validation Station.
- Corrigido um bug que fazia com que a última linha de texto em algumas páginas não fosse digitalizada no Document Manager.
- Corrigido um bug que impedia a exibição de alguns itens de pontuação F1 do arquivo
evaluation_F1_invoices.txt
nos pipelines Full/Evaluation no AI Center. - Corrigido um bug que fazia com que a pontuação F1 geral errada fosse calculada em
evaluation_F1_invoices.txt file
nos pipelines Full/Evaluation no AI Center sempre que um modelo tinha apenas campos de coluna.
Data de lançamento: 3 de junho de 2022
Data de lançamento no AI Center Cloud, Pacotes de ML de extração de dados | v22.4.1
Correções de bugs
line_detection mode
, fazendo com que as previsões fossem diferentes de quando chamadas a partir da habilidade de ML.
Data de lançamento: 10 de maio de 2022
Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados
| v22.4.0
Novidades
As habilidades de manuscrito agora estão disponíveis para os pacotes UiPathDocumentOCR e UiPathDocumentOCR_CPU, integrando o HandwritingRecognitionOCR. Os mesmos recursos podem ser encontrados no pacote UiPath.OCR.LocalServer do Studio.
Nova arquitetura em pacotes de ML de extração, com grandes benefícios, especialmente para modelos treinados usando o pacote de ML do DocumentUnderstanding.
Pacotes de ML de contas de serviços, W9 e passaportes agora estão disponíveis como GA. Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.
Cinco novos pacotes de ML pré-treinados prontos para uso agora estão disponíveis em Visualização para facilitar seu trabalho.
Document Search é uma nova funcionalidade disponível no Document Manager, que facilita a rotulagem de documentos com um número elevado de páginas.
Melhorias
Foram feitas melhorias nos pacotes de ML para extração de documentos no AI Center. O documento Excel de Avaliação recebeu novas planilhas, permitindo organizar e interpretar melhor os dados avaliados.
Pacotes de ML na instalação offline do Automation Suite receberam um novo pacote offline.
A precisão e o desempenho foram aprimorados para o UiPathDocumentOCR.
Correções de bugs
Várias correções em campos de data de análise, incluindo datas em campos de coluna, datas em documentos turcos, datas distantes no futuro.
Data de lançamento: 7 de março de 2022
Lançado no UiPathDocumentOCR | v22.2.3
Capacidade superior
HandwritingRecognitionOCR integrado ao UiPathDocumentOCR. Em muitos casos, há uma mistura de campos. Ao integrar a capacidade de leitura de manuscrito, podemos aplicar o reconhecimento correto a cada campo: reconhecimento de impressão para texto impresso e reconhecimento de manuscrito para texto manuscrito.
Embora o HandwritingRecognitionOCR possa detectar qualquer manuscrito, tenha em mente que ele é treinado e otimizado apenas para inglês.
Data de lançamento: 14 de março de 2022
Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados
| v22.1.6
Correções de bugs
Corrigido um bug que estava causando a falha de um pipeline de treinamento ou de um pipeline completo no AI Center devido a um problema de pacote de ML no pré-processamento de dados para uma linha vazia.
Data de lançamento: 2 de março de 2022
Lançado no DocumentUnderstanding + DocumentClassifier + Pacotes de ML de extração de dados | v22.1.4
Novidades
O pacote de ML para Contas de serviços públicos agora está disponível para público geral.
Melhorias
Melhor desempenho geral e escalabilidade.
Melhorias significativas nas pontuações ao treinar na nova versão do Pacote de ML DocumentUnderstanding em comparação às versões anteriores.
As datas nos campos da coluna agora são analisadas corretamente.
A análise de data agora reconhece os nomes dos meses turcos.
Alterações
Alterado o comportamento para pipelines de treinamento e pipelines completos ao treinar na GPU versus na CPU. Os modelos 21.10.x treinados em CPUs eram menores, então treinavam mais rápido do que as versões anteriores, embora tivessem uma precisão um pouco menor do que antes.
Esse comportamento foi revertido com esta versão, portanto, o modelo que está sendo treinado na GPU e na CPU é exatamente o mesmo, e a velocidade de treinamento foi revertida para o que era antes de 2021.10, o que significa que o treinamento na CPU é novamente 10-20X mais lento do que na GPU.
Data de lançamento: 24 de novembro de 2021
Lançado em Pacotes de ML de extração de dados | v21.10.9
Corrigido um bug que acarretava em erro de previsão durante a execução.
Data de lançamento: 22 de outubro de 2021
Lançado em pacotes e pontos de extremidade de ML de extração de dados | v21.10.9
Novidades
O Pacote de ML PurchaseOrders agora está disponível para o público geral e pronto para ser usado em seus cenários de produção.
Os Pacotes de ML InvoicesChina ,DeliveryNotes, RemittanceAdvices, W2 e W9 estão agora em Visualização pública. Recomendamos que você confira esses pacotes e comece a usá-los para o tipo de documento que precisa processar.
Melhorias
Avaliação em nível de documento implementada. Avaliação em nível de documento implementada. Isso representa o desempenho durante a execução em seu fluxo de trabalho de RPA.
A avaliação também pode ser feita em conjuntos de dados com menos campos do que o pacote de ML que está sendo avaliado. Isso facilita a avaliação de pacotes de ML pré-treinados prontos para uso.
eval.redo_ocr
precisa ser definida como verdadeira no pipeline de avaliação do AI Center.
O treinamento na CPU agora usa um modelo menor para obter uma aceleração de 5x-7x. No entanto, você deve esperar uma precisão menor em 0-5% na CPU.
Evaluation.xlsx
produzidos pelos Pipelines de Avaliação.
O pacote de ML UtilityBills foi substancialmente melhorado.
Melhoria na análise de endereços para endereços que pulam 1-2 linhas de texto.
Melhoria na extração de valores negativos, valores muito grandes (11 dígitos ou mais) ou datas distantes no futuro.
Adicionado suporte para caixas rotacionadas em recibos.
Aprimoramento de espaços concatenados.
Correções de bugs
- Corrigido um bug que não estava retornando caracteres especiais em campos do tipo String.
- Corrigido um bug para o Pacote de ML Passports, no qual a data escrita como um número ordinal (1º, 2º, 3º, 4º, etc.) não era analisada corretamente.
Problemas conhecidos
Retreinamento dos Pacotes de ML InvoicesJapan e InvoicesChina usando dados do Validation Station não é atualmente suportado. Como solução alternativa, use o Google Cloud OCR Vision.
Próximas descontinuações
Todos os endpoints públicos, exceto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier serão descontinuados para regiões fora da Europa Ocidental a partir de 1º de dezembro de 2021.
Data de lançamento: 13 de dezembro de 2021
Lançado em pontos de extremidade do UiPathDocumentOCR | v21.10.5
Melhorias
O UiPathDocumentOCR agora também está disponível na região de Cingapura.
Data de lançamento: 24 de setembro de 2021
Lançado em Extração de dados e pontos de extremidade para o UiPathDocumentOCR | v21.10.1
Melhorias
Adicionado suporte para texto rotacionado, mesmo que a rotação seja em ângulos diferentes para cada palavra.
Suporte adicionado para texto vertical. Esta melhoria está disponível no momento apenas para UiPath.IntelligentOCR.Activities, incluindo a Estação de Validação; Data Manager e Machine Learning Extractor ainda não suportam texto vertical.
Melhoria da precisão em imagens ou fotos com ruído: por exemplo, recibos, carteiras de identidade ou passaportes.
Data de lançamento: 13 de dezembro de 2021
Lançados FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier em pontos de extremidade | v21.10
Melhorias
Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier agora também estão disponíveis na região de Cingapura.
Data de lançamento: 11 de agosto de 2021
Lançado em Extração de dados e pontos de extremidade para Reconhecimento de manuscrito | v21.7
Melhorias
Capacidade de lidar com vários fragmentos em uma única solicitação (call) para o modelo.
Retreinamento de modelo e algumas outras alterações para melhor precisão do modelo.
Correções de bugs
Corrigido um bug que fazia o pod reiniciar quando não havia mais memória.Data de lançamento: 8 de junho de 2021
Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.5.3
Novidades
Para imagens de difícil leitura, como no caso de Documentos de identidade e Passaportes, dois novos pacotes pré-treinados e prontos para uso, respectivamente, foram lançados.
Melhorias
Campos de classificação retreináveis incorporados em nossos pacotes prontos para uso pré-treinados.
Data de lançamento: 15 de abril de 2021
Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.4.5
Novidades
Implantação de todos os endpoints públicos na região dos Estados Unidos.
Endpoints públicos implantados para Form Extractor, Intelligent Form Extractor e Intelligent Keyword Classifier nas regiões do Canadá e Japão.
Data de lançamento: 9 de março de 2021
Lançado em Pacotes e pontos de extremidade de ML de extração de dados para HandwritingRecognition, DocumentClassifier, + Docker independente para UiPathDocumentOCR | v21.4
Novidades
HandwritingRecognition com reconhecimento aprimorado usando correções ortográficas e a capacidade de ler texto impresso por máquina atinge a disponibilidade geral.
DocumentClassifier também atinge a disponibilidade geral.
Melhorias no UiPathDocumentOCR para:
- Botões de opção/detecção de caixa de seleção
- Precisão em formulários de bolhas
- Precisão geral
Data de lançamento: 17 de fevereiro de 2021
Lançado em pontos de extremidade e pacotes de ML de extração de dados | v21.1.8
Melhorias
Precisão melhorada.
InvoicesIndia e InvoicesAustralia já estão disponíveis para o público geral.
Endpoints públicos implantados na região da Austrália.
https://du.uipath.com/ie/invoices
funcionará tanto para tráfego enterprise quanto para community.
Data de lançamento: 18 de dezembro de 2020
Lançado em Pacotes de ML de extração de dados | v20.11.3
Melhorias
Melhorias no treinamento da CPU para ser mais rápido e exigir menos memória.
Melhorias na análise de data para documentos não norte-americanos.
Reconhecimento de caixa de seleção para UiPathDocumentOCR, incluindo caixas de seleção impressas ou manuscritas.
Data de lançamento: 10 de novembro de 2020
Lançado em pontos de extremidade e pacotes de ML de extração de dados | v20.10.4
Novos recursos e melhorias
Um novo modelo para Faturas Japonesas.
Os pipelines de avaliação agora retornam métricas para campos de classificação também.
Suporte para Microsoft Read OCR versão 3.
Melhorias na formatação/análise de data para detectar formatos de dia/mês/ano versus formatos de mês/dia/ano.
Melhorias nas detecções de ponto decimal e separadores de milhares para análise correta de números.
O treinamento na CPU é compatível com todas as versões do AI Fabric.
id-no
.
Suporte apenas para campos de Classificação de treinamento (sem campos Regular ou Coluna).
O número máximo de campos permitidos aumentou de 32 para 40.
Relatório de níveis de confiança para campos de Coluna.
Problemas conhecidos
class
, break
, from
, finally
, global
, None
etc. Observe que esta lista não é exaustiva, pois o nome do pacote é usado para class <pkg-name>
e import <pkg-name>
.
- v24.9.1
- UiPath Document Understanding OCR
- v24.7
- UiPath Document OCR
- v24.4.4
- Extração de Dados
- v24.4.3
- DocumentUnderstanding e Extração de dados
- v24.4.2
- InvoicesIndia e pontos de extremidade
- v24.4.1
- DocumentUnderstanding, FaturasJapão e pontos de extremidade
- v24.4.0
- DocumentClassifier e Extração de dados
- v24.3.2
- Pontos de extremidade do DocumentUnderstandingOCR
- v24.2.1
- Pontos de extremidade do DocumentUnderstandingOCR
- v24.2.0
- Extração de Dados
- Document Classifier
- v23.10.5
- UiPath Document Understanding OCR
- v23.10.4
- Extração de Dados
- v23.10.3
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- v23.10.2
- DocumentUnderstanding e Extração de dados
- v23.10.0
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- UiPath Document Understanding OCR
- v23.7.0
- DocumentUnderstanding e Extração de dados
- v23.6.0
- DocumentUnderstanding e pontos de extremidade
- v23.4.1
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- v23.4.5
- Document Understanding
- v23.4.2
- Document Understanding
- v23.4.0
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- DocumentClassifier e pontos de extremidade
- v23.2.0
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- v23.1.0
- DocumentClassifier e pontos de extremidade
- v22.12.2
- Pontos de Extremidade
- v22.11.0
- Document Understanding, Extração de dados e pontos de extremidade
- v22.10.2
- Pontos de Extremidade
- v22.10.0
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- UiPath Document OCR
- v22.6.1-preview
- DocumentUnderstanding, Extração de dados e pontos de extremidade
- v22.6.0-preview
- DocumentUnderstanding e Extração de dados
- v22.5.2
- DocumentUnderstanding e Extração de dados
- v22.5.1
- DocumentUnderstanding, DocumentClassifier e Extração de dados
- v22.5.0
- AI Center cloud, Extração de dados
- v22.4.3
- DocumentUnderstanding e Extração de dados
- v22.4.2
- DocumentUnderstanding, DocumentClassifier e Extração de dados
- v22.4.1
- AI Center cloud, Extração de dados
- v22.4.0
- DocumentUnderstanding, DocumentClassifier e Extração de dados
- v22.2.3
- UiPathDocumentUnderstandingOCR
- v22.1.6
- DocumentUnderstanding, DocumentClassifier e Extração de dados
- v22.1.4
- DocumentUnderstanding, DocumentClassifier e Extração de dados
- v21.10.11
- Extração de Dados
- v21.10.9
- Extração de Dados
- Extração de dados e pontos de extremidade
- v21.10.5
- Pontos de extremidade do UiPathDocumentOCR
- v21.10.1
- Extração de dados e pontos de extremidade para UiPathDocumentOCR
- v21.10
- Pontos de extremidade do FormExtractor, IntelligentFormExtractor e IntelligentKeywordClassifier
- v21.7
- Extração de dados e pontos de extremidade para Reconhecimento de manuscrito
- v21.6.3
- UiPathDocumentOCR em pontos de extremidade
- v21.5.5
- Extração de dados e pontos de extremidade
- v21.5.3
- Extração de dados e pontos de extremidade
- v21.4.7
- Extração de dados e pontos de extremidade
- v21.4.5
- Extração de dados e pontos de extremidade
- v21.4
- Extração de dados e pontos de extremidade para HandwritingRecognition e DocumentClassifier
- v21.1.8
- Extração de dados e pontos de extremidade
- v20.11.3
- Extração de Dados
- v20.10.4
- Extração de dados e pontos de extremidade