UiPath Documentation
activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades do Document Understanding

Última atualização 27 de abr de 2026

Notas de versão

v7.1.0 - preview

Data de lançamento: 1º de abril de 2026

Novidades

Novos tipos de campos: Grupo de campos e Quantidade monetário

Dois novos tipos de campos agora estão disponíveis ao definir a taxonomia em automações Intelligent OCR: Grupo de campos e Quantidade monetário.

O Grupo de campos permite que você estruture campos de extração relacionados juntos, substituindo a saída anterior baseada em tabela. Quantidade monetário é um tipo de campo dedicado para valores de moedas, substituindo o manuseio numérico genérico. As tarefas de Validação de Documento exibem automaticamente os resultados do Grupo de Campo de acordo.

Melhorias

Aviso de compatibilidade do período de design

O Studio agora exibe um aviso durante o design quando você usa o Intelligent OCR 7.0.0-preview ou posterior com um pacote UiPath Vision anterior à versão 4.0.0-preview. O aviso alerta você para a incompatibilidade de versões antes da execução em tempo de execução.

Registro em log aprimorado para atividades DU/Intelligent OCR

Um contexto adicional agora é registrado para as atividades Document Understanding e Intelligent OCR, melhorando a visibilidade da solução de problemas nos logs do Robô.

v7.0.0 - visualização

Data de lançamento: 25 de fevereiro de 2026

Mudanças de impacto

  • O suporte para projetos do Windows-Legacy foi removido. A partir dessa versão, o pacote é compatível apenas com projetos do Windows.
  • Ao atualizar, se você usar projetos IXP, certifique-se de revisar a configuração dos seus extratores de projetos do Document Understanding. Execute GetCapabilities novamente e verifique se a configuração na tela Escopo da Extração de Dados → Configurar Extratores ainda é válida.

Novidades

Para fornecer recursos de extração personalizados para um layout específico de documento não latino, agora você pode usar um tipo de projeto moderno dedicado chamado Idiomas não latinos predefinidos na atividade Document Understanding Project Extractor . Esse tipo de projeto oferece os seguintes extratores:

  • Faturas do Japão – Recomendado para documentos de fatura do Japão. O extrator pode lidar com layouts de faturas japonesas comuns e pode identificar e extrair campos-chave de faturas, como informações do fornecedor, número da fatura e moeda.
  • Faturas China - Recomendado para documentos de fatura chinês. O extrator pode lidar com layouts de faturas chinesas comuns e pode identificar e extrair campos-chave de faturas, como informações do fornecedor, número da fatura e moeda.
  • Recibos Japão - Recomendado para documentos de recibo japoneses. Você pode usar o extrator para identificar e extrair campos como nome do comerciante, data da transação, valor total, impostos e moeda de recibos no idioma japonês.

V6.27.3

Data de lançamento: 16 de março de 2026

Melhorias

Melhorado o fluxo de atualização do token para reduzir as solicitações com falha causadas por tokens de acesso expirados. A atividade agora usa um token de acesso em cache quando disponível. Otimizado o fluxo de atualização do token, reduzindo significativamente o número de chamadas de autenticação e melhorando o desempenho geral e a confiabilidade.

V6.27.2

Data de lançamento: 16 de dezembro de 2025

Melhorias

As saídas de documentos divididos agora usam nomes de arquivos claros e rastreáveis derivados do nome do documento original e do intervalo de páginas.

Correções de bugs

Corrigido um problema no qual a atividade Redact document gerava a seção paisagem na orientação retrato.

V6.27.0

Data de lançamento: 28 de outubro de 2025

Novidades

Argumento de saída de IdDoDocumentoDeReferência

O argumento de saída ReferenceDocumentId agora está disponível nas atividades Document Understanding Project Classifier e Document Understanding Project Extractor. Este é o ID do documento dentro dos serviços do Document Understanding.

Correções de bugs

Corrigido um problema no DU Project Extractor Trainer para uma autenticação entre tenants melhorada.

Problemas conhecidos

Errata - adicionada em 11 de novembro de 2025: isso foi marcado erroneamente como um problema conhecido. Com a configuração correta, não ocorre nenhum erro de tempo de design e runtime.

Ao usar atividades com um Orchestrator independente onde não existe nenhuma estrutura de tenant, podem ocorrer erros de tempo de design e de runtime.

v6.26.0

Data de lançamento: 25 de agosto de 2025

Novidades

Reordenação de páginas dentro de um documento durante a classificação

Para maior flexibilidade, agora você pode reordenar páginas dentro de um documento, ao classificá-las na Estação de Classificação. Para habilitar esse recurso, use a propriedade EnablePageReorder , disponível nas atividades Present Classification Station e Create Document Classification Action .

Retreinamento de modelos ao usar projetos modernos do Document Understanding

Agora você pode aprimorar os recursos de extração de seus modelos, treinando-os novamente nos documentos específicos que você valida por meio da Estação de Validação. Você pode usar a atividade Document Understanding Project Extractor Trainer para retreinar modelos ao trabalhar com projetos modernos do Document Understanding.

Rasurando documentos

A nova atividade Redact Document permite que você insira um documento e um resultado de extração, gerando um novo arquivo sem nenhum detalhe de origem. O documento de saída é a cópia rasurada da entrada, com todas as informações fornecidas como entrada sendo rasuradas adequadamente. Qualquer informação dentro do resultado da extração é rasurada usando um estilo de sua escolha.

Modo compacto da Estação de validação

A Estação de validação agora pode ser usada com uma nova aparência: o Modo de Exibição Compacto. Isso oferece mais espaço para campos, destaque mais fácil para os campos que exigem atenção, uma seção de verificações de negócios centralizada e uma host de outras funcionalidades centradas no validador. Para habilitar o Modo compacto, atualize o pacote IntelligentOCR.Activities para 6.25.0-preview ou superior e, em seguida, acesse a atividade Create Document Validation Action ou Present Validation Station e defina o argumento de entrada ModoDeExibição como Compacto.

Alterações de validação para campos de tabela na Estação de Validação

Atualizamos o processo de validação de tabelas na Validation Station clássica e compacta, projetadas para aprimorar a experiência do usuário e o desempenho geral. Trouxemos as seguintes atualizações:

  1. Agora você pode salvar parcialmente uma tabela desde que nenhuma célula seja inválida. Você pode salvar parcialmente o campo de tabela usando a opção Concluído .
  2. Use as opções Existem <number> células inválidas e Existem <number> células não confirmadas para navegar até células inválidas ou não confirmadas.
  3. Cada célula na tabela agora exibe uma caixa de seleção de confirmação.
  4. Confirme a tabela inteira selecionando Confirmar todas as células.
  5. Você pode enviar uma ação sem visitar e confirmar manualmente todas as tabelas. A opção Enviar exibirá o número de campos e tabelas, que serão confirmados automaticamente antes de você enviá-los.

Também implementamos várias melhorias e resolvemos problemas para melhorar sua experiência do usuário:

  • Aprimoramos o desempenho geral e a navegação da validação de tabelas.
  • Otimizamos a exibição para regras de negócios inválidas.
  • Corrigimos problemas relacionados à não renderização de células de tabela ausentes e exibição incorreta de tabelas somente leitura.

A imagem a seguir mostra a interface do usuário da Estação de Validação Compacta para o processo atualizado.

Figura 1. Processo de validação atualizado para a Estação de validação compacta

Processo de validação atualizado para a Estação de Validação Compacta

A imagem a seguir mostra a interface do usuário da Estação de Validação Clássica para o processo atualizado.

Figura 2. Processo de validação atualizado para a Estação de validação clássica

Processo de validação atualizado para a Estação de Validação Clássica

Para obter mais informações sobre o processo de validação atualizado, visite a Estação de validação clássica e a Estação de validação compacta.

Melhorias

  • As atividades Present Validation Station , Create Document Validation Action e Create Document Validation Artefatos agora têm a propriedade ShowOnlyRelevantPageRane definida por padrão como True.
  • Quando você obtém o ClassificationResult das atividades Classify Document Scope ou Present Classification Station , você pode acessar o intervalo de páginas para os subdocumentos classificados usando a propriedade Item.DocumentBounds.PageRange na variável ClassificationResult .
  • A atividade Intelligent Keyword Classifier agora pode classificar páginas com menos palavras.
  • A atividade Recuperar artefatos de validação de documentos agora tem o resultado extraído validado no designer principal para facilitar o acesso.
  • Os dados agora também são coletados para um novo treinamento e ficam disponíveis na seção Exceções para a revisão de um Projeto Moderno.

Correções de bugs

  • A saída da atividade Read PDF Text extraía erroneamente um documento escrito em espanhol como caracteres do alfabeto grego.
  • Ao treinar o Classificador inteligente de palavras-chave em certas condições, o classificador falhava ao treinar corretamente e causava uma degradação de desempenho.
  • Corrigido um problema em que o valor numérico de certos documentos seria analisado incorretamente.
  • Corrigido um problema no qual as atividades Criar ação e Criar artefatos falhavam inesperadamente.

v6.24.0

Data de lançamento: 16 de abril de 2025

Como habilitar os controles da direita para a esquerda no Validation Station

Use a propriedade HabilitarRTL para exibir os controles da Estação de validação da direita para a esquerda. Para interagir com a Estação de validação no formato de texto da direita para a esquerda, defina HabilitarRTL como True. Essa propriedade se aplica às seguintes atividades:

Validação aprimorada com o Compact Validation Station

A propriedade ModoDeExibição permite que você escolha sua interface preferida ao trabalhar com a Estação de validação:

  • Clássico: essa é a interface padrão. Essa é a interface que sempre foi usada até essa versão.
  • Compacto: esta interface aprimorada oferece uma melhor experiência do usuário com melhorias, como:
    • Aprimorado o processo de entrada manual na Estação de Validação para facilitar o uso.
    • Os tokens para valores destacados dentro do documento agora aparecem dentro de uma linha vermelha para uma melhor visibilidade.
    • Capacidade de adicionar valores para campos, mesmo quando a configuração Requer referência da taxonomia está desabilitada.

Novas configurações de exibição para tipos de documentos no Gerenciador de Taxonomia, incluindo:

  • Limite de confiança de OCR: define um limite mínimo de confiança para OCR que a Estação de Validação considera quando comparado aos limites de confiança gerados durante a validação.
  • Formato de exibição de data: define um formato de data preferido.
  • Separador decimal de número: determina um separador decimal para campos de números dentro do tipo de documento.
  • Separador de milhar: determina um separador de milhar para campos de número dentro do tipo de documento.
    Observação:

    Além do limite de confiança de OCR personalizável para o tipo de documento, você pode definir um limite de confiança de extração para cada campo em sua taxonomia. Encontre essa configuração na guia Detalhes nas configurações de Validação no Gerenciador de Taxonomia.

    Para obter mais informações sobre as atualizações trazidas para o Gerenciador de Taxonomia, acesse Carregar Taxonomia.

Você pode alternar entre as interfaces do Validation Station nas seguintes atividades:

Validar documentos no Action Center usando aplicativos UiPath®

Agora você pode aumentar a eficiência dos seus fluxos de trabalho de compreensão de processamento de documentos com os aplicativos UiPath®. Além de criar tarefas de validação de documentos diretamente no Action Center, agora você pode criar um aplicativo de Ação que mostra o documento e a estação de validação. Após configuradas, a estação de validação e o documento de destino são exibidos dentro do Action Center, aguardando a intervenção do usuário. Para obter mais informações sobre validação de documentos usando apps de ação, acesse o tutorial Validação de documentos com ações de aplicativos .

Uso de tags e versões para projetos modernos do Document Understanding

Para adaptar os fluxos de trabalho do Document Understanding às suas necessidades, agora você pode usar versões específicas de seus projetos durante a classificação e extração. A propriedade Tag fornece controle granular para testar seus fluxos de trabalho do Document Understanding antes de implantá-los para produção. Para obter mais informações, acesse Classificador de projetos do Document Understanding e Extrator de projetos do Document Understanding.

Recursos de extração aprimorados usando novos extratores generativos

Para aprimorar os recursos de extração generativa para documentos curtos e longos que possuem layouts complexos, agora você pode selecionar os seguintes extratores generativos ao configurar extratores para os campos de seus documentos:

  • Layout Simples de Documentos Longos – Este é o Extrator Generativo existente.
  • Layout complexo de documentos longos (Pré-visualização) – Otimizado para documentos de formato longo que incluem imagens, escrita à mão, elementos de formulário ou outros layouts complexos, como caixas de chamada flutuantes. Exemplos de documentos adequados a este extrator: apólices de seguro ou outros documentos de formato longo semelhante com layouts complexos.
  • Layout complexo de documentos curtos (visualização) – Otimizado para documentos curtos que incluem imagens, escrita à mão, elementos de formulário ou outros layouts complexos, como caixas de texto flutuantes. Por exemplo: cartões de identidade ou formulários de entrada de saúde com layouts complexos.

Melhorias

A parte de digitalização de seus fluxos de trabalho de processamento de documentos agora pode reconhecer e retornar dados de documentos que contêm valores circulados, sublinhados ou riscados.

Correções de bugs

  • Os dados de certas tabelas não estavam aparecendo em arquivos PDF apesar da digitalização bem-sucedida com a atividade Digitize Document.
  • Ao digitalizar arquivos PDF, assinaturas estavam faltando.
  • O processo de extração ocasionalmente identificava incorretamente o estado de campos do tipo Endereço, devido a problemas de análise de endereço.
  • A atividade Digitize Document retornaria o texto de um documento PDF, mesmo quando o texto estivesse oculto usando leitores de PDF.
  • As caixas de texto de um documento não estavam sendo digitalizadas, o que fazia com que não fossem exibidas no Document Manager.
  • Certo texto não foi extraído durante o processo de extração do documento devido a problemas relacionados ao recuo e processamento de ângulos de documentos rotacionados.
  • Após migrar um projeto para a compatibilidade com o Windows, as execuções falhavam com o seguinte erro: “Trabalho interrompido com um código de saída inesperado”.

v6.22.1

Data de lançamento: 26 de novembro de 2024

Melhorias

Atualiza o texto de explicação no Editor de Modelos de Extrator de Formulários para refletir o processo de definição de âncoras de campo.

Correções de bugs

  • Os dados de certas tabelas não estavam aparecendo em arquivos PDF apesar da digitalização bem-sucedida com a atividade Digitize Document.
  • Um problema foi resolvido em que o texto exibido no documento PDF gerado era incorreto.

v.6.9.8

Data de lançamento: 22 de outubro de 2024

Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.

v6.14.3

Data de lançamento: 21 de outubro de 2024

Correções de bugs

Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.

v6.19.7

Data de lançamento: 14 de outubro de 2024

Correções de bugs

Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.

v6.22.0

Data de lançamento: 3 de outubro de 2024

Observação:

Esta versão do pacote é compatível com versões do UIAutomation.Activities que são 24.10.0 ou posterior.

Novidades

Suporte para atividades de uma configuração local

Agora você pode usar as seguintes atividades dentro do Classificar Escopo do Documento e Escopo da Extração de Dados, mesmo que o robô esteja conectado a um Orchestrator local:

Para a atividade Escopo da Extração de Dados, especificamente, tornamos possível usar funcionalidades de validação automática de uma organização ou tenant diferente.

Adicionamos as propriedades RuntimeTenantURL e RuntimeCredentialsAsset às atividades anteriores. Com essas propriedades, agora você pode usar diretamente credenciais de aplicativos externos, armazenados no Orchestrator, para acessar recursos do Document Understanding em tempo de execução. Para conseguir isso, certifique-se de que seu locatário selecionado tenha o Document Understanding habilitado e AI Units alocadas.

Além disso, no assistente Obter Capacidades das atividades Document Understanding Project Classifier e Document Understanding Project Extractor, incluímos propriedades como App Id, App Secret e TenantUrl.Essas propriedades facilitam o acesso a recursos de diferentes organizações e tenants durante a fase de design.

Suporte ao IntelligentOCR para projetos modernos

O IntelligentOCR.Activities agora é compatível com o consumo de projetos modernos do Document Understanding, por meio de um novo conjunto de atividades que têm como alvo o uso de projetos modernos. Agora você pode usar as seguintes atividades para consumir seus projetos e versões modernos do Document Understanding:

Importante:

Errata - 26 de maio de 2025: para consumir projetos modernos no Document Understanding para Automation Suite versão 2024.10 ou inferior, a única versão compatível do pacote de atividades IntelligentOCR é 6.22.0.

OCR para Idiomas Estendidos

Melhore a capacidade dos seus projetos de processar documentos usando o UiPath Extended Languages OCR, que agora está disponível de forma geral (GA).

Correções de bugs

  • Resolvido um problema no qual o erro "Comprimento do texto é zero" era encontrado quando tanto o Classificador Baseado em Teclado, quanto o Classificador Inteligente de Teclado eram habilitados para o mesmo tipo de documento.
  • O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
  • Os valores de campos adicionados manualmente na Estação de Validação dentro do Action Center não eram formatados de acordo com a taxonomia, fazendo com que os resultados exportados mostrassem dados incorretos.
  • Resolvido o problema que impedia você de marcar tabelas dentro de arquivos de imagem na Estação de Validação.

Próximas descontinuações

O OCR da UiPath para chinês, japonês e coreano será descontinuado a partir de janeiro de 2025. Recomendamos usar o UiPath Extended Languages OCR. Verifique a linha do tempo de descontinuação para obter mais informações sobre as próximas descontinuações e remoções.

v6.19.6

Data de lançamento: 13 de agosto de 2024

Atualizamos algumas dependências internas para melhorar o desempenho.

v6.19.5

Data de lançamento: 31 de julho de 2024

Correções de bugs

  • Tentar digitalizar um determinado conteúdo de arquivo levava a uma exceção "System.InvalidOperation" juntamente com uma mensagem "Fullness" durante a atividade Digitize Document.
  • Ao usar as atividades Generative Classifier e Generative Extractor, inserir um prompt que começava ou terminava com espaços em branco levava a um erro “KeyNotFoundException” com a mensagem “A chave fornecida não estava presente no dicionário”.

V6.0.2

Data de lançamento: 29 de julho de 2024

Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.

v6.5.4

Data de lançamento: 29 de julho de 2024

Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.

v6.19.3

Data de lançamento: 20 de junho de 2024

Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.

v6.14.2

Data de lançamento: 5 de junho de 2024

Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.

v6.19.2

Data de lançamento: 5 de junho de 2024

Correções de bugs

Criar ação de classificação de documento gerava um erro se uma URL pré-assinada não era configurada anteriormente.

v6.19.1

Data de lançamento: 27 de maio de 2024

Correções de bugs

  • Foi resolvido um problema em que o erro "Compramento do texto é zero" era encontrado quando tanto o Classificador baseado em Teclado quanto o Classificador de Teclado Inteligente estavam habilitados para o mesmo tipo de documento.
  • O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.

v6.19.0

Data de lançamento: 29 de abril de 2024

Estas notas de versão contêm todas as atualizações feitas entre novembro de 2023 e março de 2024.

Novidades

Notas do validador

Agora você pode habilitar as Notas de validador para cada campo no Gerenciador de Taxonomia. Quando habilitado, você pode definir observações nesses campos e elas são exibidas para o validador humano. Se as notas forem definidas como editáveis, o validador poderá editá-las e comunicar informações de volta à automação por meio de uma nova propriedade de objeto ResultadoDaExtração .

Observação:

Observe que as Notas de Validador estarão disponíveis no Action Center com a versão 2024.10 do Automation Suite e aproximadamente na mesma época para o Action Center no Automation Cloud. Verifique as notas de versão do Action Center para manter-se atualizado.

Validação generativa para escopo de extração de dados

Você pode usar a Validação generativa para a atividade Data Extraction Scope para ajustar a confiança usando a verificação cruzada da extração generativa. Verifique as propriedades AplicarValidaçãoAutomática e AutoValidationConfidenceThreshold na atividade Data Extraction Scope.

Melhorias

  • A instalação do pacote UiPath.IntelligentOCR.Activities instala automaticamente o pacote UiPath.DocumentUnderstanding.ML.Activities . Você não precisa instalá-lo separadamente.

Correções de bugs

  • Corrigido um problema em que a fonte japonesa não era reconhecida ao converter para JPG.
  • Corrigido um problema no qual a ordem dos números em hebraico é revertida na Estação de validação.
  • Corrigido um problema relacionado à extração de valores de texto bidirecionais (esquerda para direita e direita para esquerda), que causavam ordem errada para símbolos de pontuação.

Problemas conhecidos

Existe um problema conhecido ao usar o Modelo de Processo do Document Understanding versão 2022.10.2 dentro do Studio 2023.4.4 em um projeto do Windows. Abrir o Gerenciador de Taxonomia resulta em um erro informando que você deve instalar estruturas .NET ausentes. Independentemente de você escolher instalar.NET ou não, outra mensagem de erro segue: "A comunicação entre o UiPath Studio e o Gerenciador de Taxonomia foi encerrada de forma inesperada."

Solução alternativa: instale manualmente o.NET 6.0 Runtime.

v6.14.1

Data de lançamento: 24 de outubro de 2023

Novas funcionalidades e melhorias

Uma nova propriedade, % de confiança na validação dos campos extraídos, é adicionada para as seguintes atividades:

  • Present Validation Station
  • Create Document Validation Action

Uma nova propriedade, Enviar documentos, é adicionada às seguintes atividades:

  • Form Extractor
  • Intelligent Keyword Classifier

A atividade Digitize Document agora pode detectar botões de opção PDF nativos.

Os recursos de detecção de tipo de conteúdo do Digitalizar Documento foram melhorados.

O Gerenciador de Taxonomia agora permite a definição de várias expressões matemáticas nas regras de negócios.

v6.9.5

Data de lançamento: 19 de setembro de 2023

Corrigimos um bug que disparava um erro You are not authorized ao retomar um trabalho após a conclusão da validação de documentos no Action Center.

v6.9.4

Data de lançamento: 28 de agosto de 2023

Corrigimos um bug que desacelerou a Estação de Validação quando documentos continham tabelas grandes.

v6.9.3

Data de lançamento: 8 de junho de 2023

Corrigimos um bug que causava inconsistências nos valores formatados quando o valor era negativo.

v6.9.2

Data de lançamento: 7 de junho de 2023

Uma nova opção está disponível ao usar a atividade Form Extractor do envio de documentos para melhorias de algoritmos, permitindo que você habilite ou desabilite a opção antes de executar o fluxo de trabalho. O valor padrão é habilitado.

Fizemos pequenas correções de bugs e correções de acessibilidade em todo o pacote UiPath.IntelligentOCR.Activities.

v6.5.3

Data de lançamento: 19 de setembro de 2023

Corrigimos um bug que disparava um erro You are not authorized ao retomar um trabalho após a conclusão da validação de documentos no Action Center.

v6.5.2

Data de lançamento: 7 de junho de 2023

Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.

v6.9.1

Data de lançamento: 2 de maio de 2023

Correções de bugs

Corrigimos um bug que fazia com que a atividade Data Extraction Scope travasse quando a extração fosse concluída em todos os subdocumentos, exceto no primeiro. Isso ocorria quando um classificador era usado para realizar a separação de documentos e vários resultados de classificação eram retornados do Classify Document Scope.

V6.9.0

Data de lançamento: 26 de abril de 2023

Novas funcionalidades e melhorias

  • O UiPath Document OCR é o novo mecanismo de OCR padrão para as seguintes atividades: Intelligent Kewword Classifier, Intelligent Kewword Classifier Trainer e Form Extractor.
  • Adicionamos uma funcionalidade de nova tentativa às atividades Wait for Document Validation Action e Wait for Document Classification Action . Você pode usar a nova opção Tentar novamente e defini-la como Habilitado/Desabilitado, sendo que o valor padrão é Habilitado. Se ativado, as chamadas HTTP serão repetidas se falharem.
  • O pacote UiPath.IntelligentOCR.Activities agora pode ser usado com idiomas lidos da direita para a esquerda.
  • A precisão da extração da atividade Form Extractor foi aprimorada ao incluir as informações de correspondência de página no algoritmo de extração.
  • Atualizamos o design das regras de campo que podem ser definidas no Gerenciador de Taxonomia.
  • Agora você pode aplicar expressões matemáticas em regras de campo usando o assistente de Gerenciador de Taxonomia da atividade Carregar taxonomia.
  • O assistente da Estação de Validação foi atualizado, permitindo ver as regras aplicadas em campos. Além disso, quando um campo é atualizado manualmente, a regra do campo também é atualizada automaticamente.
  • A atividade Digitize Document foi melhorada e agora consome menos memória do sistema.
  • Os widgets de selo agora são digitalizados em PDFs nativos.
  • O suporte a arquivos PDF foi aprimorado para a atividade Digitize Document.

Errata de setembro de 2023: as funcionalidades avançadas de divisão estão disponíveis para a atividade Intelligent Keyword Classifier.

Correções de bugs

  • Atualizamos as dependências do pacote e corrigimos o erro Método não encontrado que era gerado quando uma atividade Invoke Code era adicionada ao fluxo de trabalho.
  • Corrigimos um bug que estava impedindo o preenchimento automático da chave de API quando seu token de autenticação para a instância do Orchestrator usada expirava. O erro ocorreu para o UiPath Document OCR e o OCR para campos de chave de API em chinês, japonês e coreano .

Cronograma de descontinuação

Recomendamos que você verifique regularmente o cronograma de obsolescência para ver se há atualizações relacionadas a funcionalidades que serão descontinuadas e removidas.

V6.5.1

Data de lançamento: 27 de março de 2023

Novas funcionalidades e melhorias

Trabalhamos constantemente para aprimorar o pacote UiPath.IntelligentOCR.Activities. Mesmo que não haja alterações significativas com essa versão de patch, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade para nosso produto.

v6.6.0

Data de lançamento: 15 de dezembro de 2022

Novas funcionalidades e melhorias

  • A chave de API de Document Understanding agora é pré-preenchida para as seguintes atividades: UiPath Document OCR, OCR para chinês, japonês e coreano, extrator de aprendizado de máquina, classificador de aprendizado de máquina e o gerenciador de modelo da atividade do extrator de formulário.
  • A interface do usuário do Studio agora está disponível em chinês tradicional.
  • Agora você pode se beneficiar do campo Chave de API pré-preenchido para as seguintes atividades incluídas no pacote UiPath.IntelligentOCR.Activities: Intelligent Keyword Classifier e Form Extractor.
  • O menu de atalhos de teclado agora inclui novas teclas de atalho, adicionadas em uma seção separada de Acessibilidade. Estão disponíveis para as atividades Estação de Validação Presente e Estação Classificação Presente.

Correções de bugs

Fixed a bug that was preventing the auto-population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.

v6.5.0

Data de lançamento: 24 de outubro de 2022

Novas funcionalidades e melhorias

  • New action objects are available for the Wait for Document Classification Action and Resume and Wait for Document Validation Action and Resume activities.
  • The Digitize Document activity has been upgraded and now comes with a default preselected OCR engine, the UiPath Document OCR engine. As a consequence to this change, the UiPath.OCR.Activities package has become a dependency of the UiPath.IntelligentOCR.Activities package.
  • A atividade Digitalizar Documento recebeu um novo parâmetro, Detect Checkboxes, que permite a detecção da caixa de seleção enquanto o documento é digitalizado.
  • The OCR confidence level can be individually updated for a selected field in Validation Station.
  • O design do filtro de confiança foi atualizado e as pontuações de confiança foram adicionadas no nível da tabela, para cada entrada, tanto para OCR quanto para extração. Agora você pode verificar o nível de confiança original de um campo que foi validado manualmente. Ambos os valores estão disponíveis clicando no nível de confiança exibido.
  • Updates have been made to the Validation Station wizard. You can now set a threshold for the confidence levels and sort them depending on the set limit.
  • The Taxonomy Manager wizard interface was updated, making it even more easy to use. Among the new features are an extra Delete option for all groups, fields, categories, or the Toggle keyboard shortcuts option.
  • A detecção de caixas de seleção agora é aplicada em páginas PDF nativas que não possuem caracteres ou controles de caixas de seleção nativas incorporadas.
  • Os recursos de processamento de PDF receberam uma grande atualização, incluindo a capacidade de processar texto baseado em vetor, recursos para ignorar objetos de texto invisíveis, melhorias na detecção de palavras, melhorias no processamento de logotipos, correções para problemas de duplicação de caracteres e outras melhorias.
  • Text extraction from PDF files has been upgraded, resulting in an optimized extraction process, where both native and scanned text is retrieved at the same time, with the OCR being applied only on the images identified in the PDF file. This improvement is available only when the ApplyOCROnPDF option is set to Auto.
  • O modelo de processo Studio do Document Understanding Process foi atualizado para uma nova versão. O pacote UiPath.IntelligentOCR.Activities é uma dependência para este modelo.

Correções de bugs

  • Corrigido um bug que estava causando erros de extração quando o Digitalizador era usado atualizando a biblioteca PDF e usando recursos híbridos de OCR.
  • Fixed a bug occurring on the Digitize Document activity that was causing checkbox extraction on some PDFs, even when the DetectCheckboxes option was set to False.
  • Fixed a bug occurring on the Classify Document Scope activity that was throwing an empty error for the documentText parameter when two classifiers were used in the scope and processing a certain document.
  • When a field from Validation Station was manually validated, the confidence level didn't update to 100%. The bug was fixed and now the percentage of the confidence level updates automatically when a field is manually validated by the user.
  • Fixed a bug that occurred in Classification Station wizard and Taxonomy Manager when the mouse cursor was moved to the Document View section. Now, everything works as expected.
  • An error occurred when Validation Station was used in text view with documents that included special characters. The bug was fixed and now you can view documents with special characters in text view as well.

8 de dezembro de 2022

Problemas conhecidos

The UiPath.IntelligentOCR.Activities package, v6.5.0, cannot be run with Studio versions older than 2021.10.

v6.0.1

Data de lançamento: 9 de maio de 2022

Novas funcionalidades e melhorias

  • We have been working hard to give a new face to some of our wizards, hence, the Validation Station, Classification Station, and Taxonomy Manager now all have a brand-new interface that is very user friendly and presents multiple new functionalities.
  • Some of the features worth mentioning from Validation Station are the confidence scores shown for each extracted field. They can be sorted by OCR or Extractor and show you exactly the confidence score for each extracted field. The confidence score should be used only for guidance purposes. You can always improve that score by manually validating the data.
  • O assistente Estação de Validação também tem um cabeçalho reestilizado no visualizador de PDF, onde você pode optar por passar a visualização de documentos da esquerda para a direita, para esconder os tokens extraídos para uma visualização limpa do documento ou para visualizar os atalhos de teclado. Não hesite mais e experimente.
  • O assistente Estação de Classificação apresenta-se com o mesmo cabeçalho reestilizado no visualizador de PDF que seu par, a Estação de Validação. Aqui, você também pode optar por exibir o documento no lado esquerdo ou direito da tela ou verificar os atalhos de teclado disponíveis. A opção Girar também está disponível no novo cabeçalho, tornando a manipulação de documentos mais fácil do que nunca.
  • The Taxonomy Manager wizard has, among other improvements, a new, particularly useful one, a Delete option available in the header of the document type that also enables a bulk delete.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
  • The UiPath Studio MSI size has been optimized and the UiPath.IntelligentOCR.Activities package is not anymore a core package of the UiPath Studio MSI, but an optional one. All functionalities remain the same. The only change is that you need to manually install the package in UiPath Studio.
  • The Digitize Document activity and the Intelligent Keyword Classifier activity have been updated and the ForceApplyOCR option has been replaced by the ApplyOcrOnPdf option. The Apply OCR on PDF has three options available in the dropdown list: True, False, and Auto. If set to True, the OCR is applied to all PDF pages of the document, if set to False, only digitally typed text is extracted. The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
  • In Classification Station wizard, the value of the Not Classified groups is now set as N/A.
  • The Intelligent Form Extractor activity deprecation is planned for October 2022. We recommend using the Form Extractor activity.
  • The Form Extractor activity can now process documents with detected signatures on them.

Correções de bugs

  • Corrigido um bug que ocorria no assistente da Estação de Validação. Certas fontes asiáticas não foram exibidas corretamente no PDF Viewer da Validation Station.
  • Fixed a bug occurring while using the Digitize Document activity with UiPath Studio v19.10 and v20.10. An error was thrown when trying to process .tiff files. Now, everything works as expected.
  • Corrigido um bug que ocorria na Estação de Validação ao usar a tecla de atalho TAB. Em vez de salvar as alterações, a tecla TAB reverteu o campo para o valor anterior. Agora, tudo funciona como esperado.
  • Fixed a bug occurring on the Form Extractor activity. The wrong error message was displayed when a template was imported.

Problemas conhecidos

Caso você use uma GPU Intel Xe e o Gerenciador de taxonomia, a Estação de validação ou a Estação de classificação não sejam exibidos corretamente, recomendamos atualizar o driver gráfico para a versão mais recente. Para obter mais informações, acesse Suporte da Intel.

v5.0.2

Data de lançamento: 19 de outubro de 2021

Melhorias

  • The Taxonomy Manager received a complete overhaul, with an improved UI and user experience. You can now add document types without group or category, configure colors and hotkeys for fields, and more. Consult the documentation for a complete description.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
  • The digitization process has been improved for the entire framework throughout Document Understanding and Data Manager.
  • Melhorias foram feitas para otimizar os resultados de OCR em documentos digitalizados. Os melhores resultados são obtidos mantendo o ângulo de inclinação entre +/- 20 graus.
  • As dimensões de processamento de imagem foram aprimoradas para obter melhores resultados. Para que uma imagem seja digitalizada/processada com sucesso, suas dimensões de largura e altura devem estar entre 50 e 10000 pixels. Qualquer imagem abaixo ou acima deste intervalo deve ser rejeitada, com uma mensagem de exceção. Uma imagem validada com as dimensões mencionadas anteriormente e com um tamanho total superior a 14MP deve ser reduzida para 14MP, mantendo a proporção (relação largura/altura).
  • The Validation Station error message system has been improved and now, if the user rejects a document, an exception of type DocumentRejectedByUserException is thrown and the process is stopped.
  • Improved the load time of Validation Station for document types with large taxonomies.
  • For derived parts in Validation Station, numbers with more than two decimals are not rounded up anymore.
  • Devido a melhorias nos algoritmos de processamento de imagens, podem ocorrer alterações na digitalização de determinados documentos.
  • Uma nova caixa de seleção foi adicionada ao assistente Gerenciador de modelos, permitindo que você escolha se os sinônimos adicionados diferenciam maiúsculas e minúsculas ou não.
  • A design update has been made to the Template Manager wizard accessible from the Intelligent Form Extractor and Form Extractor activities.
  • If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.
  • If a field is checked in both Signature and Handwritten boxes in the Template Manager wizard of the Intelligent Form Extractor activity, then a popup message appears informing you that a field can be added only in one box, not both.
  • The wizard available for the Intelligent Keyword Classifier activity received an update, meaning that clicking the OK button of the vector(s) exported message now returns the user to the wizard instead of closing the wizard.
  • The Create Document Validation Action and Present Validation Station activities, received a new parameter, ShowOnlyRelevantPageRange. This allows you to configure the activity so that it only shows the page range captured in the classification part of the extraction result.
  • Performance and memory improvements in the Digitize Document activity.
  • A referência a CefSharp foi atualizada para a versão 92.0.260.

Correções de bugs

  • Corrigido um bug que ocorria quando o OCR era executado em diferentes formatos de região do sistema operacional. Agora, o OCR é executado como esperado e todos os resultados são gerados corretamente, não importando o formato da região do SO.
  • Fixed a bug in the Export Extraction Results activity that was deleting the extracted table when a field was marked as handwritten. Now, the entire extraction result is exported as expected.
  • Fixed an issue related to Validation Station that was causing unexpected number formatting when reading the derived parts value.
  • Fixed a bug in the Wait For Validation Action activity that was returning an error when the Automatic Extraction Result parameter was set as empty. Now, the activity runs as expected, without any errors.
  • Fixed an issue that threw a runtime error when no extraction results were served to the Present Validation Station activity.
  • Fixed an issue in Digitize Document activity, that caused the activity to crash when the ForceApplyOCR parameter was set to False.
  • Fixed an issue in the Template Manager wizard that caused data not to be extracted when using the table selection with Form Extractor.
  • Corrigido um problema que fazia com que as partes derivadas não fossem extraídas para um campo de data ao processar um documento específico.
  • Fixed an issue in the Template Manager wizard that caused anchors not to be highlighted after marking a table.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when stating that the fields from the extractors configuration could not be found in the taxonomy, although the extractors were removed from the scope.
  • Fixed an issue that caused the Template Manager wizard to throw an error when trying to save a template with certain words added as page evidence.
  • Fixed an issue which prevented the display of an empty Validation Station with full manual processing for data entry when the AutomaticExtractionResults parameter was null.
  • Fixed a bug that was occurring when special characters were included in the file or bucket name for any of the following activities: Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Now, all special characters from the file/bucket names are encoded as expected.
  • Corrigido um problema que fazia com que campos de assinatura e manuscritos não fossem extraídos devido ao contraste do plano de fundo. Agora todos os campos são extraídos corretamente, independentemente da cor de fundo.
  • Corrigido um bug que estava fazendo com que o mecanismo de OCR retornasse um erro em certos sistemas sem ar.
  • Fixed a bug that was merging the extracted content when using the Digitize Document activity with the UiPath Document OCR engine. Now, each item is extracted separately.

Problemas conhecidos

  • If you want to use any OCR activity from this package in Studio v2019.10, please install the UiPath.CoreIPC package, version 2.0.1 or higher.
  • Se você instalar o pacote UiPath.IntelligentOCR.Activities v5.0.0 em uma máquina usando o Windows N/KN como um sistema operacional, o pacote Funcionalidades de mídia também será necessário. Acesse a lista Pacote de funcionalidades de mídia para edições do Windows N para obter instruções de instalação para o pacote Funcionalidades de mídia.

v4.13.2

Data de lançamento: 28 de maio de 2021

Melhorias

Improved the load time of Validation Station for document types with large taxonomies.

v4.13.1

Data de lançamento: 16 de abril de 2021

Melhorias

If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.

v4.13.0

Data de lançamento: 29 de março de 2021

Novos recursos e melhorias

  • Extended the Form Extractor and Intelligent Form Extractor capabilities by adding field-level anchor-based extraction rules. Besides page-level anchors, field-level anchors can now be defined in Template Editor - a new option of defining the bounds of a custom area from which data is to be extracted. As opposed to page-level configurations, which define data positions with respect to the entire page content, anchor-based configurations now allow for targeting data extraction based on field-level configurations, thus allowing for more flexibility.
  • Performance improvements on Validation Station.
  • Updated Validation Station and Classification Station design system for a better user experience.
  • The Validation Station, Classification Station, and Template Manager now have a three-state button, in the Document View side, that allow users to choose between different document interaction modes: Tokens (word selections), Custom area (area selection), and Choice on selection (users can choose between Tokens and Custom Area at each selection).
  • The user interfaces, Validation Station, Classification Station, and Template Manager, have been improved with a new selection mode in text view, now allowing users to perform selections from the text version of a document in the same way they interact with the original version. A new hotkey, d+s, was also added, to assist in switching between the original document view and the text view modes.
  • The Validation Station now displays a "crop" from the original document, when you assign a value to a data field, under the reported text value selected. This helps with locating and verifying a specific field value against the value area in the document.
  • Changed confidence calculation for Intelligent Keyword Classifier to be scalable with the length of the word vectors.
  • Added the IncludeOCRConfidence checkbox to the properties panel of the Export Extraction Results activity. If selected, the exported information will contain OCR Confidence for each value as well.
  • Algoritmos aprimorados de processamento de letras e palavras para evitar relatar caracteres ou palavras duplicadas em determinadas situações.
  • Classify Document Scope and Train Classifiers Scope now support classifier capabilities.
  • Classify Document Scope has been optimized to perform sequential calls to the classifiers in its scope, with only the page ranges that are not already classified by a previous extractor.

Correções de bugs

  • Fixed an issue that threw a runtime error in specific cases when a Form Extractor activity and an Intelligent Form Extractor activity were in the same Data Extraction Scope.
  • Corrigido um problema que impedia que erros do classificador fossem lançados em casos específicos, mas a classificação falhava silenciosamente.
  • Corrigido um problema que fazia com que as peças derivadas não fossem extraídas para um campo numérico ao processar um documento específico.
  • Fixed an issue in Digitize Document, that caused the activity to process document pages even after an exception was reported, thus increasing the overall execution time for cases of failure.
  • Fixed a bug that did not allow for the correct configuration of Regex expressions in Regex Based Extractor, in C# projects, and other very specific situations.
  • Fixed a performance issue that appeared in Validation Station and Template Editor, when a document type contained more than 200 fields.
  • Corrigido um bug no qual, em certas situações, os números eram mesclados em um único valor numérico relatado.
  • Fixed an issue through which, in certain situations, the Wait for Document Validation Action and Resume activity would throw an exception when communicating with storage buckets.

Problemas conhecidos

A Ação Criar classificação de documentos, Criar ação de validação de documentos e Aguardar classificação e retomada de documento, Aguardar validação e retomada de documento não funcionam com depósitos de armazenamento nos quais Acessar dados por meio do Orchestrator foi ativado.

v4.10.5

Data de lançamento: 28 de maio de 2021

Melhorias

Improved the load time of Validation Station for document types with large taxonomies.

v4.10.4

Data de lançamento: 3 de fevereiro de 2021

Melhorias

Performance improvement of Validation Station.

v4.10.3

Data de lançamento: 11 de janeiro de 2021

Melhorias

Improved file upload from Create Document Validation Action and Create Document Classification Action on AWS hosted storage bucket.

v4.10.2

Data de lançamento: 12 de novembro de 2020

Novos recursos e melhorias

  • Referência CefSharp atualizada para a versão 84.4.10.
  • Pontos de extremidade atualizados da seguinte forma:
    • Form Extractor - from https://formextractor.uipath.com to https://du.uipath.com/svc/formextractor
    • Intelligent Form Extractor - from https://intelligentforms.uipath.com to https://du.uipath.com/svc/intelligentforms
    • Intelligent Keyword Classifier - from https://intelligentkeywords.uipath.com to https://du.uipath.com/svc/intelligentkeywords
  • Made improvements to Validation Station while in mark table mode.

Correções de bugs

Fixed an issue for Classification Document Classification Action related to the expiration of the Bearer Token.

v4.10.1

Data de lançamento: 20 de outubro de 2020

Melhorias

More detailed error logging for Form Extractor, Intelligent Form Extractor and Intelligent Keyword Classifier.

Correções de bugs

  • Análise de endereço aprimorada.
  • Fixed an issue where not all ML Skills were usable by the Form Extractor, Intelligent Form Extractor, and Intelligent Keyword Classifier activities.

v4.10.0

Data de lançamento: 5 de outubro de 2020

Novos recursos e melhorias

Novas atividades

As seguintes atividades foram incluídas no pacote:

Validation Station

To easily identify the information in the Validation Station, color codes were added to field cards and tokens or custom areas. Each field card has by default a color code, while tokens or custom areas get the same color code as the field card they are assigned to.

New shortcuts have been added to Validation Station allowing the user to move a selected line from a table up, down, left, or right. Also, when selections are made in Validation Station, these can be assigned to a specific field using field-level shortcuts. Each field card has a key associated with it. When no selections are made, you can use field-level shortcuts to jump from one field card to another.

For Validation Station table fields, a row-level checkmark was added. You can now check all the fields from a row by selecting the checkmark or it will be automatically checked when you visit all the fields.

Tokens in Validation Station have been updated. Thus, the highlighted tokens have a red bottom border and the selected tokens have a dashed border.

Field values with no reference are now supported in Validation Station. Users can assign values to fields that do not have a reference in the document. To do so, while the user creates a field in Taxonomy Manager, the Requires Reference checkbox needs to be unchecked.

Classification Station

New shortcuts were created for Classification Station allowing the user to navigate through document types; add, change, remove or highlight reference; move all pages up or down; split after selected page; discard changes; save; report as exception.

Além de usar o menu de tipo de documento, uma referência agora também pode ser removida no nível da página passando o mouse sobre uma página e clicando no ícone azul no canto inferior direito. O ícone também permite ao usuário destacar a referência.

Visualizador de PDF na Estação de Classificação e na Estação de Validação

The Rotate button was added to the PDF Viewer. By clicking the button, the current document page will rotate clockwise.

O modo de seleção é ativado por padrão no PDF Viewer.

Outras Atividades

The Intelligent Form Extractor and Form Extractor activities can now incorporate imported templates that have the same name but different content as the already available ones. Each template is analyzed, and a warning message is displayed for each case.

The ActionPriority property from the Create Document Validation Action activity now supports expressions and variables.

The terms BucketFolderPath and DirectoryFolderPath were changed to BucketDirectoryPath and DownloadDirectoryPath for the Create Document Validation Action activity, respectively for the Wait for Document Validation Action and Resume activity. The reason behind this is to clearly separate from the Orchestrator concept of “Folder”.

v4.5.2

Data de lançamento: 24 de agosto de 2020

Correções de bugs

  • Correção de um problema que, em alguns casos, retornava uma mensagem de erro 407ProxyAuthenticationRequired para solicitações de autenticação Kerberos ou NTLM. Isso se aplica ao Extrator de formulário, Extrator de formulário inteligente e Classificador de palavra-chave inteligente.
  • Fixed an issue that was causing the Intelligent Form Extractor to not properly display a timeout error.
  • Missing translations were added for certain Validation Station strings.
  • Fixed an issue that was causing the Data Extraction Scope to throw an error when unselecting a table field.

v4.5.1

Data de lançamento: 24 de junho de 2020

Correções de bugs

  • Fixed an issue that was causing synchronization problems between the configuration window and the Properties panel for the Wait for Document Validation Action and Resume activity.
  • Corrigido um problema em que, em algumas situações, os campos da tabela eram salvos erroneamente como valores múltiplos na taxonomia.

v1.3.2

Data de lançamento: 2 de junho de 2020

Melhorias

The UiPath.IntelligentOCR.Activities package was updated to reference the latest Uipath Vision library.

v4.5.0

Data de lançamento: 4 de maio de 2020

Novos recursos e melhorias

  • This release brings many new exciting activities such as Create Document Validation Action, and Wait for Document Validation Action and Resume that can be used to create, suspend, and resume orchestration workflows in the UiPath Action Center.
  • Two new extractors are here to be of your help. You can find them under the name of Form Extractor and Intelligent Form Extractor. Both activities can extract information from fixed form documents based on predefined templates, the difference being that the Intelligent Form Extractor can also be configured to interpret fields that are signed or handwritten. You can extract information from any type of field, including tables and create custom table extraction rules by using the Template Manager wizard.
  • While using the Intelligent Form Extractor activity, if the number of handwritten fields might have been exceeded, then a warning is displayed directly in the workflow. This does not stop the user from running the workflow.
  • The Regex Based Extractor activity received a new option named UseVisualAlignment that can be used for complex layouts where it is easier for users to write regular expressions based on how words are visually organized on lines, ignoring any sentence, paragraph, or layout group otherwise identified in the document.
  • Você pode definir uma expressão regular para identificar a área da tabela, uma expressão regular para identificar uma linha da tabela nessa área e expressões regulares para identificar colunas específicas nas linhas da tabela.
  • A Estação de Validação Presente e seu assistente vêm com muitos recursos novos e aprimorados.
  • The Validation Station wizard now has a new button named Discard changes. You can use it for confirming or dismissing any changes done in Validation Station. The function can be used on each document type individually.
  • The wizard also has a new option named Show Suggestions that allows you to select one value from multiple candidates if the used extractors report multiple possible values.
  • A lista de atalhos disponíveis na Estação de Validação foi enriquecida com um novo, f+a, permitindo adicionar um novo valor em um campo de vários valores.
  • Improvements have been made on the Digitize Document activity that can now better identify the check boxes in a document.
  • A atividade Digitalizar documento também tem uma nova opção chamada ForçarAplicaçãoDeOCR. Quando selecionado, ele aplica o mecanismo de OCR a todas as páginas do documento, incluindo PDF nativo.
  • The Data Extraction Scope activity can now automatically read Extractor capabilities (internal taxonomies) if the Extractor declares them. This simplifies the configuration step by exposing the extractor's known fields. The Machine Learning Extractor now supports this new functionality, making it very easy to use and configure.
  • The Export Extraction Results activity received a new option named IncludeConfidence. If selected, the confidence level is provided.
  • Os assistentes de extração e configuração agora oferecem suporte à seleção de campo em massa para tipos de documento e campos de tabela.

v4.0.1

Data de lançamento: 14 de janeiro de 2020

Correções de bugs

  • Fixed an issue that was causing the Validation Station wizard to display incorrectly the table preferences, when using the Extract new table option.
  • Fixed an issue that was returning an error when Validation Station wizard was run with Callout activity chained before or after it. Now, the activity runs as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with a customized machine culture and the FormatValuesIfPossible option selected. Now, the activity runs as expected.
  • Fixed an issue that was causing some performance issues when large amounts of text were selected in the Text View option of the Validation Station wizard. Now, the Text View option displays the text as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with an extractor without an internal taxonomy set and a new field was added in the project’s taxonomy. Now, the activity runs as expected.
  • Em algumas máquinas, os documentos girados não eram exibidos corretamente ao usar a Estação de validação.

v4.0.0

Data de lançamento: 6 de dezembro de 2019

Alterações interruptivas

Problemas conhecidos

  • The UiPath.Abbyy.Activities package cannot be used with versions lower than v19.11 for the UiPath.UIAutomation.Activities package and lower than v4.0.0 for the UiPath.IntelligentOCR.Activities package.
  • If after updating a workflow to the new UiPath.IntelligentOCR.Activities v4.0.0 and UiPath.Abbyy.Activities v1.0.0 you encounter runtime validation errors, please force a new save on the .xaml file by making a small change and then reverting it. This might occur for workflows using FlexiCapture activities.
  • Workflows created or upgraded to UiPath.IntelligentOCR.Activities v4.0.0 cannot be downgraded to a lower UiPath.IntelligentOCR.Activities version.

Correções de bugs

An exception was thrown when the Digitize Document activity was used together with the OmniPage OCR for documents with special characters included in the Extended engine pack. The issue was fixed and now the activity is executed as expected.

v2.0.2

Data de lançamento: 25 de novembro de 2019

Melhorias

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v1.3.1

Data de lançamento: 25 de novembro de 2019

Melhorias

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v3.1.0

Data de lançamento: 8 de novembro de 2019

Novos recursos e melhorias

  • Uma nova atividade destinada a ajudá-lo a organizar e gerenciar melhor seus classificadores treinados está disponível: Keyword Based Classifier Trainer. Esta atividade só pode ser usada junto com a atividade Train Classifiers Scope .
  • O assistente Estação de Validação recebeu uma atualização importante e agora está disponível para você explorar seu potencial máximo. Esse assistente fica disponível apenas quando a atividade Present Validation Station é usada em um fluxo de trabalho. Você pode usar a versão atualizada para se beneficiar de uma nova interface amigável, navegando pelo documento enquanto usa os atalhos de teclado ou selecionando uma, várias palavras ou uma área personalizada. Você pode facilmente marcar um campo como ausente, extrair novos dados, editar uma tabela ou extrair uma nova tabela. Todas essas coisas incríveis podem ser feitas com o assistente da Estação de Validação enquanto estiver usando um tema escuro.
  • Uma das melhorias incluídas nesta versão é que a atividade Keyword Based Classifier recebeu um novo parâmetro chamado LearningData. Além de especificar onde os dados do arquivo de aprendizagem estão localizados, agora você também pode usar a string que contém os dados do classificador serializado. Esta atividade foi aprimorada com um assistente chamado Gerenciar o Aprendizado do Classificador Baseado em Palavra-chave , que pode ser usado para configurar e gerenciar as palavras-chave usadas para identificar tipos de documentos específicos.
  • Both the Keyword Based Classifier and Keyword Based Classifier Trainer activities are now able to manage multiple keywords. After the keyword sets are selected, the extraction is based on a full match of the selected words.
  • Outra grande melhoria é que a saída DocumentObjectModel , incluída na atividade Digitize Document , agora pode suportar polígonos de palavras, além de caixas horizontais de palavras.
  • The Taxonomy Manager wizard received a new scrolling bar that incorporates all UI elements and it provides a better user experience.
  • Data Extraction Scope, Train Extractors Scope, Train Classifier Scope, and Classify Document Scope activities are now arranging their extractors and classifiers in horizontal order, replacing the previous vertical order.
  • The Regex Based Extractor activity has been improved and can now process and return multi-values. The output is visible only when the activity is used together with the Validation Station.
  • Quatro novos idiomas, turco (TR), português (PT), espanhol (ES) e espanhol-México (ES-MX) estão disponíveis para o pacote UiPath.IntelligentOCR.Activities.

Problemas conhecidos

O Taxonomy Manager pode ser acessado somente se você abriu anteriormente um arquivo .xaml . Se nenhum arquivo for aberto quando você acessar o Gerenciador de Taxonomia, uma janela de gravação será exibida e o Gerenciador de Taxonomia será exibido apenas após fechar a janela de gravação.

Correções de bugs

  • Uma exceção foi lançada ao usar a atividade Data Extraction Scope junto com uma atividade Try Catch . O problema foi corrigido e agora a atividade é executada conforme o esperado.
  • When a Boolean field was set to No in Validation Station, the output file should have shown the result as No but instead is showing it as missing. The issue was fixed and now the output file shows the correct result.
  • Corrigimos a análise incorreta de números que ocorria quando o Escopo de Extração de Dados tentava analisar números em documentos usando um formato de número diferente da cultura do documento.
  • When using multiple Validation Stations, the order of the derived parts was not respected in the validated results. The issue was fixed and now the results are displaying the derived parts in the same order they were introduced.
  • Differences between the boxes with custom selection occurred when the results of a Validation Station were run through a second Validation Station. The issue was fixed and now there are no differences between boxes with custom selection.
  • Quando a atividade Digitize Document era usada junto com o mecanismo Microsoft Azure Computer Vision OCR , a rotação não funcionava quando o parâmetro HandwritingRecognition era definido como True. O problema foi corrigido e agora as informações são processadas corretamente.
  • Ao usar a atividade Digitize Document , ocorreu um erro ao tentar processar imagens com muito texto. O bug foi corrigido melhorando o processo de dimensionamento.
  • Foi corrigido um problema que estava sendo gerado ao tentar treinar a atividade Keyword Based Classifier no escopo de treinamento e a extração era executada sem uma referência de classificação. O problema foi corrigido e agora o fato de não haver informações de aprendizado é apenas registrado, não gerado como um erro.
  • Um erro era gerado ao usar a atividade FlexiCapture Extractor e o mesmo nome era dado a uma coluna de tabela e a um campo. O problema foi corrigido e o arquivo .fcdot agora é processado conforme o esperado.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades