- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades de Document Understanding
Data de lançamento: 25 de agosto de 2025
Novidades
Reordenação de páginas dentro de um documento durante a classificação
For greater flexibility, you can now reorder pages within a document, when classifying them in the Classification Station. To enable this capability, use the EnablePageReorder property, available in the Present Classification Station and Create Document Classification Action activities.
Retreinamento de modelos ao usar projetos modernos do Document Understanding
You can now enhance the extraction capabilities of your models, by retraining them on the specific documents that you validate through the Validation Station. You can use the Document Understanding Project Extractor Trainer activity to retrain models when working with modern Document Understanding projects.
Rasurando documentos
The new Redact Document activity allows you to input a document and an extraction result, generating a new file without any sourced details. The output document is the redacted copy of the input, with all information provided as input being redacted accordingly. Any information within the extraction result is redacted using a style of your choice.
Modo compacto da Estação de validação
A Estação de validação agora pode ser usada com uma nova aparência: o Modo de Exibição Compacto. Isso oferece mais espaço para campos, destaque mais fácil para os campos que exigem atenção, uma seção de verificações de negócios centralizada e uma host de outras funcionalidades centradas no validador. Para habilitar o Modo compacto, atualize o pacote IntelligentOCR.Activities para 6.25.0-preview ou superior e, em seguida, acesse a atividade Create Document Validation Action ou Present Validation Station e defina o argumento de entrada ModoDeExibição como Compacto.
Alterações de validação para campos de tabela na Estação de Validação
Atualizamos o processo de validação de tabelas na Validation Station clássica e compacta, projetadas para aprimorar a experiência do usuário e o desempenho geral. Trouxemos as seguintes atualizações:
- Você pode agora salvar parcialmente uma tabela desde que nenhuma célula seja inválida. Você pode salvar parcialmente o campo da tabela usando a opção Concluído .
- Use as opções Há <number> células inválidas e Há <number> células não confirmadas para navegar até células inválidas ou não confirmadas.
- Cada célula na tabela agora exibe uma caixa de seleção de confirmação.
- Confirme a tabela inteira selecionando Confirmar todas as células.
- É possível enviar uma ação sem acessar e confirmar manualmente todas as tabelas. A opção Enviar exibirá o número de campos e tabelas, que serão confirmados automaticamente antes de você enviá-los.
Também implementamos várias melhorias e resolvemos problemas para melhorar sua experiência do usuário:
- Aprimoramos o desempenho geral e a navegação da validação de tabelas.
- Otimizamos a exibição para regras de negócios inválidas.
- Corrigimos problemas relacionados à não renderização de células de tabela ausentes e exibição incorreta de tabelas somente leitura.
A imagem a seguir mostra a interface do usuário da Estação de Validação Clássica para o processo atualizado.
For more information on the updated validation process, visit Classic Validation Station and Compact Validation Station.
Melhorias
- As atividades Present Validation Station , Create Document Validation Action e Create Document Validation Artefatos agora têm a propriedade ShowOnlyRelevantPageRane definida por padrão como
True
. - Quando você obtém o
ClassificationResult
das atividades Classify Document Scope ou Present Classification Station , você pode acessar o intervalo de páginas para os subdocumentos classificados usando a propriedadeItem.DocumentBounds.PageRange
na variávelClassificationResult
. - A atividade Intelligent Keyword Classifier agora pode classificar páginas com menos palavras.
- A atividade Recuperar artefatos de validação de documentos agora tem o resultado extraído validado no designer principal para facilitar o acesso.
- Os dados agora também são coletados para um novo treinamento e ficam disponíveis na seção Exceções para a revisão de um Projeto Moderno.
Correções de bugs
- A saída da atividade Read PDF Text extraía erroneamente um documento escrito em espanhol como caracteres do alfabeto grego.
- Ao treinar o Classificador inteligente de palavras-chave em certas condições, o classificador falhava ao treinar corretamente e causava uma degradação de desempenho.
- Corrigido um problema em que o valor numérico de certos documentos seria analisado incorretamente.
- Corrigido um problema no qual as atividades Criar ação e Criar artefatos falhavam inesperadamente.
Data de lançamento: 16 de abril de 2025
Como habilitar os controles da direita para a esquerda no Validation Station
True
. Essa propriedade se aplica às seguintes atividades:
Validação aprimorada com o Compact Validation Station
- Classic: This is the standard interface. This is the interface which was always used until this release.
- Compact: This enhanced interface offers a better user experience with improvements, such as:
- Aprimorado o processo de entrada manual na Estação de Validação para facilitar o uso.
- Os tokens para valores destacados dentro do documento agora aparecem dentro de uma linha vermelha para uma melhor visibilidade.
- Capacidade de adicionar valores aos campos, mesmo quando a configuração Requer referência de taxonomia estiver desabilitada.
Novas configurações de exibição para tipos de documentos no Gerenciador de Taxonomia, incluindo:
- Limite de confiança do OCR: define um limite mínimo de confiança para OCR que a Estação de Validação considera quando comparado aos limites de confiança gerados durante a validação.
- Formato de exibição da data: define um formato de data preferido.
- Separador decimal de número: determina um separador decimal para campos de número dentro do tipo de documento.
- Separador de número de milhares: determina um separador de milhares para campos de número dentro do tipo de documento.
Observação: além do limite de confiança de OCR personalizável para o tipo de documento, você pode definir um Limite de confiança de extração para cada campo em sua taxonomia. Encontre essa configuração na guia Detalhes em Configurações de validação no Gerenciador de Taxonomia.
For more information on the updates brought to the Taxonomy Manager, visit Load Taxonomy.
Valide documentos no Action Center usando aplicativos UiPath®
You can now boost the efficiency of your document processing understanding workflows with UiPath® apps. Apart from creating document validation tasks directly in Action Center, you can now build an Action app that shows the document and the validation station. Once set up, the validation station and the target document are displayed inside Action Center, awaiting user intervention. For more information on validating documents using Action apps, visit the Validating documents with App actions tutorial.
Uso de tags e versões para projetos modernos do Document Understanding
To tailor document understanding workflows to your needs, you can now use specific versions of your projects during classification and extraction. The Tag property provides granular control for testing your Document Understanding workflows before rolling them out into production. For more information, visit Document Understanding Project Classifier and Document Understanding Project Extractor.
Recursos de extração aprimorados usando novos extratores generativos
Para aprimorar os recursos de extração generativa para documentos curtos e longos que possuem layouts complexos, agora você pode selecionar os seguintes extratores generativos ao configurar extratores para os campos de seus documentos:
- Layout simples de documentos longos - Este é o Extrator generativo existente.
- Layout complexo de documentos longos (Visualização) – Otimizado para documentos longos que incluem imagens, texto manuscrito, elementos de formulário ou outros layouts complexos, como caixas de texto explicativo flutuantes. Exemplos de documentos adequados para esse extrator: apólices de seguro ou outros documentos longos semelhantes com layouts complexos.
- Layout complexo de documentos curtos (Visualização) – Otimizado para documentos curtos que incluem imagens, texto manuscrito, elementos de formulário ou outros layouts complexos, como caixas de texto explicativo flutuantes. Por exemplo: carteiras de identidade ou formulários de atendimento de saúde com layouts complexos.
Melhorias
A parte de digitalização de seus fluxos de trabalho de processamento de documentos agora pode reconhecer e retornar dados de documentos que contêm valores circulados, sublinhados ou riscados.Correções de bugs
- Os dados de certas tabelas não estavam aparecendo em arquivos PDF apesar da digitalização bem-sucedida com a atividade Digitize Document.
- Ao digitalizar arquivos PDF, assinaturas estavam faltando.
- O processo de extração ocasionalmente identificava incorretamente o estado de campos do tipo Endereço, devido a problemas de análise de endereço.
- A atividade Digitize Document retornaria o texto de um documento PDF, mesmo quando o texto estivesse oculto usando leitores de PDF.
- As caixas de texto de um documento não estavam sendo digitalizadas, o que fazia com que não fossem exibidas no Document Manager.
- Certo texto não foi extraído durante o processo de extração do documento devido a problemas relacionados ao recuo e processamento de ângulos de documentos rotacionados.
- Após migrar um projeto para a compatibilidade com o Windows, as execuções falhavam com o seguinte erro: “Trabalho interrompido com um código de saída inesperado”.
Data de lançamento: 26 de novembro de 2024
Melhorias
Atualiza o texto de explicação no Editor de Modelos de Extrator de Formulários para refletir o processo de definição de âncoras de campo.
Correções de bugs
- Os dados de certas tabelas não estavam aparecendo em arquivos PDF apesar da digitalização bem-sucedida com a atividade Digitize Document.
- Um problema foi resolvido em que o texto exibido no documento PDF gerado era incorreto.
Data de lançamento: 22 de outubro de 2024
Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.
Data de lançamento: 21 de outubro de 2024
Correções de bugs
Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.
Data de lançamento: 14 de outubro de 2024
Correções de bugs
Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.
Data de lançamento: 3 de outubro de 2024
Novidades
Suporte para atividades de uma configuração local
You can now use the following activities within the Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator:
- Classificador Generativo
- Extrator Generativo
- Document Understanding Project Classifier
- Document Understanding Project Extractor
Para a atividade Escopo da Extração de Dados, especificamente, tornamos possível usar funcionalidades de validação automática de uma organização ou tenant diferente.
Adicionamos as propriedades RuntimeTenantURL e RuntimeCredentialsAsset às atividades anteriores. Com essas propriedades, agora você pode usar diretamente credenciais de aplicativos externos, armazenados no Orchestrator, para acessar recursos do Document Understanding em tempo de execução. Para conseguir isso, certifique-se de que seu locatário selecionado tenha o Document Understanding habilitado e AI Units alocadas.
Além disso, no assistente Obter Capacidades das atividades Document Understanding Project Classifier e Document Understanding Project Extractor, incluímos propriedades como App Id, App Secret e TenantUrl.Essas propriedades facilitam o acesso a recursos de diferentes organizações e tenants durante a fase de design.
Suporte ao IntelligentOCR para projetos modernos
O IntelligentOCR.Activities agora é compatível com o consumo de projetos modernos do Document Understanding, por meio de um novo conjunto de atividades que têm como alvo o uso de projetos modernos. Agora você pode usar as seguintes atividades para consumir seus projetos e versões modernos do Document Understanding:
- Document Understanding Project Classifier, used within a Classify Document Scope activity.
- Document Understanding Project Extractor within a Data Extraction Scope activity.
OCR para Idiomas Estendidos
Enhance the capability of your projects to process documents by using the UiPath Extended Languages OCR which is now generally available (GA).
Correções de bugs
- Resolvido um problema no qual o erro "Comprimento do texto é zero" era encontrado quando tanto o Classificador Baseado em Teclado, quanto o Classificador Inteligente de Teclado eram habilitados para o mesmo tipo de documento.
- O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
- Os valores de campos adicionados manualmente na Estação de Validação dentro do Action Center não eram formatados de acordo com a taxonomia, fazendo com que os resultados exportados mostrassem dados incorretos.
- Resolvido o problema que impedia você de marcar tabelas dentro de arquivos de imagem na Estação de Validação.
Próximas descontinuações
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead. Check the deprecation timeline for more information about upcoming deprecations and removals.
Data de lançamento: 13 de agosto de 2024
Atualizamos algumas dependências internas para melhorar o desempenho.
Data de lançamento: 31 de julho de 2024
Correções de bugs
- Tentar digitalizar um determinado conteúdo de arquivo levava a uma exceção "System.InvalidOperation" juntamente com uma mensagem "Fullness" durante a atividade Digitize Document.
- Ao usar as atividades Generative Classifier e Generative Extractor, inserir um prompt que começava ou terminava com espaços em branco levava a um erro “KeyNotFoundException” com a mensagem “A chave fornecida não estava presente no dicionário”.
Data de lançamento: 29 de julho de 2024
Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.
Data de lançamento: 29 de julho de 2024
Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.
Data de lançamento: 20 de junho de 2024
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
Data de lançamento: 5 de junho de 2024
Melhoramos a estabilidade do produto atualizando nossas dependências comuns para as versões mais recentes. Essa atualização é automática e não requer nenhuma ação de sua parte.
Data de lançamento: 5 de junho de 2024
Correções de bugs
Criar ação de classificação de documento gerava um erro se uma URL pré-assinada não era configurada anteriormente.
Data de lançamento: 27 de maio de 2024
Correções de bugs
- Foi resolvido um problema em que o erro "Compramento do texto é zero" era encontrado quando tanto o Classificador baseado em Teclado quanto o Classificador de Teclado Inteligente estavam habilitados para o mesmo tipo de documento.
- O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
Data de lançamento: 29 de abril de 2024
Estas notas de versão contêm todas as atualizações feitas entre novembro de 2023 e março de 2024.
Novidades
Notas do validador
Agora você pode habilitar as Notas do validador para cada campo no Gerenciador de Taxonomia. Quando habilitado, você pode definir observações sobre esses campos, e eles são exibidos para a validação humana. Se as notas forem definidas como editáveis, o validador pode editá-las e comunicar as informações de volta para a automação, por meio de uma nova propriedade de objeto ExtractionResult .
Validação generativa para escopo de extração de dados
You can use Generative Validation for the Data Extraction Scope activity to adjust confidence using generative extraction cross-checking. Check out the ApplyAutoValidation and AutoValidationConfidenceThreshold properties in the Data Extraction Scope activity.
Melhorias
- A instalação do pacote UiPath.IntelligentOCR.Activities instala automaticamente o pacote UiPath.DocumentUnderstanding.ML.Activities . Você não precisa instalá-lo separadamente.
Correções de bugs
- Corrigido um problema em que a fonte japonesa não era reconhecida ao converter para JPG.
- Corrigido um problema no qual a ordem dos números em hebraico é revertida na Estação de validação.
- Corrigido um problema relacionado à extração de valores de texto bidirecionais (esquerda para direita e direita para esquerda), que causavam ordem errada para símbolos de pontuação.
Problemas conhecidos
Existe um problema conhecido ao usar o Modelo de Processo do Document Understanding versão 2022.10.2 dentro do Studio 2023.4.4 em um projeto do Windows. Abrir o Gerenciador de Taxonomia resulta em um erro informando que você deve instalar estruturas do .NET ausentes. Independentemente de você escolher instalar o .NET ou não, outra mensagem de erro segue: "A comunicação entre o UiPath Studio e o Gerenciador de Taxonomia foi encerrada de forma inesperada."
Solução alternativa: instale manualmente o .NET 6.0 Runtime.
Data de lançamento: 24 de outubro de 2023
Novas funcionalidades e melhorias
- Present Validation Station
- Create Document Validation Action
- Form Extractor
- Intelligent Keyword Classifier
The Digitize Document activity can now detect native PDF radio buttons.
The content type detection capabilities of the Digitize Document is improved.
O Gerenciador de Taxonomia agora permite a definição de várias expressões matemáticas nas regras de negócios.
Data de lançamento: 19 de setembro de 2023
You are not authorized
ao retomar um trabalho após a conclusão da validação de documentos no Action Center.
Data de lançamento: 28 de agosto de 2023
Corrigimos um bug que desacelerou a Estação de Validação quando documentos continham tabelas grandes.
Data de lançamento: 8 de junho de 2023
Corrigimos um bug que causava inconsistências nos valores formatados quando o valor era negativo.
Data de lançamento: 7 de junho de 2023
Uma nova opção está disponível ao usar a atividade Form Extractor, Enviar documentos para melhorias de algoritmo, permitindo que você habilite ou desabilite a opção antes de executar o fluxo de trabalho. O valor padrão está habilitado.
Fizemos pequenas correções de bugs e correções de acessibilidade em todo o pacote UiPath.IntelligentOCR.Activities.
Data de lançamento: 19 de setembro de 2023
You are not authorized
ao retomar um trabalho após a conclusão da validação de documentos no Action Center.
Data de lançamento: 7 de junho de 2023
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
Data de lançamento: 2 de maio de 2023
Correções de bugs
Corrigimos um bug que fazia com que a atividade Data Extraction Scope travasse quando a extração fosse concluída em todos os subdocumentos, exceto no primeiro. Isso ocorria quando um classificador era usado para realizar a separação de documentos e vários resultados de classificação eram retornados do Classify Document Scope.
Data de lançamento: 26 de abril de 2023
Novas funcionalidades e melhorias
- O UiPath Document OCR é o novo mecanismo de OCR padrão para as seguintes atividades: Intelligent Kewword Classifier, Intelligent Kewword Classifier Trainer e Form Extractor.
- Adicionamos uma funcionalidade de repetição às atividades Wait for Document Validation Actions e Wait for Document Classification Actions . Você pode usar a nova opção Tentar novamente e defini-la como Habilitada/Desabilitada, com o valor padrão sendo Habilitado. Se habilitado, as chamadas HTTP serão repetidas após falhar.
- O pacote UiPath.IntelligentOCR.Activities agora pode ser usado com idiomas lidos da direita para a esquerda.
- A precisão da extração da atividade Form Extractor foi aprimorada ao incluir as informações de correspondência de página no algoritmo de extração.
- Atualizamos o design das regras de campo que podem ser definidas no Gerenciador de Taxonomia.
- Agora você pode aplicar expressões matemáticas em regras de campo usando o assistente de Gerenciador de Taxonomia da atividade Carregar taxonomia.
- O assistente da Estação de Validação foi atualizado, permitindo ver as regras aplicadas em campos. Além disso, quando um campo é atualizado manualmente, a regra do campo também é atualizada automaticamente.
- A atividade Digitize Document foi melhorada e agora consome menos memória do sistema.
- Os widgets de selo agora são digitalizados em PDFs nativos.
- O suporte a arquivos PDF foi aprimorado para a atividade Digitize Document.
Errata de setembro de 2023: as funcionalidades avançadas de divisão estão disponíveis para a atividade Intelligent Keyword Classifier.
Correções de bugs
- Atualizamos as dependências do pacote e corrigimos o erro Método não encontrado gerado quando uma atividade Invoke Code era adicionada ao fluxo de trabalho.
- Corrigimos um bug que estava impedindo o preenchimento automático da chave de API quando seu token de autenticação para a instância do Orchestrator usada expirava. O erro ocorria para o UiPath Document OCR e OCR para os campos de chave da API em chinês, japonês e coreano .
Cronograma de descontinuação
Recomendamos que você verifique regularmente o cronograma de obsolescência para ver se há atualizações relacionadas a funcionalidades que serão descontinuadas e removidas.
Data de lançamento: 27 de março de 2023
Novas funcionalidades e melhorias
Trabalhamos constantemente para aprimorar o pacote UiPath.IntelligentOCR.Activities. Mesmo que não haja alterações significativas com essa versão de patch, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade para nosso produto.
Data de lançamento: 15 de dezembro de 2022
Novas funcionalidades e melhorias
- A chave de API de Document Understanding agora é pré-preenchida para as seguintes atividades: UiPath Document OCR, OCR para chinês, japonês e coreano, extrator de aprendizado de máquina, classificador de aprendizado de máquina e o gerenciador de modelo da atividade do extrator de formulário.
- A interface do usuário do Studio agora está disponível em chinês tradicional.
- Agora você pode se beneficiar do campo Chave de API pré-preenchido para as seguintes atividades incluídas no pacote UiPath.IntelligentOCR.Activities: Intelligent Keyword Classifier e Form Extractor.
- O menu de atalhos de teclado agora inclui novas teclas de atalho, adicionadas em uma seção separada de Acessibilidade. Estão disponíveis para as atividades Estação de Validação Presente e Estação Classificação Presente.
Correções de bugs
Correção de um bug que impedia o preenchimento automático da chave de API quando seu token de autenticação para a instância do Orchestrator usada expirava. Ocorreu um erro nos campos de chave de API do UiPath Document OCR e OCR para chinês, japonês e coreano .
Data de lançamento: 24 de outubro de 2022
Novas funcionalidades e melhorias
- Novos objetos de ação estão disponíveis para as atividades Aguardar classificação do documento e Retomar e Aguardar validação do documento e Retomar .
- A atividade Digitalizar documento foi atualizada e agora vem com um mecanismo de OCR padrão pré-selecionado, o mecanismo UiPath Document OCR . Como consequência dessa alteração, o pacote UiPath.OCR.Activities tornou-se uma dependência do pacote UiPath.IntelligentOCR.Activities .
- A atividade Digitalizar Documento recebeu um novo parâmetro,
Detect Checkboxes
, que permite a detecção da caixa de seleção enquanto o documento é digitalizado. - O nível de confiança do OCR pode ser atualizado individualmente para um campo selecionado no Validation Station.
- O design do filtro de confiança foi atualizado e as pontuações de confiança foram adicionadas no nível da tabela, para cada entrada, tanto para OCR quanto para extração. Agora você pode verificar o nível de confiança original de um campo que foi validado manualmente. Ambos os valores estão disponíveis clicando no nível de confiança exibido.
- Atualizações foram feitas no assistente da Estação de Validação . Agora você pode definir um limite para os níveis de confiança e classificá-los de acordo com o limite definido.
- A interface do assistente do Taxonomy Manager foi atualizada, tornando-a ainda mais fácil de usar. Entre os novos recursos estão uma opção extra Excluir para todos os grupos, campos, categorias ou a opção Alternar atalhos de teclado .
- A detecção de caixas de seleção agora é aplicada em páginas PDF nativas que não possuem caracteres ou controles de caixas de seleção nativas incorporadas.
- Os recursos de processamento de PDF receberam uma grande atualização, incluindo a capacidade de processar texto baseado em vetor, recursos para ignorar objetos de texto invisíveis, melhorias na detecção de palavras, melhorias no processamento de logotipos, correções para problemas de duplicação de caracteres e outras melhorias.
- A extração de texto de arquivos PDF foi aprimorada, resultando em um processo de extração otimizado, onde o texto nativo e o digitalizado são recuperados ao mesmo tempo, sendo o OCR aplicado apenas nas imagens identificadas no arquivo PDF. Essa melhoria está disponível somente quando a opção ApplyOCROnPDF está definida como Auto.
- O modelo Studio de processos do Document Understanding Process foi atualizado para uma nova versão. O pacote UiPath.IntelligentOCR.Activities é uma dependência para este modelo.
Correções de bugs
- Corrigido um bug que estava causando erros de extração quando o Digitalizador era usado atualizando a biblioteca PDF e usando recursos híbridos de OCR.
- Corrigido um bug que ocorria na atividade Digitalizar documento que estava causando a extração da caixa de seleção em alguns PDFs, mesmo quando a opção
DetectCheckboxes
estava definida como Falso. - Correção de um bug que ocorria na atividade Classify Document Scope que gerava um erro vazio para o parâmetro
documentText
quando dois classificadores eram usados no escopo e processavam um determinado documento. - Quando um campo da Estação de Validação foi validado manualmente, o nível de confiança não foi atualizado para 100%. O bug foi corrigido e agora a porcentagem do nível de confiança é atualizada automaticamente quando um campo é validado manualmente pelo usuário.
- Corrigido um bug que ocorria no assistente da Estação de Classificação e no Gerenciador de Taxonomia quando o cursor do mouse era movido para a seção Exibição do Documento. Agora, tudo funciona como esperado.
- Ocorreu um erro quando o Validation Station foi usado na exibição de texto com documentos que incluíam caracteres especiais. O bug foi corrigido e agora você também pode visualizar documentos com caracteres especiais na visualização de texto.
8 de dezembro de 2022
Problemas conhecidos
O pacote UiPath.IntelligentOCR.Activities , v6.5.0, não pode ser executado com versões do Studio anteriores a 2021.10.
Data de lançamento: 9 de maio de 2022
Novas funcionalidades e melhorias
- Temos trabalhado arduamente para dar uma cara nova a alguns de nossos assistentes, por isso, a Estação de Validação, a Estação de Classificaçãoe o Gerenciador de Taxonomia agora têm uma interface totalmente nova, muito amigável e com várias novas funcionalidades.
- Alguns dos recursos que vale a pena mencionar no Validation Station são as pontuações de confiança mostradas para cada campo extraído. Eles podem ser classificados por OCR ou Extrator e mostrar exatamente a pontuação de confiança para cada campo extraído. A pontuação de confiança deve ser usada apenas para fins de orientação. Você sempre pode melhorar essa pontuação validando manualmente os dados.
- O assistente Estação de Validação também tem um cabeçalho reestilizado no visualizador de PDF, onde você pode optar por passar a visualização de documentos da esquerda para a direita, para esconder os tokens extraídos para uma visualização limpa do documento ou para visualizar os atalhos de teclado. Não hesite mais e experimente.
- O assistente Estação de Classificação apresenta-se com o mesmo cabeçalho reestilizado no visualizador de PDF que seu par, a Estação de Validação. Aqui, você também pode optar por exibir o documento no lado esquerdo ou direito da tela ou verificar os atalhos de teclado disponíveis. A opção Girar também está disponível no novo cabeçalho, tornando a manipulação de documentos mais fácil do que nunca.
- O assistente Taxonomy Manager tem, entre outras melhorias, uma nova e particularmente útil, uma opção Excluir disponível no cabeçalho do tipo de documento que também permite uma exclusão em massa.
- O pacote UiPath.IntelligentOCR.Activities foi atualizado para .NET5 portátil, permitindo que você os execute em robôs Linux.
- O tamanho do UiPath Studio MSI foi otimizado e o pacote UiPath.IntelligentOCR.Activities não é mais um pacote principal do UiPath Studio MSI, mas opcional. Todas as funcionalidades permanecem as mesmas. A única mudança é que você precisa instalar manualmente o pacote no UiPath Studio.
- A atividade Digitalizar documento e a atividade Classificador inteligente de palavras-chave foram atualizadas e a opção ForceApplyOCR foi substituída pela opção ApplyOcrOnPdf . Aplicar OCR em PDF tem três opções disponíveis na lista suspensa: True, Falsee Auto. Se definido como True, o OCR é aplicado a todas as páginas PDF do documento, se definido como False, apenas o texto digitado digitalmente é extraído. O valor padrão é Auto, determinando se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada.
- No assistente Classification Station , o valor dos grupos Not Classified agora é definido como N/A.
- A descontinuação da atividade do Intelligent Form Extractor está planejada para outubro de 2022. Recomendamos o uso da atividade Form Extractor .
- A atividade Form Extractor agora pode processar documentos com assinaturas detectadas.
Correções de bugs
- Corrigido um bug que ocorria no assistente da Estação de Validação. Certas fontes asiáticas não foram exibidas corretamente no PDF Viewer da Validation Station.
- Corrigido um bug que ocorria ao usar a atividade Digitalizar documento com UiPath Studio v19.10 e v20.10. Ocorreu um erro ao tentar processar
.tiff
arquivos. Agora, tudo funciona como esperado. - Corrigido um bug que ocorria na Estação de Validação ao usar a tecla de atalho TAB. Em vez de salvar as alterações, a tecla TAB reverteu o campo para o valor anterior. Agora, tudo funciona como esperado.
- Corrigido um bug que ocorria na atividade do Extrator de Formulários . A mensagem de erro incorreta foi exibida quando um modelo foi importado.
Problemas conhecidos
Caso você use uma GPU Intel Xe e o Gerenciador de taxonomia, a Estação de validação ou a Estação de classificação não sejam exibidos corretamente, recomendamos atualizar o driver gráfico para a versão mais recente. Para obter mais informações, acesse Suporte da Intel.Data de lançamento: 19 de outubro de 2021
Melhorias
- O Taxonomy Manager recebeu uma revisão completa, com uma interface do usuário e experiência do usuário aprimoradas. Agora você pode adicionar tipos de documento sem grupo ou categoria, configurar cores e teclas de atalho para campos e muito mais. Consulte a documentação para obter uma descrição completa.
- O pacote UiPath.IntelligentOCR.Activities foi atualizado para .NET5. Embora ambas as versões .NET continuem a ser suportadas, os projetos .NET5 só podem funcionar em arquiteturas de 64 bits.
- O processo de digitalização foi aprimorado para toda a estrutura em Compreensão de Documentos e Gerenciador de Dados.
- Melhorias foram feitas para otimizar os resultados de OCR em documentos digitalizados. Os melhores resultados são obtidos mantendo o ângulo de inclinação entre +/- 20 graus.
- As dimensões de processamento de imagem foram aprimoradas para obter melhores resultados. Para que uma imagem seja digitalizada/processada com sucesso, suas dimensões de largura e altura devem estar entre 50 e 10000 pixels. Qualquer imagem abaixo ou acima deste intervalo deve ser rejeitada, com uma mensagem de exceção. Uma imagem validada com as dimensões mencionadas anteriormente e com um tamanho total superior a 14MP deve ser reduzida para 14MP, mantendo a proporção (relação largura/altura).
- O sistema de mensagens de erro da Estação de Validação foi aprimorado e agora, se o usuário rejeitar um documento, uma exceção do tipo
DocumentRejectedByUserException
é lançada e o processo é interrompido. - Melhorado o tempo de carregamento da Estação de Validação para tipos de documentos com grandes taxonomias.
- Para peças derivadas na Estação de Validação, os números com mais de duas casas decimais não são mais arredondados.
- Devido a melhorias nos algoritmos de processamento de imagens, podem ocorrer alterações na digitalização de determinados documentos.
- Uma nova caixa de seleção foi adicionada ao assistente Gerenciador de modelos, permitindo que você escolha se os sinônimos adicionados diferenciam maiúsculas e minúsculas ou não.
- Uma atualização de design foi feita no assistente do Gerenciador de modelos, acessível a partir das atividades Extrator de formulário inteligente e Extrator de formulário .
- Se você experimentar tempos limite devido ao longo tempo de processamento, agora você pode usar o parâmetro Timeout recém-adicionado para Extrator de Formulário e Extrator de Formulário Inteligente para aumentar o tempo limite da chamada de serviço.
- Se um campo estiver marcado nas caixas Assinatura e Manuscrito no assistente do Gerenciador de Modelos da atividade Extrator de Formulário Inteligente , uma mensagem pop-up aparecerá informando que um campo pode ser adicionado apenas em uma caixa, não em ambas.
- O assistente disponível para a atividade do Intelligent Keyword Classifier recebeu uma atualização, o que significa que clicar no botão OK da mensagem do(s) vetor(es) exportado(s) agora retorna o usuário ao assistente em vez de fechá-lo.
- As atividades Criar Ação de Validação de Documento e Apresentar Estação de Validação , receberam um novo parâmetro, ShowOnlyRelevantPageRange. Isso permite que você configure a atividade para mostrar apenas o intervalo de páginas capturado na parte de classificação do resultado da extração.
- Melhorias de desempenho e memória na atividade Digitalizar documento .
- A referência a CefSharp foi atualizada para a versão 92.0.260.
Correções de bugs
- Corrigido um bug que ocorria quando o OCR era executado em diferentes formatos de região do sistema operacional. Agora, o OCR é executado como esperado e todos os resultados são gerados corretamente, não importando o formato da região do SO.
- Corrigido um bug na atividade Export Extraction Results que estava excluindo a tabela extraída quando um campo era marcado como manuscrito. Agora, todo o resultado da extração é exportado conforme o esperado.
- Corrigido um problema relacionado à Estação de Validação que estava causando formatação de número inesperada ao ler o valor das peças derivadas.
- Corrigido um bug na atividade Wait For Validation Action que estava retornando um erro quando o parâmetro Automatic Extraction Result estava definido como vazio. Agora, a atividade é executada conforme o esperado, sem nenhum erro.
- Correção de um problema que gerava um erro de tempo de execução quando nenhum resultado de extração era exibido na atividade Estação de validação presente .
- Correção de um problema na atividade Digitalizar documento , que fazia com que a atividade travasse quando o parâmetro ForceApplyOCR era definido como False.
- Corrigido um problema no assistente do Gerenciador de Modelos que fazia com que os dados não fossem extraídos ao usar a seleção de tabelas com o Extrator de Formulários.
- Corrigido um problema que fazia com que as partes derivadas não fossem extraídas para um campo de data ao processar um documento específico.
- Corrigido um problema no assistente do Gerenciador de modelos que fazia com que as âncoras não fossem destacadas após marcar uma tabela.
- Corrigido problema que fazia com que a atividade Data Extraction Scope lançasse um erro ao informar que os campos da configuração dos extratores não foram encontrados na taxonomia, embora os extratores tenham sido removidos do escopo.
- Correção de um problema que fazia com que o assistente do Gerenciador de modelos gerasse um erro ao tentar salvar um modelo com determinadas palavras adicionadas como evidência de página.
- Corrigido um problema que impedia a exibição de uma Estação de Validação vazia com processamento manual completo para entrada de dados quando o parâmetro AutomaticExtractionResults era nulo.
- Correção de um bug que ocorria quando caracteres especiais eram incluídos no arquivo ou no nome do bloco para qualquer uma das seguintes atividades: Criar ação de classificação de documento, Aguardar ação de classificação de documento, Criar ação de validação de documento, Aguardar ação de validação de documento. Agora, todos os caracteres especiais dos nomes de arquivo/bucket são codificados conforme o esperado.
- Corrigido um problema que fazia com que campos de assinatura e manuscritos não fossem extraídos devido ao contraste do plano de fundo. Agora todos os campos são extraídos corretamente, independentemente da cor de fundo.
- Corrigido um bug que estava fazendo com que o mecanismo de OCR retornasse um erro em certos sistemas sem ar.
- Correção de um bug que mesclava o conteúdo extraído ao usar a atividade Digitalizar documento com o mecanismo UiPath Document OCR . Agora, cada item é extraído separadamente.
Problemas conhecidos
- Se você quiser usar qualquer atividade de OCR deste pacote no Studio v2019.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior.
- Se você instalar o pacote UiPath.IntelligentOCR.Activities v5.0.0 em uma máquina usando o Windows N/KN como um sistema operacional, o pacote Funcionalidades de mídia também será necessário. Acesse a lista Pacote de funcionalidades de mídia para edições do Windows N para obter instruções de instalação para o pacote Funcionalidades de mídia.
Data de lançamento: 28 de maio de 2021
Melhorias
Melhorado o tempo de carregamento da Estação de Validação para tipos de documentos com grandes taxonomias.
Data de lançamento: 16 de abril de 2021
Melhorias
Se você experimentar tempos limite devido ao longo tempo de processamento, agora você pode usar o parâmetro Timeout recém-adicionado para Extrator de Formulário e Extrator de Formulário Inteligente para aumentar o tempo limite da chamada de serviço.
Data de lançamento: 29 de março de 2021
Novos recursos e melhorias
- Ampliou os recursos do Extrator de Formulários e do Extrator de Formulários Inteligentes adicionando regras de extração baseadas em âncoras em nível de campo. Além das âncoras no nível da página, as âncoras no nível do campo agora podem ser definidas no Editor de modelo - uma nova opção de definir os limites de uma área personalizada da qual os dados devem ser extraídos. Ao contrário das configurações no nível da página, que definem as posições dos dados em relação ao conteúdo inteiro da página, as configurações baseadas em âncoras agora permitem direcionar a extração de dados com base nas configurações no nível do campo, permitindo assim mais flexibilidade.
- Melhorias de performance na Estação de Validação.
- Atualizado o sistema de design da estação de validação e da estação de classificação para uma melhor experiência do usuário.
- A Estação de Validação, a Estação de Classificaçãoe o Gerenciador de Modelos agora possuem um botão de três estados, no lado da Exibição do Documento, que permite aos usuários escolher entre diferentes modos de interação do documento: Tokens (seleções de palavras), Área personalizada (seleção de área) e Escolha na seleção (os usuários podem escolher entre Tokens e Custom Area em cada seleção).
- As interfaces do usuário, Validation Station, Classification Statione Template Manager, foram aprimoradas com um novo modo de seleção na exibição de texto, agora permitindo que os usuários realizem seleções da versão em texto de um documento da mesma forma que interagem com a versão original. Uma nova tecla de atalho, d+s, também foi adicionada, para auxiliar na alternância entre a exibição do documento original e os modos de exibição de texto.
- A Estação de Validação agora exibe um "corte" do documento original, quando você atribui um valor a um campo de dados, sob o valor de texto relatado selecionado. Isso ajuda a localizar e verificar um valor de campo específico em relação à área de valor no documento.
- Cálculo de confiança alterado para o Intelligent Keyword Classifier para ser escalável com o comprimento dos vetores de palavras.
- Adicionada a caixa de seleção IncludeOCRConfidence ao painel de propriedades da atividade Exportar resultados de extração . Se selecionado, as informações exportadas também conterão Confiança de OCR para cada valor.
- Algoritmos aprimorados de processamento de letras e palavras para evitar relatar caracteres ou palavras duplicadas em determinadas situações.
- Classifique o escopo do documento e treine o escopo dos classificadores agora oferece suporte aos recursos do classificador.
- Classify Document Scope foi otimizado para realizar chamadas sequenciais aos classificadores em seu escopo, apenas com os intervalos de páginas que ainda não foram classificados por um extrator anterior.
Correções de bugs
- Correção de um problema que gerava um erro de tempo de execução em casos específicos quando uma atividade do Extrator de formulário e uma atividade do Extrator de formulário inteligente estavam no mesmo escopo de extração de dados.
- Corrigido um problema que impedia que erros do classificador fossem lançados em casos específicos, mas a classificação falhava silenciosamente.
- Corrigido um problema que fazia com que as peças derivadas não fossem extraídas para um campo numérico ao processar um documento específico.
- Corrigido problema em Digitalizar Documento, que fazia com que a atividade processasse as páginas do documento mesmo após o relato de uma exceção, aumentando assim o tempo geral de execução para casos de falha.
- Corrigido um bug que não permitia a configuração correta de expressões Regex no Extrator baseado em Regex, em projetos C# e outras situações muito específicas.
- Corrigido um problema de desempenho que aparecia na Estação de Validação e no Editor de Modelos, quando um tipo de documento continha mais de 200 campos.
- Corrigido um bug no qual, em certas situações, os números eram mesclados em um único valor numérico relatado.
- Correção de um problema no qual, em determinadas situações, a atividade Aguardar validação do documento e Continuar lançava uma exceção ao se comunicar com depósitos de armazenamento.
Problemas conhecidos
A Ação Criar classificação de documentos, Criar ação de validação de documentos e Aguardar classificação e retomada de documento, Aguardar validação e retomada de documento não funcionam com depósitos de armazenamento nos quais Acessar dados por meio do Orchestrator foi ativado.Data de lançamento: 28 de maio de 2021
Melhorias
Melhorado o tempo de carregamento da Estação de Validação para tipos de documentos com grandes taxonomias.
Data de lançamento: 3 de fevereiro de 2021
Melhorias
Melhoria de desempenho da Estação de validação.
Data de lançamento: 11 de janeiro de 2021
Melhorias
Carregamento de arquivo aprimorado para as atividades Create Document Validation Action e Create Document Classification Action no bucket de armazenamento hospedado na AWS.
Data de lançamento: 12 de novembro de 2020
Novos recursos e melhorias
- Referência CefSharp atualizada para a versão 84.4.10.
- Pontos de extremidade atualizados da seguinte forma:
- Extrator de formulários - de
https://formextractor.uipath.com
ahttps://du.uipath.com/svc/formextractor
- Extrator de formulário inteligente - de
https://intelligentforms.uipath.com
ahttps://du.uipath.com/svc/intelligentforms
- Classificador inteligente de palavras-chave - de
https://intelligentkeywords.uipath.com
ahttps://du.uipath.com/svc/intelligentkeywords
- Extrator de formulários - de
- Melhorias feitas na Estação de Validação no modo de tabela de marcas.
Correções de bugs
Corrigido um problema para a Ação de Classificação do Documento de Classificação relacionada à expiração do Token do Portador.Data de lançamento: 20 de outubro de 2020
Melhorias
Registro de erro mais detalhado para Extrator de Formulário, Extrator de Formulário Inteligente e Classificador de Palavra-chave Inteligente.
Correções de bugs
- Análise de endereço aprimorada.
- Correção de um problema em que nem todas as habilidades de ML eram utilizáveis pelas atividades Extrator de formulário, Extrator de formulário inteligentee Classificador de palavra-chave inteligente .
Data de lançamento: 5 de outubro de 2020
Novos recursos e melhorias
Novas atividades
As seguintes atividades foram incluídas no pacote:
- Estação de classificação atual - destinada a classificar e separar arquivos com base no tipo de documento.
- Criar ação de classificação de documento e aguardar a classificação e retomada do documento - projetado para integração com o Orchestrator.
- Classificador de palavra-chave inteligente e instrutor de classificador de palavra-chave inteligente - projetado para classificar, dividir e treinar pacotes de documentos em tipos de documentos individuais.
Validation Station
Para identificar facilmente as informações na Estação de Validação, foram adicionados códigos de cores aos cartões de campo e tokens ou áreas personalizadas. Cada cartão de campo tem, por padrão, um código de cor, enquanto os tokens ou áreas personalizadas recebem o mesmo código de cor do cartão de campo ao qual estão atribuídos.
Novos atalhos foram adicionados ao Validation Station, permitindo que o usuário mova uma linha selecionada de uma tabela para cima, para baixo, para a esquerda ou para a direita. Além disso, quando as seleções são feitas no Validation Station, elas podem ser atribuídas a um campo específico usando atalhos no nível do campo. Cada carta de campo tem uma chave associada a ela. Quando nenhuma seleção é feita, você pode usar atalhos em nível de campo para pular de um cartão de campo para outro.
Para os campos da tabela Estação de validação , uma marca de seleção no nível da linha foi incluída. Agora você pode verificar todos os campos de uma linha selecionando a marca de seleção ou ela será verificada automaticamente quando você visitar todos os campos.
Os tokens na estação de validação foram atualizados. Assim, os tokens destacados têm uma borda inferior vermelha e os tokens selecionados têm uma borda tracejada.
Valores de campo sem referência agora são suportados no Validation Station. Os usuários podem atribuir valores a campos que não possuem referência no documento. Para isso, enquanto o usuário cria um campo no Taxonomy Manager, a caixa de seleção Requer referência precisa estar desmarcada.
Classification Station
Novos atalhos foram criados para a Estação de Classificação permitindo ao usuário navegar pelos tipos de documentos; adicionar, alterar, remover ou realçar referência; mover todas as páginas para cima ou para baixo; dividir após a página selecionada; descartar mudanças; salvar; relatar como exceção.
Além de usar o menu de tipo de documento, uma referência agora também pode ser removida no nível da página passando o mouse sobre uma página e clicando no ícone azul no canto inferior direito. O ícone também permite ao usuário destacar a referência.
Visualizador de PDF na Estação de Classificação e na Estação de Validação
O botão Girar foi adicionado ao visualizador de PDF. Ao clicar no botão, a página do documento atual girará no sentido horário.
O modo de seleção é ativado por padrão no PDF Viewer.
Outras Atividades
As atividades Extrator Inteligente de Formulários e Extrator de Formulários agora podem incorporar templates importados com o mesmo nome, mas conteúdo diferente dos já disponíveis. Cada modelo é analisado e uma mensagem de aviso é exibida para cada caso.
A propriedade ActionPriority da atividade Criar ação de validação de documento agora oferece suporte a expressões e variáveis.
Os termos BucketFolderPath e DirectoryFolderPath foram alterados para BucketDirectoryPath e DownloadDirectoryPath para a atividade Create Document Validation Action , respectivamente para a atividade Wait for Document Validation Action e Resume . A razão por trás disso é separar claramente do conceito do Orchestrator de “Pasta”.
Data de lançamento: 24 de agosto de 2020
Correções de bugs
- Correção de um problema que, em alguns casos, retornava uma mensagem de erro
407ProxyAuthenticationRequired
para solicitações de autenticação Kerberos ou NTLM. Isso se aplica ao Extrator de formulário, Extrator de formulário inteligente e Classificador de palavra-chave inteligente. - Correção de um problema que fazia com que o Intelligent Form Extractor não exibisse corretamente um erro de tempo limite.
- Traduções ausentes foram adicionadas para certas strings da Estação de Validação .
- Correção de um problema que fazia com que o Escopo de extração de dados lançasse um erro ao desmarcar um campo da tabela.
Data de lançamento: 24 de junho de 2020
Correções de bugs
- Corrigido um problema que estava causando problemas de sincronização entre a janela de configuração e o painel Propriedades para a atividade Aguardar validação do documento e continuar .
- Corrigido um problema em que, em algumas situações, os campos da tabela eram salvos erroneamente como valores múltiplos na taxonomia.
Data de lançamento: 2 de junho de 2020
Melhorias
O pacote UiPath.IntelligentOCR.Activities foi atualizado para fazer referência à biblioteca Uipath Vision mais recente.
Data de lançamento: 4 de maio de 2020
Novos recursos e melhorias
- Esta versão traz muitas novas atividades interessantes, como Criar ação de validação de documentoe Aguardar ação e retomada de validação de documento , que podem ser usadas para criar, suspender e retomar fluxos de trabalho de orquestração no UiPath Action Center.
- Dois novos extratores estão aqui para ajudá-lo. Você pode encontrá-los sob o nome de Form Extractor e Intelligent Form Extractor. Ambas as atividades podem extrair informações de documentos de formulário fixo com base em modelos predefinidos, com a diferença de que o Extrator de Formulários Inteligente também pode ser configurado para interpretar campos assinados ou manuscritos. Você pode extrair informações de qualquer tipo de campo, incluindo tabelas e criar regras de extração de tabelas personalizadas usando o assistente do Gerenciador de Modelos .
- Ao usar a atividade do Intelligent Form Extractor , se o número de campos manuscritos puder ter sido excedido, um aviso será exibido diretamente no fluxo de trabalho. Isso não impede que o usuário execute o fluxo de trabalho.
- A atividade Regex Based Extractor recebeu uma nova opção chamada
UseVisualAlignment
que pode ser usada para layouts complexos, onde é mais fácil para os usuários escrever expressões regulares com base em como as palavras são organizadas visualmente nas linhas, ignorando qualquer frase, parágrafo ou grupo de layout de outra forma identificados no documento. - Você pode definir uma expressão regular para identificar a área da tabela, uma expressão regular para identificar uma linha da tabela nessa área e expressões regulares para identificar colunas específicas nas linhas da tabela.
- A Estação de Validação Presente e seu assistente vêm com muitos recursos novos e aprimorados.
- O assistente da Estação de validação agora tem um novo botão chamado Descartar alterações. Você pode usá-lo para confirmar ou rejeitar quaisquer alterações feitas no Validation Station. A função pode ser usada em cada tipo de documento individualmente.
- O assistente também possui uma nova opção chamada Mostrar Sugestões que permite selecionar um valor de vários candidatos se os extratores usados relatarem vários valores possíveis.
- A lista de atalhos disponíveis na Estação de Validação foi enriquecida com um novo,
f+a
, permitindo adicionar um novo valor em um campo de vários valores. - Foram feitas melhorias na atividade Digitalizar documento que agora pode identificar melhor as caixas de seleção em um documento.
- A atividade Digitalizar documento também tem uma nova opção chamada ForçarAplicaçãoDeOCR. Quando selecionado, ele aplica o mecanismo de OCR a todas as páginas do documento, incluindo PDF nativo.
- A atividade Data Extraction Scope agora pode ler automaticamente os recursos do Extractor (taxonomias internas) se o Extractor os declarar. Isso simplifica a etapa de configuração ao expor os campos conhecidos do extrator. O Machine Learning Extractor agora oferece suporte a essa nova funcionalidade, tornando-o muito fácil de usar e configurar.
- A atividade Export Extraction Results recebeu uma nova opção chamada IncludeConfidence. Se selecionado, o nível de confiança é fornecido.
- Os assistentes de extração e configuração agora oferecem suporte à seleção de campo em massa para tipos de documento e campos de tabela.
Data de lançamento: 14 de janeiro de 2020
Correções de bugs
- Corrigido problema que fazia com que o wizard da Estação de Validação exibisse incorretamente as preferências da tabela, ao utilizar a opção Extrair nova tabela .
- Correção de um problema que retornava um erro quando o assistente Estação de validação era executado com a atividade Callout encadeada antes ou depois dele. Agora, a atividade é executada conforme o esperado.
- Correção de um problema que fazia com que a atividade do Escopo de extração de dados gerasse um erro quando era executada com uma cultura de máquina personalizada e a opção FormatValuesIfPossible selecionada. Agora, a atividade é executada conforme o esperado.
- Corrigido um problema que estava causando alguns problemas de desempenho quando grandes quantidades de texto eram selecionadas na opção Exibição de texto do assistente Estação de validação . Agora, a opção Text View exibe o texto conforme o esperado.
- Correção de problema que fazia com que a atividade Data Extraction Scope gerasse um erro quando era executada com um extrator sem taxonomia interna definida e um novo campo era adicionado à taxonomia do projeto. Agora, a atividade é executada conforme o esperado.
- Em algumas máquinas, os documentos girados não eram exibidos corretamente ao usar a Estação de validação.
Data de lançamento: 6 de dezembro de 2019
Alterações interruptivas
- Ocorreram grandes atualizações para o pacote UiPath.IntelligentOCR.Activities. Todas as atividades usadas para trabalhar com as famílias de produtos FineReader e FlexiCapture Abbyy foram movidas para um pacote separado chamado UiPath.Abbyy.Activities. Isso levou a uma alteração significativa para o pacote UiPath.IntelligentOCR.Activities, que fazia com que a versão saltasse da v3.1.0 para v4.0.0. A lista a seguir mostra as atividades que foram movidas do pacote UiPath.IntelligentOCR.Activities para o UiPath.Abbyy.Activities:
Problemas conhecidos
- O pacote UiPath.Abbyy.Activities não pode ser usado com versões anteriores à v19.11 para o pacote UiPath.UIAutomation.Activities e anteriores à v4.0.0 para o pacote UiPath.IntelligentOCR.Activities .
- Se depois de atualizar um fluxo de trabalho para o novo UiPath.IntelligentOCR.Activities v4.0.0 e UiPath.Abbyy.Activities v1.0.0 você encontrar erros de validação de tempo de execução, force um novo salvamento no arquivo
.xaml
fazendo uma pequena alteração e depois revertendo isto. Isso pode ocorrer para fluxos de trabalho usando atividades do FlexiCapture. - Fluxos de trabalho criados ou atualizados para UiPath.IntelligentOCR.Activities v4.0.0 não podem ser rebaixados para uma versão inferior de UiPath.IntelligentOCR.Activities .
Correções de bugs
Uma exceção foi lançada quando a atividade Digitalizar documento foi usada junto com o OmniPage OCR para documentos com caracteres especiais incluídos no pacote de mecanismo estendido. O problema foi corrigido e agora a atividade é executada conforme o esperado.Data de lançamento: 25 de novembro de 2019
Melhorias
Aprimoramentos de desempenho ocorreram para processar arquivos dentro da estrutura de processamento de documentos, para o pacote UiPath.IntelligentOCR.Activities .
Data de lançamento: 25 de novembro de 2019
Melhorias
Aprimoramentos de desempenho ocorreram para processar arquivos dentro da estrutura de processamento de documentos, para o pacote UiPath.IntelligentOCR.Activities .
Data de lançamento: 8 de novembro de 2019
Novos recursos e melhorias
- Uma nova atividade destinada a ajudá-lo a organizar e gerenciar melhor seus classificadores treináveis está disponível: Treinador de classificador baseado em palavra-chave. Esta atividade pode ser usada apenas em conjunto com a atividade Treinar Escopo Classificadores .
- O assistente da Estação de Validação recebeu um upgrade importante e agora está disponível para você explorar seu potencial máximo. Este assistente fica disponível somente quando a atividade Estação de Validação Presente é usada em um fluxo de trabalho. Você pode usar a versão atualizada para se beneficiar de uma nova interface amigável, navegando pelo documento usando os atalhos de teclado ou selecionando uma ou várias palavras ou uma área personalizada. Você pode facilmente marcar um campo como ausente, extrair novos dados, editar uma tabela ou extrair uma nova tabela. Todas essas coisas maravilhosas podem ser feitas com o assistente da Estação de Validação usando um tema escuro.
- Uma das melhorias incluídas nesta versão é que a atividade do Classificador baseado em palavras-chave recebeu um novo parâmetro chamado LearningData. Além de especificar onde os dados do arquivo de aprendizado estão localizados, agora você também pode usar a string que contém os dados serializados do classificador. Esta atividade foi aprimorada com um assistente chamado Gerenciar aprendizado de classificador baseado em palavras-chave , que pode ser usado para configurar e gerenciar as palavras-chave usadas para identificar tipos de documentos específicos.
- As atividades do Classificador baseado em palavra-chave e do Treinador do classificador baseado em palavra-chave agora podem gerenciar várias palavras-chave. Depois que os conjuntos de palavras-chave são selecionados, a extração é baseada em uma correspondência completa das palavras selecionadas.
- Outra grande melhoria é que a saída
DocumentObjectModel
, incluída na atividade Digitize Document , agora pode suportar polígonos de palavras, além de caixas horizontais de palavras. - O assistente do Taxonomy Manager recebeu uma nova barra de rolagem que incorpora todos os elementos da interface do usuário e oferece uma melhor experiência do usuário.
- As atividadesData Extraction Scope, Train Extractors Scope, Train Classifier Scopee Classify Document Scope agora estão organizando seus extratores e classificadores em ordem horizontal, substituindo a ordem vertical anterior.
- A atividade do Extrator baseado em Regex foi aprimorada e agora pode processar e retornar vários valores. A saída é visível apenas quando a atividade é usada em conjunto com a Estação de Validação.
- Quatro novos idiomas, turco (TR), português (PT), espanhol (ES) e espanhol-México (ES-MX) estão disponíveis para o pacote UiPath.IntelligentOCR.Activities.
Problemas conhecidos
.xaml
. Se nenhum arquivo for aberto quando você acessar o Gerenciador de Taxonomia, uma janela de gravação será exibida e o Gerenciador de Taxonomia será exibido apenas após fechar a janela de gravação.
Correções de bugs
- An exception was thrown when using the Data Extraction Scope activity together with a Try Catch activity. The issue was fixed and now the activity is executed as expected.
- Quando um campo booleano foi definido como Não no Validation Station, o arquivo de saída deveria ter mostrado o resultado como Não , mas, em vez disso, está mostrando como ausente. O problema foi corrigido e agora o arquivo de saída mostra o resultado correto.
- Corrigida a análise incorreta de números que ocorria quando o Escopo de extração de dados estava tentando analisar números em documentos usando um formato de número diferente da cultura do documento.
- Ao usar várias Estações de Validação, a ordem das peças derivadas não foi respeitada nos resultados validados. O problema foi corrigido e agora os resultados exibem as peças derivadas na mesma ordem em que foram introduzidas.
- As diferenças entre as caixas com seleção personalizada ocorreram quando os resultados de uma Estação de Validação passaram por uma segunda Estação de Validação. O problema foi corrigido e agora não há diferenças entre caixas com seleção personalizada.
- Quando a atividade Digitalizar documento era usada junto com o mecanismo de OCR do Microsoft Azure Computer Vision , a rotação não funcionava quando o parâmetro HandwritingRecognition era definido como True. O problema foi corrigido e agora as informações são processadas corretamente.
- Ao usar a atividade Digitalizar documento , ocorreu um erro ao tentar processar imagens com muito texto. O bug foi corrigido melhorando o processo de dimensionamento.
- Corrigido um problema que era gerado ao tentar treinar a atividade do Classificador baseado em palavra-chave no escopo de treinamento e a extração era executada sem uma referência de classificação. O problema foi corrigido e agora o fato de não haver informações de aprendizado é apenas registrado, não lançado como um erro.
- Ocorreu um erro ao usar a atividade FlexiCapture Extractor e o mesmo nome foi atribuído a uma coluna da tabela e a um campo. O problema foi corrigido e o arquivo
.fcdot
agora é processado conforme o esperado.
- v6.26.0
- Novidades
- Melhorias
- Correções de bugs
- v6.24.0
- Como habilitar os controles da direita para a esquerda no Validation Station
- Validação aprimorada com o Compact Validation Station
- Valide documentos no Action Center usando aplicativos UiPath®
- Uso de tags e versões para projetos modernos do Document Understanding
- Recursos de extração aprimorados usando novos extratores generativos
- Melhorias
- Correções de bugs
- v6.22.1
- Melhorias
- Correções de bugs
- v.6.9.8
- v6.14.3
- Correções de bugs
- v6.19.7
- Correções de bugs
- v6.22.0
- Novidades
- Suporte para atividades de uma configuração local
- Suporte ao IntelligentOCR para projetos modernos
- OCR para Idiomas Estendidos
- Correções de bugs
- Próximas descontinuações
- v6.19.6
- v6.19.5
- Correções de bugs
- V6.0.2
- v6.5.4
- v6.19.3
- v6.14.2
- v6.19.2
- Correções de bugs
- v6.19.1
- Correções de bugs
- v6.19.0
- Novidades
- Melhorias
- Correções de bugs
- Problemas conhecidos
- v6.14.1
- Novas funcionalidades e melhorias
- v6.9.5
- v6.9.4
- v6.9.3
- v6.9.2
- v6.5.3
- v6.5.2
- v6.9.1
- Correções de bugs
- V6.9.0
- Novas funcionalidades e melhorias
- Correções de bugs
- Cronograma de descontinuação
- V6.5.1
- Novas funcionalidades e melhorias
- v6.6.0
- Novas funcionalidades e melhorias
- Correções de bugs
- v6.5.0
- Novas funcionalidades e melhorias
- Correções de bugs
- 8 de dezembro de 2022
- v6.0.1
- Novas funcionalidades e melhorias
- Correções de bugs
- Problemas conhecidos
- v5.0.2
- Melhorias
- Correções de bugs
- Problemas conhecidos
- v4.13.2
- Melhorias
- v4.13.1
- Melhorias
- v4.13.0
- Novas funcionalidades e melhorias
- Correções de bugs
- Problemas conhecidos
- v4.10.5
- Melhorias
- v4.10.4
- Melhorias
- v4.10.3
- Melhorias
- v4.10.2
- Novas funcionalidades e melhorias
- Correções de bugs
- v4.10.1
- Melhorias
- Correções de bugs
- v4.10.0
- Novos recursos e melhorias
- v4.5.2
- Correções de bugs
- v4.5.1
- Correções de bugs
- v1.3.2
- Melhorias
- v4.5.0
- Novos recursos e melhorias
- v4.0.1
- Correções de bugs
- v4.0.0
- Alterações interruptivas
- Problemas conhecidos
- Correções de bugs
- v2.0.2
- Melhorias
- v1.3.1
- Melhorias
- v3.1.0
- Novas funcionalidades e melhorias
- Problemas conhecidos
- Correções de bugs