- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades de Document Understanding
Data de lançamento: 16 de abril de 2025
Novidades
Recursos de extração aprimorados usando novos extratores generativos
Para aprimorar os recursos de extração generativa para documentos curtos e longos que possuem layouts complexos, agora você pode selecionar os seguintes extratores generativos ao configurar extratores para os campos de seus documentos:
- Layout simples de documentos curtos - Este é o Extrator generativo existente.
- Layout complexo de documentos longos (Visualização) – Otimizado para documentos longos que incluem imagens, texto manuscrito, elementos de formulário ou outros layouts complexos, como caixas de texto explicativo flutuantes. Exemplos de documentos adequados para esse extrator: apólices de seguro ou outros documentos longos semelhantes com layouts complexos.
- Layout complexo de documentos curtos (Visualização) – Otimizado para documentos curtos que incluem imagens, texto manuscrito, elementos de formulário ou outros layouts complexos, como caixas de texto explicativo flutuantes. Por exemplo: carteiras de identidade ou formulários de atendimento de saúde com layouts complexos.
Melhorias
- Ao usar o Extrator generativo dentro de um Escopo de extração de dados, o botão Gerenciar prompt foi renomeado para Gerenciar detalhes do campo. Além disso, dentro do assistente de Prompt do Extrator Generativo , o valor de Prompt foi renomeado para detalhes do campo. Essas alterações descrevem com precisão o propósito das instruções dadas aos extratores generativos para um campo específico.
- Ao usar o Classificador generativo dentro de um Escopo do Documento de Classificação, o botão Gerenciar Prompt foi renomeado para Gerenciar Tipos de Documento. Além disso, dentro do assistente de Prompt do Classificador Generativo , o valor de Prompt foi renomeado para detalhes do Tipo de Documento. Essas alterações descrevem com precisão o propósito das instruções dadas ao classificador generativo para um tipo de documento específico.
Data de lançamento: 26 de novembro de 2024
Correções de bugs
No menu Configurar Extratores, a seleção Obter ou atualizar capacidades do extrator para um treinador na atividade Train Extractors Scope não abriu conforme o esperado.
Data de lançamento: 21 de outubro de 2024
Correções de bugs
Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.
Data de lançamento: 14 de outubro de 2024
Correções de bugs
Essa versão resolve as seções Desconhecidas no painel de Visão Geral do Consumo de AI Units que foram causadas por dados ausentes.
Data de lançamento: 3 de outubro de 2024
Novidades
Suporte para atividades de uma configuração local
Agora você pode usar as atividades Classificador generativo e Extrator generativo dentro de um Classificar escopo do documento e Escopo da Extração de Dados, mesmo que o Robô esteja conectado a um Orchestrator local.
Adicionamos as propriedades RuntimeTenantURL e RuntimeCredentialsAsset às atividades Classificador generativo e Extrator. Com essas propriedades, agora você pode usar diretamente credenciais de aplicativos externos, armazenados no Orchestrator, para acessar recursos do Document Understanding em tempo de execução. Para conseguir isso, certifique-se de que seu locatário selecionado tenha o Document Understanding habilitado e AI Units alocadas.
Melhorias
Aumento do tamanho da solicitação de 500 para 1000 caracteres por pergunta, para maior clareza em suas instruções.
Correções de bugs
O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
Data de lançamento: 13 de agosto de 2024
Atualizamos algumas dependências internas para melhorar o desempenho.
Data de lançamento: 31 de julho de 2024
Correções de bugs
Ao usar as atividades Generative Classifier e Generative Extractor, inserir um prompt que começava ou terminava com espaços em branco levava a um erro “KeyNotFoundException” com a mensagem “A chave fornecida não estava presente no dicionário”.
Data de lançamento: 12 de julho de 2024
Correções de bugs
Corrigido o problema que fazia com que a classificação de documentos falhasse com o erro “Um URI de solicitação inválido foi fornecido”.
Data de lançamento: 20 de junho de 2024
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
Data de lançamento: 5 de junho de 2024
Melhoramos a estabilidade do produto revisando certas dependências.
Data de lançamento: 27 de maio de 2024
Melhorias
Aumento do tamanho da solicitação de 500 para 1000 caracteres por pergunta, para maior clareza em suas instruções. Além disso, se você atingir o limite de tamanho da solicitação de 1000 caracteres por pergunta, receberá um erro de "Limite excedido".
Correções de bugs
O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.Problemas conhecidos
Content Filtered
, a atividade não gera nenhum resultado, como se o conteúdo estivesse faltando. A seguinte mensagem de aviso será mostrada nos logs do robô: GPT refused to handle the request because of content filtering policy. Returning empty result.
Essa mensagem também é exibida no Studio quando uma automação é iniciada de lá.
Data de lançamento: 29 de abril de 2024
Novos recursos
O Machine Learning Extractor agora pode extrair texto vertical, aprimorando significativamente os recursos de extração.
Data de lançamento: 1º de setembro de 2023
Disponibilidade geral de funcionalidades generativas
- Atividade Classificador generativo
- Atividade Extrator generativo
Novos recursos e melhorias
- Uma nova propriedade, Pasta de saída, está disponível para a atividade Treinador de classificador de aprendizado de máquina. Essa propriedade permite salvar arquivos localmente.
- O suporte para campos de várias páginas agora está disponível.Esta funcionalidade é útil quando um endereço, por exemplo, tem a rua em uma página e o estado e CEP na página seguinte. Devido a um problema conhecido, as linhas de tabela não estão funcionando atualmente nesse caso. Siga nossas notas de versão para atualizações futuras.
Data de lançamento: 7 de junho de 2023
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
Data de lançamento: 26 de abril de 2023
Linha do tempo de depreciação
Recomendamos que você verifique regularmente o cronograma de obsolescência para ver se há atualizações relacionadas a funcionalidades que serão descontinuadas e removidas.Data de lançamento: 27 de março de 2023
Novas funcionalidades e melhorias
Trabalhamos constantemente para aprimorar o pacote UiPath.DocumentUnderstanding.ML.Activities. Mesmo que não haja alterações significativas com essa versão de patch, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade para nosso produto.
Data de lançamento: 15 de dezembro de 2022
Novas funcionalidades e melhorias
- A interface do usuário do UiPath Studio agora está disponível em chinês tradicional.
- Agora você pode beneficiar-se do campo Chave de API pré-preenchido para as seguintes atividades incluídas no pacote UiPath.DocumentUnderstanding.ML.Activities: Machine Learning Classifier e Machine Learning Extractor.
Data de lançamento: 24 de outubro de 2022
Novas funcionalidades e melhorias
- A atividade Machine Learning Extractor Trainer agora pode ser compatível com campos de valores múltiplos.
- A opção UseServerSideOCR está programada para ser preterida em dezembro de 2022. Recomendamos usar o comportamento padrão. Mais detalhes sobre a descontinuação podem ser encontrados aqui.
- O modelo de processo Studio do Document Understanding Process foi atualizado para uma nova versão.O pacote UiPath.DocumentUnderstanding.ML.Activities é uma dependência para este modelo.
Correções de bugs
- Corrigido um bug que estava causando erros de extração quando o Digitalizador era usado atualizando a biblioteca PDF e usando recursos híbridos de OCR.
- Correção de um bug que fazia com que entradas inconsistentes fossem enviadas para o ML Extractor quando a imagem e o DOM eram necessários.
- Os ProxySettings não eram usados na chamada
GetCapabilities
recebida do Machine Learning Extractor. O bug agora está corrigido e funciona conforme o esperado.
Data de lançamento: 9 de maio de 2022
Melhorias
- O pacote UiPath.DocumentUnderstanding.ML.Activities foi atualizado para .NET5 portátil, permitindo que você os execute em robôs Linux.
- As atividades Machine Learning Extractor Trainer e Machine Learning Classifier Trainer receberam novos parâmetros agrupados sob o nome de Public Datasets, permitindo que você use conjuntos de dados públicos em vez de privados.
- A atividade Machine Learning Extractor foi atualizada e agora o algoritmo de extração também pode ser usado no Forms AI, não apenas na lista de modelos de ML .
- A atividade Machine Learning Extractor agora pode ser usada com um ponto de extremidade público em cenários isolados.
Correções de bugs
Corrigido um bug que ocorria na atividade do Machine Learning Extractor Trainer que exportava valores mesmo que o campo não fosse mapeado no assistente Configurar Trainer . Agora, tudo funciona como esperado.
Data de lançamento: 3 de agosto de 2023
Correção de bugs
No pacote de atividades de ML do Document Understanding, alguns dos campos que eram necessários não foram marcados de acordo. Agora todos os campos obrigatórios estão marcados visualmente, como esperado.Data de lançamento: 05 de outubro de 2021
Novos recursos e melhorias
- Este lançamento traz como melhoria a atualização do cliente de telemetria para a versão 1.5.3.
- O pacote UiPath.DocumentUnderstanding.ML.Activities foi atualizado para .NET5. Embora ambas as versões .NET continuem a ser suportadas, os projetos .NET5 só podem funcionar em arquiteturas de 64 bits.
- Adicionados os parâmetros Dataset e Project à atividade Machine Learning Extractor Trainer , que permite selecionar onde carregar seus dados de treinamento em seu locatário do AI Center. Como resultado, os parâmetros Endpoint e MLSkill foram removidos da atividade.
- Adicionado o parâmetro Endpoint à atividade do classificador de aprendizado de máquina que fornece a capacidade de usar a atividade com habilidades de ML públicas.
- O Machine Learning Extractor agora pode ser integrado ao Forms AI. O único requisito para que isso aconteça é garantir que a opção UsarOcrNoServidor esteja desabilitada.
Data de lançamento: 29 de março de 2021
Novos recursos e melhorias
- Lançadas as atividades Machine Learning Classifier e Machine Learning Classifier Trainer como parte da funcionalidade de classificação de documento de machine learning, o que ajuda você a classificar documentos usando um modelo de ML treinado personalizado. Machine Learning Classifier pode ser muito útil principalmente em cenários com alta diversidade em conjuntos de documentos.Para treinar o classificador e melhorar seus resultados com o tempo com a ajuda de validação humana, você pode usar a atividade irmã, Machine Learning Classifier Trainer.
- Processamento aprimorado de arquivos PDF.
Data de lançamento: 11 de novembro de 2020
Correções de bugs
- Em caso de resposta de falha ao solicitar a lista de habilidades de ML do AI Fabric, a repetição automática agora também está disponível para códigos de status HTTP 5XX.
- Em caso de falha de rede, em vez de a operação de repetição ser bloqueada, o Machine Learning Extractor agora tenta novamente se conectar ao AI Fabric.
Data de lançamento: 20 de outubro de 2020
Melhorias
Log de erros mais detalhado para o Machine Learning Extractor.
Correções de bugs
- Mecanismo de repetição adicionado para solicitações de habilidades de ML.
- Correção de um problema em que nem todas as habilidades de ML eram utilizáveis pela atividade do Extrator de aprendizado de máquina .
Data de lançamento: 5 de outubro de 2020
Novos recursos e melhorias
- Lançada a nova atividade do Machine Learning Extractor Trainer que pode preparar dados para o novo treinamento do modelo de ML com base nos resultados da validação humana.
- Adicionada a funcionalidade Obter ou atualizar recursos do extrator ao Machine Learning Extractor Trainer , que pode ser usado para mapear facilmente seus campos de taxonomia com os campos extratores disponíveis.
- Um novo parâmetro foi incluído na atividade do Machine Learning Extractor , denominado Timeout (milisseconds). O parâmetro pode ser usado para especificar o tempo de espera por uma resposta do servidor antes que um erro seja lançado.
- Alterado o texto da dica de ferramenta na propriedade UsarOcrNoServidor para o Machine Learning Extractor indicar que é incompatível com o Machine Learning Extractor Trainer.
Data de lançamento: 24 de agosto de 2020
Correções de bugs
- Correção de um problema que, em alguns casos, retornava uma mensagem de erro
407ProxyAuthenticationRequired
para solicitações de autenticação Kerberos ou NTLM. Isso se aplica ao Machine Learning Extractor. - Correção de um problema que fazia com que a funcionalidade Get Capabilities do Machine Learning Extractor não funcionasse se um determinado endpoint fosse fornecido.
- Correção de um problema que fazia com que o Extrator de aprendizado de máquina gerasse um erro quando nenhum robô estava conectado.
Data de lançamento: 5 de junho de 2020
Novos recursos e melhorias
Esta versão traz uma nova opção disponível para a atividade do Machine Learning Extractor , chamada MLSkill, que pode ser usada para consumir modelos armazenados no AI Fabric.
Data de lançamento: 4 de maio de 2020
Novos recursos e melhorias
UseServerSideOCR
. Esta opção permite que você use os resultados de OCR recebidos da digitalização.
O Machine Learning Extractor agora declara sua taxonomia interna, permitindo que você mapeie facilmente os campos que ele pode extrair para os campos que você definiu em sua taxonomia, no assistente Configure Extractors do Data Extraction Scope.
- v1.33.0
- Novidades
- Recursos de extração aprimorados usando novos extratores generativos
- Melhorias
- v1.31.2
- Correções de bugs
- v1.24.1
- Correções de bugs
- v1.28.8
- Correções de bugs
- v1.31.1
- Novidades
- Suporte para atividades de uma configuração local
- Melhorias
- Correções de bugs
- v1.28.7
- v1.28.6
- Correções de bugs
- v1.28.5
- Correções de bugs
- v1.28.4
- v1.28.3
- v1.28.2
- Melhorias
- Correções de bugs
- Problemas conhecidos
- v1.28.1
- Novos recursos
- v1.24.0
- Disponibilidade geral de funcionalidades generativas
- Novos recursos e melhorias
- v1.21.2
- v1.21.1
- Linha do tempo de depreciação
- v1.17.1
- Novas funcionalidades e melhorias
- v1.18.0
- Novas funcionalidades e melhorias
- v1.17.0
- Novas funcionalidades e melhorias
- Correções de bugs
- v1.13.2
- Melhorias
- Correções de bugs
- v1.9.2
- Correção de bugs
- v1.9.1
- Novas funcionalidades e melhorias
- v1.7.0
- Novas funcionalidades e melhorias
- v1.5.2
- Correções de bugs
- v1.5.1
- Melhorias
- Correções de bugs
- v1.5.0
- Novas funcionalidades e melhorias
- v1.2.2
- Correções de bugs
- v1.2.1
- Novos recursos e melhorias
- v1.1.0
- Novos recursos e melhorias
- v1.0.0
- Novos recursos e melhorias