- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Notas de versão
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades do Document Understanding
Notas de versão
Adendo: adicionado em 3 de fevereiro de 2026
The UiPath.DocumentUnderstanding.ML.Activities package is automatically installed with the UiPath.IntelligentOCR.Activities package to perform ML-based classification and extraction.
Starting 2026, the release notes for the Document Understanding ML activity package will be provided in the Intelligent OCR activities section.
Do not install UiPath.DocumentUnderstanding.ML.Activities package as a separate package in you automation as the correct version will be automatically installed when you install the UiPath.IntelligentOCR.Activities package.
V1.36.3
Data de lançamento: 16 de março de 2026
Melhorias
Desempenho aprimorado para processamento de PDF, reduzindo o tempo de digitalização para arquivos grandes.
V1.36.2
Data de lançamento: 16 de dezembro de 2025
Novidades
Suporte para associação baseada em nome e recursos de projeto IXP remapeáveis no Maestro
Adicionamos suporte para referenciar projetos IXP por nome no Maestro e introduzimos a capacidade de remapear o projeto como um recurso durante a implantação.
v1.33.0
Data de lançamento: 16 de abril de 2025
Novidades
Recursos de extração aprimorados usando novos extratores generativos
Para aprimorar os recursos de extração generativa para documentos curtos e longos que possuem layouts complexos, agora você pode selecionar os seguintes extratores generativos ao configurar extratores para os campos de seus documentos:
- Short Documents Simple Layout – This is the existent Generative Extractor.
- Long Documents Complex Layout (Preview) – Optimized for long form documents that include images, handwriting, form elements or other complex layouts, such as floating callout boxes. Examples of documents that are suitable for this extractor: insurance policies, or other similar long form documents with complex layouts.
- Short Document Complex Layout (Preview) – Optimized for short documents that include images, handwriting, form elements or other complex layouts like floating callout boxes. For example: identity cards, or healthcare intake forms with complex layouts.
Melhorias
- When using the Generative Extractor inside a Data Extraction Scope, the Manage Prompt button has been renamed to Manage Field Details. Additionally, inside the Generative Extractor Prompt wizard, the Prompt value has been renamed to Field details. These changes accurately describe purpose of the instructions given to the generative extractors for a specific field.
- When using the Generative Classifier inside a Classify Document Scope, the Manage Prompt button has been renamed to Manage Document Types. Additionally, inside the Generative Classifier Prompt wizard, the Prompt value has been renamed to Document Type details. These changes accurately describe the purpose of the instructions given to the generative classifier for a specific document type.
v1.31.2
Data de lançamento: 26 de novembro de 2024
Correções de bugs
In the Configure Extractors menu, selecting Get or refresh extractor capabilities for an extractor trainer under the Train Extractors Scope activity did not open as expected.
v1.24.1
Data de lançamento: 21 de outubro de 2024
Correções de bugs
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v1.28.8
Data de lançamento: 14 de outubro de 2024
Correções de bugs
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v1.31.1
Data de lançamento: 3 de outubro de 2024
This package version is compatible with UIAutomation.Activities versions that are 24.10.0 or later.
Novidades
Suporte para atividades de uma configuração local
You can now use the Generative Classifier and Generative Extractor activities within a Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator.
We've added the RuntimeTenantURL and RuntimeCredentialsAsset properties to the Generative Classifier and Extractor activities. With these properties, you can now directly use credentials from external applications, stored in Orchestrator, to access Document Understanding resources at runtime. To achieve this, ensure that your selected tenant has Document Understanding enabled and AI Units allocated.
Melhorias
Aumento do tamanho da solicitação de 500 para 1000 caracteres por pergunta, para maior clareza em suas instruções.
Correções de bugs
O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
v1.28.7
Data de lançamento: 13 de agosto de 2024
Atualizamos algumas dependências internas para melhorar o desempenho.
v1.28.6
Data de lançamento: 31 de julho de 2024
Correções de bugs
Ao usar as atividades Generative Classifier e Generative Extractor, inserir um prompt que começava ou terminava com espaços em branco levava a um erro “KeyNotFoundException” com a mensagem “A chave fornecida não estava presente no dicionário”.
v1.28.5
Data de lançamento: 12 de julho de 2024
Correções de bugs
Corrigido o problema que fazia com que a classificação de documentos falhasse com o erro “Um URI de solicitação inválido foi fornecido”.
v1.28.4
Data de lançamento: 20 de junho de 2024
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
v1.28.3
Data de lançamento: 5 de junho de 2024
Melhoramos a estabilidade do produto revisando certas dependências.
v1.28.2
Data de lançamento: 27 de maio de 2024
Melhorias
Aumento do tamanho da solicitação de 500 para 1000 caracteres por pergunta, para maior clareza em suas instruções. Além disso, se você atingir o limite de tamanho da solicitação de 1000 caracteres por pergunta, receberá um erro de "Limite excedido".
Correções de bugs
O extrator de ML retornou valores vazios, fazendo com que as tarefas de validação falhassem devido a propriedades de valor nulo.
Problemas conhecidos
Se o Extrator generativo ou Classificador dispara uma exceção Content Filtered , a atividade não gera nenhum resultado, como se o conteúdo estivesse faltando. A seguinte mensagem de aviso será mostrada nos logs do robô: GPT refused to handle the request because of content filtering policy. Returning empty result. Essa mensagem também é exibida no Studio quando uma automação é iniciada de lá.
v1.28.1
Data de lançamento: 29 de abril de 2024
Novos recursos
O Machine Learning Extractor agora pode extrair texto vertical, aprimorando significativamente os recursos de extração.
v1.24.0
Data de lançamento: 1º de setembro de 2023
Disponibilidade geral de funcionalidades generativas
We are excited to announce that the UiPath.DocumentUnderstanding.ML.Activities generative features are now in general availability. This includes the following:
- Atividade Classificador generativo
- Atividade Extrator generativo
You can use the new generative features with the UiPath.IntelligentOCR.Activities framework.
Novos recursos e melhorias
- A new property, Output Folder, is available for the Machine Learning Classifier Trainer activity. This property allows you to save files locally.
- O suporte para campos de várias páginas agora está disponível.Esta funcionalidade é útil quando um endereço, por exemplo, tem a rua em uma página e o estado e CEP na página seguinte. Devido a um problema conhecido, as linhas de tabela não estão funcionando atualmente nesse caso. Siga nossas notas de versão para atualizações futuras.
v1.21.2
Data de lançamento: 7 de junho de 2023
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
v1.21.1
Data de lançamento: 26 de abril de 2023
Linha do tempo de depreciação
Recomendamos que você verifique regularmente o cronograma de obsolescência para ver se há atualizações relacionadas a funcionalidades que serão descontinuadas e removidas.
v1.17.1
Data de lançamento: 27 de março de 2023
Novas funcionalidades e melhorias
Trabalhamos constantemente para aprimorar o pacote UiPath.DocumentUnderstanding.ML.Activities. Mesmo que não haja alterações significativas com essa versão de patch, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade para nosso produto.
v1.18.0
Data de lançamento: 15 de dezembro de 2022
Novas funcionalidades e melhorias
- A interface do usuário do UiPath Studio agora está disponível em chinês tradicional.
- You can now benefit from the API Key field being pre-populated for the following activities included in the UiPath.DocumentUnderstanding.ML.Activities package: Machine Learning Classifier and Machine Learning Extractor.
v1.17.0
Data de lançamento: 24 de outubro de 2022
Novas funcionalidades e melhorias
- The Machine Learning Extractor Trainer activity can now support multivalued fields.
- The UseServerSideOCR option is scheduled to be deprecated on December 2022. We recommend using the default behavior. More details about the deprecation can be found here.
- The Document Understanding Process Studio template has been upgraded to a new version. The UiPath.DocumentUnderstanding.ML.Activities package is a dependency for this template.
Correções de bugs
- Corrigido um bug que estava causando erros de extração quando o Digitalizador era usado atualizando a biblioteca PDF e usando recursos híbridos de OCR.
- Correção de um bug que fazia com que entradas inconsistentes fossem enviadas para o ML Extractor quando a imagem e o DOM eram necessários.
- Os ProxySettings não eram usados na chamada
GetCapabilitiesrecebida do Machine Learning Extractor. O bug agora está corrigido e funciona conforme o esperado.
v1.13.2
Data de lançamento: 9 de maio de 2022
Melhorias
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
- The Machine Learning Extractor Trainer and the Machine Learning Classifier Trainer activities have received new parameters grouped under the name of Public Datasets, allowing you to use public datasets instead of private ones.
- The Machine Learning Extractor activity has been updated and now the extraction algorithm can also be used from Forms AI, not only from the ML Models list.
- The Machine Learning Extractor activity can now be used with a public endpoint in airgapped scenarios.
Correções de bugs
Fixed a bug occurring on the Machine Learning Extractor Trainer activity that was exporting values even if the field was not mapped in the Configure Trainer wizard. Now, everything works as expected.
v1.9.2
Data de lançamento: 3 de agosto de 2023
Correção de bugs
No pacote de atividades de ML do Document Understanding, alguns dos campos que eram necessários não foram marcados de acordo. Agora todos os campos obrigatórios estão marcados visualmente, como esperado.
v1.9.1
Data de lançamento: 05 de outubro de 2021
Novos recursos e melhorias
- Este lançamento traz como melhoria a atualização do cliente de telemetria para a versão 1.5.3.
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
- Added the Dataset and Project parameters to the Machine Learning Extractor Trainer activity which allow you to select where to upload your training data in your AI Center tenant. As a result, the Endpoint and MLSkill parameters were removed from the activity.
- Added the Endpoint parameter to the Machine Learning Classifier activity which provides the ability to use the activity with public ML Skills.
- The Machine Learning Extractor can now be integrated with Forms AI. The only requirement for this to happen is to make sure that the UseServerSideOCR option is disabled.
v1.7.0
Data de lançamento: 29 de março de 2021
Novos recursos e melhorias
- Released the Machine Learning Classifier and Machine Learning Classifier Trainer activities as part of the Machine Learning Document Classification functionality which helps you classify documents using a custom trained ML model. Machine Learning Classifier could prove to be very useful particularly in scenarios with high diversity in document sets. To train the classifier and improve its results with time with the aid of human validation, you can use the sister activity, Machine Learning Classifier Trainer.
- Processamento aprimorado de arquivos PDF.
v1.5.2
Data de lançamento: 11 de novembro de 2020
Correções de bugs
- Em caso de resposta de falha ao solicitar a lista de habilidades de ML do AI Fabric, a repetição automática agora também está disponível para códigos de status HTTP 5XX.
- In case of network failure instead of the retry operation being blocked, the Machine Learning Extractor now retries to connect to AI Fabric.
v1.5.1
Data de lançamento: 20 de outubro de 2020
Melhorias
More detailed error logging for Machine Learning Extractor.
Correções de bugs
- Mecanismo de repetição adicionado para solicitações de habilidades de ML.
- Fixed an issue where not all ML Skills were usable by the Machine Learning Extractor activity.
v1.5.0
Data de lançamento: 5 de outubro de 2020
Novos recursos e melhorias
- Released the new Machine Learning Extractor Trainer activity can prepare data for ML model re-training based on human validation results.
- Added the Get or refresh extractor capabilities functionality to Machine Learning Extractor Trainer that can be used to easily map your taxonomy fields with the available extractor fields.
- A new parameter has been included in the Machine Learning Extractor activity, named Timeout (milliseconds). The parameter can be used for specifying the amount of time to wait for a response from the server before an error is thrown.
- Changed the tooltip text on UseServerSideOCR property for Machine Learning Extractor to indicate it is incompatible with Machine Learning Extractor Trainer.
v1.2.2
Data de lançamento: 24 de agosto de 2020
Correções de bugs
- Fixed an issue that in some cases was returning a
407ProxyAuthenticationRequirederror message for Kerberos or NTLM authentication requests. This applies to Machine Learning Extractor. - Fixed an issue that was causing the Get Capabilities functionality of Machine Learning Extractor not to work if a certain endpoint was provided.
- Fixed an issue that was causing the Machine Learning Extractor to throw an error when no robot is connected.
v1.2.1
Data de lançamento: 5 de junho de 2020
Novos recursos e melhorias
This release brings a new option available for the Machine Learning Extractor activity, named MLSkill, that can be used for consuming models stored in AI Fabric.
v1.1.0
Data de lançamento: 4 de maio de 2020
Novos recursos e melhorias
A new option has been added to the Machine Learning Extractor named UseServerSideOCR. This option allows you to use the OCR results received from digitization.
The Machine Learning Extractor now declares its internal taxonomy, allowing you to easily map the fields it can extract to the fields you have defined in your taxonomy, in the Configure Extractors wizard of the Data Extraction Scope.
v1.0.0
Data de lançamento: 11 de fevereiro de 2020
Novos recursos e melhorias
The UiPath.DocumentUnderstanding.ML.Activities package facilitates the automation of information extraction from receipts and invoices while using AI methods.
- Adendo: adicionado em 3 de fevereiro de 2026
- V1.36.3
- Melhorias
- V1.36.2
- Novidades
- v1.33.0
- Novidades
- Recursos de extração aprimorados usando novos extratores generativos
- Melhorias
- v1.31.2
- Correções de bugs
- v1.24.1
- Correções de bugs
- v1.28.8
- Correções de bugs
- v1.31.1
- Novidades
- Suporte para atividades de uma configuração local
- Melhorias
- Correções de bugs
- v1.28.7
- v1.28.6
- Correções de bugs
- v1.28.5
- Correções de bugs
- v1.28.4
- v1.28.3
- v1.28.2
- Melhorias
- Correções de bugs
- Problemas conhecidos
- v1.28.1
- Novos recursos
- v1.24.0
- Disponibilidade geral de funcionalidades generativas
- Novos recursos e melhorias
- v1.21.2
- v1.21.1
- Linha do tempo de depreciação
- v1.17.1
- Novas funcionalidades e melhorias
- v1.18.0
- Novas funcionalidades e melhorias
- v1.17.0
- Novas funcionalidades e melhorias
- Correções de bugs
- v1.13.2
- Melhorias
- Correções de bugs
- v1.9.2
- Correção de bugs
- v1.9.1
- Novos recursos e melhorias
- v1.7.0
- Novos recursos e melhorias
- v1.5.2
- Correções de bugs
- v1.5.1
- Melhorias
- Correções de bugs
- v1.5.0
- Novos recursos e melhorias
- v1.2.2
- Correções de bugs
- v1.2.1
- Novos recursos e melhorias
- v1.1.0
- Novos recursos e melhorias
- v1.0.0
- Novos recursos e melhorias