- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope
Description
Provides a scope for extractor activities, enabling you to configure them according to the document types defined in your taxonomy. The output of the activity is stored in an ExtractionResult variable, containing all automatically extracted data, and can be used as input for the Export Extraction Results activity. This activity also features a Configure Extractors wizard, which lets you specify exactly what fields from the document types defined in the taxonomy you want to extract.
Compatibilidade do projeto
Windows - Legado | Windows
Configuração
Painel do Designer
Entrada
- CaminhoDoDocumento — o caminho para o documento que você deseja validar. Esse campo é compatível apenas com strings e variáveis String.
Observação:
The supported file types for this property field are
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - TextoDoDocumento — o texto do próprio documento, armazenado em uma variável String. Esse valor pode ser recuperado de uma atividade Digitize Document . Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com strings e variáveis
String. - ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Documente pode ser recuperado da atividade Digitize Document . Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com variáveisDocument. - Taxonomia - A Taxonomia a partir da qual o documento deve ser processado, armazenado em uma variável
DocumentTaxonomy. Esse objeto pode ser obtido usando uma atividade Load Taxonomy . Este campo é compatível apenas com variáveisDocumentTaxonomy. - ClassificationResults - The results of running a classifier activity on the specified document, stored in a
ClassificationResultobject. This field is optional if you specify a DocumentTypeId instead. This field supports onlyClassificationResultvariables. - IDdoTipoDeDocumento - O ID do tipo de documento, conforme encontrado no Gerenciador de taxonomia. Esse campo é opcional se você especificar um arquivo no campo ResultadosDaClassificação . Este campo é compatível apenas com strings e variáveis
String.
Saída
- ExtractionResults - The extraction results of the data extraction process, stored in an
ExtractionResultvariable.Observação:If the page range for data extraction indicates that only a part of the original file is targeted, the Data Extraction Scope generates a file in the
TEMPproject folder that is then passed to the extractors. The temporary file contains only the page range that extractors should receive for document processing.
Painel de Propriedades
Autenticação
As propriedades Autenticação dessa atividade permitem que você realize a autovalidação por meio de UiPath Robots no local. Antes de configurar essas propriedades, certifique-se de ter atendido aos pré-requisitos mencionados na página Configuração da autenticação. Depois que essas etapas forem concluídas, você pode prosseguir para preencher as propriedades Autenticação da atividade.
- Ativo de credenciais de runtime - Use esse campo quando você precisar acessar funcionalidades de validação automática do Document Understanding enquanto o UiPath Robot é conectado a um Orchestrator local ou de um tenant diferente. Você pode optar por inserir um Ativo de credenciais, para fins de autenticação, de uma das seguintes maneiras:
-
Na lista suspensa, selecione o Ativo de Credenciais desejado no Orchestrator ao qual o UiPath® Robot está conectado.
-
Insira manualmente o caminho para o Ativo de credenciais do Orchestrator, onde você armazena as credenciais de aplicativos externos para acessar as funcionalidades de validação automática.
O formato do caminho deve ser:
<OrchestratorFolderName>/<AssetName>.
-
- URL do tenant do runtime - Use esse campo, ao lado do campo Ativo de credenciais de runtime . Insira o URL do tenant ao qual o UiPath Robot se conectará para executar a validação automática. A URL deve estar no seguinte formato:
https://<baseURL>/<OrganizationName>/<TenantName>.
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
- AplicarValidaçãoAutomática - Ajuste a confiança usando a verificação cruzada de extração generativa. Se os valores forem validados automaticamente, a confiança deles será definida como o limite de confiança. A habilitação dessa funcionalidade tem consumo adicional de AI Unit.
- ClassificationResults - The results of running a classifier activity on the specified document, stored in a
ClassificationResultobject. This field is optional if you specify a DocumentTypeId instead. This field supports onlyClassificationResultvariables. - ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Documente pode ser recuperado da atividade Digitize Document . Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com variáveisDocument. - CaminhoDoDocumento — o caminho para o documento que você deseja validar. Esse campo é compatível apenas com strings e variáveis String.
Observação:
The supported file types for this property field are
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - TextoDoDocumento — o texto do próprio documento, armazenado em uma variável String. Esse valor pode ser recuperado de uma atividade Digitize Document . Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com strings e variáveis
String. - IDdoTipoDeDocumento - O ID do tipo de documento, conforme encontrado no Gerenciador de taxonomia. Esse campo é opcional se você especificar um arquivo no campo ResultadosDaClassificação . Este campo é compatível apenas com strings e variáveis
String. - FormatoValoresSePossíveis — especifica que se um valor tiver partes derivadas relatadas, ele não será substituído pelo escopo de extração de dados, mas se não tiver partes derivadas, o escopo de extração de dados tentará calculá-lo. Se a opção estiver definida como False , os valores não serão formatados.
- LimiteConfiançaValidaçãoAutomática - Limite de confiança para validação generativa. Apenas valores de campo com confiança abaixo desse limite serão validados. Se os valores forem confirmados, a confiança deles será definida com este limite.
- Taxonomia - A Taxonomia a partir da qual o documento deve ser processado, armazenado em uma variável
DocumentTaxonomy. Esse objeto pode ser obtido usando uma atividade Load Taxonomy . Este campo é compatível apenas com variáveisDocumentTaxonomy.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- ExtractionResults - The extraction results of the data extraction process, stored in an
ExtractionResultvariable.Observação:If the page range for data extraction indicates that only a part of the original file is targeted, the Data Extraction Scope generates a file in the
TEMPproject folder that is then passed to the extractors. The temporary file contains only the page range that extractors should receive for document processing.
Usando o assistente de configuração do extrator
The Configure Extractors Wizard can be accessed via the Data Extraction Scope and allows you to choose which extractors are applied to each document type and field.
No corpo da atividade, selecione Configurar extratores. O botão do assistente fica disponível depois de arrastar pelo menos uma atividade do extrator para o corpo da atividade Data Extraction Scope. Esse assistente exibe todos os tipos de documentos definidos na taxonomia e seus respectivos campos e permite que você escolha qual extrator você deseja usar para cada um.
Figura 1. Visão geral do assistente Configurar extratores

Cada tipo de documento pode ser expandido e seus campos podem ser visualizados no assistente e selecionados para extração.
Figura 2. A seleção de um extrator para um tipo de documento no assistente Configurar extratores

O campo Framework Alias pode ser usado para mapear um extrator para um ou mais treinadores. Por exemplo, você pode dar ao Machine Learning Extractor o alias R2D2 e, em seguida, pode usar o mesmo alias para um Machine Learning Extractor Trainer. Isso cria um vínculo entre o extrator e o treinador e tem propósitos de treinamento para o extrator. Cada extrator tem um alias exclusivo, enquanto vários treinadores podem compartilhar o mesmo alias.
Você pode configurar o campo Confiança mínima para permitir um limite de confiança entre 0 e 100. O valor previsto para um campo é considerado apenas se a pontuação de confiança da previsão for igual ou maior do que a confiança mínima configurada. Se a pontuação de confiança de uma previsão for menor do que o limite de confiança mínima, o valor previsto não será armazenado na saída da atividade Escopo de extração de dados.
Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso.
Selecione Obter de recursos de extrator de atualização, para os extratores que são compatíveis com essa funcionalidade, para mapear facilmente seus campos de taxonomia com os campos de extrator disponíveis ou atualizá-los caso os campos de extrator tenham sido alterados.
As caixas de seleção ao lado de cada campo em qualquer coluna, se selecionadas, fazem com que o Escopo do Extrator de dados solicite esse campo específico do extrator. Se a caixa de seleção estiver desmarcada, Escopo do Extrator de dados não solicitará um valor para esse campo do extrator.
As entradas de texto ao lado de cada campo permitem que você mapeie campos definidos em sua taxonomia com os campos definidos na taxonomia interna do extrator, se houver. Para campos regulares, adicione na entrada de texto o identificador para o campo de destino da taxonomia interna do extrator. Para campos de tabelas, o campo de tabela pai é mapeado no nível da tabela e as colunas correspondentes são mapeadas individualmente.
Ao usar o Machine Learning Extractor em uma configuração com Campos de coluna definidos, eles podem ser mapeados para um campo de tabela da sua Taxonomia. Eles serão exibidos em uma coleção chamada itens.
O número de colunas no assistente varia de acordo com o número de extratores presentes na atividade do escopo. O nome de cada coluna é fornecido pelo nome de exibição de cada atividade do extrator.
Figura 3. Vários extratores presentes no assistente Configurar extratores

Se vários extratores forem usados na atividade, a ordem dos extratores no escopo definirá sua prioridade. Por exemplo, vamos considerar três extratores. O Extrator 1 retorna um valor aceitável (que está acima do nível de Confiança Mínima) para um campo solicitado específico e, em seguida, esse campo não é solicitado quando o Extrator 2 e o Extrator 3 são executados. Se o Extrator 1 e o Extrator 2 retornarem valores abaixo do nível de Confiança Mínima para aquele campo específico, ou não retornarem nada, os resultados do Extrator 3 serão levados em consideração, se satisfizerem as condições de aceitabilidade de confiança.
Integração de Compreensão de Documentos
A atividade Data Extraction Scope faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.