- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.DocumentUnderstanding.ML.Activities.GenerativeExtractor
Description
Permite extrair documentos usando modelos generativos.
Para obter boas práticas sobre como usar prompts generativos, consulte a página Extrator generativo – Boas práticas .
- Os idiomas compatíveis com os modelos generativos são os mesmos que o mecanismo de OCR usado. Para obter mais informações, consulte a página Idiomas compatíveis com OCR .
- A atividade Extrator generativo não suporta a extração de campos de tabela definidos no Gerenciador de Taxonomia ou na extração de tabela. No entanto, ele pode extrair texto de documentos.
Compatibilidade do projeto
Windows - Legado | Windows
Configuração
Painel do Designer
- Gerenciar detalhes do campo - Selecione isso para abrir o assistente do Prompt do extrator generativo .
Painel de Propriedades
Autenticação
As propriedades de autenticação dessa atividade permitem que você a execute via robôs on-premises. Antes de configurar essas propriedades, certifique-se de ter atendido aos pré-requisitos mencionados na página. Após a conclusão dessas etapas, você pode prosseguir para preencher as propriedades de autenticação da atividade.
- Ativo de credenciais do runtime
- Use este campo quando você precisar acessar funcionalidades de extração generativa do Document Understanding enquanto o Robot estiver conectado a um Orchestrator local ou de um tenant diferente. Você pode optar por inserir um Ativo de credenciais, para fins de autenticação, de uma das seguintes maneiras:
-
Na lista suspensa, selecione o Ativo de Credenciais desejado no Orchestrator ao qual o UiPath® Robot está conectado.
-
Insira manualmente o caminho para o Ativo de Credencial do Orchestrator, no qual você armazena as credenciais do aplicativo externo para acessar os recursos generativos.
O formato do caminho deve ser:
<OrchestratorFolderName>/<AssetName>.
- URL do tenant do runtime - Use esse campo, ao lado do campo Ativo de credenciais de runtime . Insira o URL do tenant ao qual o UiPath Robot se conectará para executar a extração generativa. A URL deve estar no seguinte formato:
https://<baseURL>/<OrganizationName>/<TenantName>.
Comum
- DisplayName - O nome de exibição da atividade.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Servidor
- RetryOnFailure - Automatically retries the machine learning model execution, to eliminate transient network errors. If checked, the activity retries the execution.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Usando o assistente Extrator generativo
O assistente Prompt do Extrator Generativo permite selecionar um tipo de documento específico e um campo. Você também pode selecionar um valor opcional para especificar ainda mais os detalhes do campo correspondente. Além disso, o assistente permite que você atribua um tipo de extrator generativo diferente para cada tipo de documento, permitindo a personalização para acomodar os tamanhos e layouts variáveis de seus documentos.
O prompt é usado para identificar os campos a serem extraídos, fornecidos como pares de valor-chave, em que a chave representa o nome do campo e o valor, uma descrição para ele, ajudando o extrator a identificar o valor correspondente. Os mesmos detalhes de campo não podem ser usados para campos diferentes no mesmo tipo de documento.
Figura 1. O prompt do Extrator generativo

As descrições de campos inseridas no assistente Prompt do extrator generativo são incorporadas ao prompt usado pelo modelo generativo.
As descrições de campos inseridas nas caixas de entrada do assistente Configurar extratores não são usadas pelo modelo generativo.
- Selecione um Tipo de documento e campos na lista de tipos de documentos definidos. A seleção do campo é feita no assistente Configurar Extratores e o prompt é definido no assistente Prompt de Extratores Generativos .
- Opcionalmente, você pode escolher entre três tipos de extratores generativos por tipo de documento. As opções do extrator generativo são:
- Extrator de Layout Simples para Documento Longo
- Extrator de layouts complexos para documentos longos
- Extrator de layout complexo de documento curto
- Adicione um valor opcional para definir os detalhes do campo. Pode ser uma breve descrição do tipo de documento. O número máximo de caracteres permitidos é 1000.