- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Description
Fornece um escopo para as atividades do classificador, fornecendo todos os arquivos necessários para executar a classificação do documento. Aceita pelo menos um classificador e intermedia entre eles, garantindo que todos os parâmetros sejam encaminhados para as atividades de classificação filhas.
Compatibilidade do projeto
Windows-Legacy | Windows
Configuração
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
- ModeloDeObjetoDeDocumento - O Modelo de Objeto de Documento (DOM) que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Documente pode ser recuperado da atividade Digitize Document . Acesse Digitize Document para saber como usar a atividade. Este campo é compatível apenas com variáveisDocument. - CaminhoDoDocumento — o caminho para o documento que você deseja validar. Este campo é compatível apenas com strings e variáveis
String.Observação:The supported file types for this property field are
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - TextoDoDocumento — o texto do próprio documento, armazenado em uma variável
String. Você pode recuperar esse valor da atividade Digitize Document . Acesse Digitize Document para saber como usar essa atividade. Este campo é compatível apenas com strings e variáveisString. - Taxonomy - The Taxonomy against which the document is to be processed, stored in a
DocumentTaxonomyvariable. This field supports onlyDocumentTaxonomyvariables.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- ClassificationResults - The results of running the classifier files on the specified file, stored in a
IReadOnlyList<ClassificationResult>object. This field supports onlyIReadOnlyList<ClassificationResult>variables.
O objeto ResultadoDaClassificação contém as seguintes informações:
- DocumentTypeId - The ID corresponding to the document type matched from the Taxonomy.
- DocumentId - The file name of the processed document.
- ContentType - The type of content contained in the processed document.
- Confiança - Confiança de classificação, exibida como um valor numérico entre
0e1. - OcrConfidence - Confiança de OCR para os caracteres que fazem parte da referência relatada, exibidos como um valor numérico entre
0e1. - Reference - Evidencing for the classification, both in the text version of the document (through
TextStartIndexandTextLength), and in the Document Object Model (throughTokensand the highlight boxes for each page from which the evidencing is selected). - DocumentBounds - Information on what part of the document the classification pertains to, with
StartPage(Int32, 0-based),PageCount(Int32),TextStartIndex(Int32, 0-based),TextLength(Int32). - ClassifierName - Automatically populated by the Classify Document Scope activity with the display name of the classifier reporting the current ClassificationResult.
Observação:
The
ClassificationResultshas all the content sorted in descending order by confidence score, which means the one at the top has the highest confidence.
Usando o assistente de configuração de classificadores
The Configure Classifiers Wizard allows you to configure the way the classifiers are applied to each document type, and what results are acceptable.
Siga os passos abaixo para configurar o assistente:
-
Add a Classify Document Scope activity to your workflow.
-
Adicione uma ou mais atividades classificadoras dentro da atividade Classificar Escopo do Documento.
-
Dê nomes sugestivos aos seus classificadores.
-
Ordene os classificadores dentro do escopo, da esquerda para a direita, na ordem de prioridade de aceitação.
-
Configure seus classificadores selecionando Configurar Classificadores.
Agora você pode ver o assistente
Figura 1. Visão geral do assistente Configurar classificadores
-
-
Selecione as caixas de seleção para os pares de classificador e tipo de documento que você deseja ativar.Deixar um tipo de documento desmarcado para um determinado classificador pode ocorrer em um dos seguintes cenários:
- O classificador não é treinado ou configurado para identificar esse tipo de documento.
- O classificador não funciona como esperado para esse tipo de documento específico e, se esses resultados forem retornados pelo classificador, eles devem ser ignorados.
-
Se um classificador tiver sua própria taxonomia, use as caixas de texto ao lado de cada caixa de seleção para definir o mapeamento de taxonomia correto entre as duas taxonomias. Por exemplo, se Classifier1 foi configurado para retornar classe
INVpara uma fatura, mas a taxonomia do seu projeto contém um tipo de documento chamado "Fatura recebida", a caixa correspondente a "Fatura recebida" e esse Classifier1 específico devem conter a stringINV. -
Defina um limite de Confiança Mínima, de 0 a 100, para cada classificador no Classificar Escopo do Documento. Qualquer resultado de classificação com uma confiança menor que esse limite não será armazenado na saída da atividade Classificar Escopo do Documento.
Dica:A maioria dos tipos de documentos gera uma previsão com um nível de confiança. A configuração dessa propriedade evita falsos positivos considerando apenas as previsões com um nível de confiança acima do limite. Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso. Aplique o limite ajustando a propriedade Confiança mínima em seu escopo atual.
-
Selecione Salvar assim que todos os classificadores forem configurados.
Figura 2. O assistente Configurar Classificadores definido para usar um classificador diferente para cada tipo de documento
Integração de Compreensão de Documentos
A atividade Classify Document Scope faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.