- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Classificar Escopo do Documento
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Fornece um escopo para as atividades do classificador, fornecendo todos os arquivos necessários para executar a classificação do documento. Aceita pelo menos um classificador e intermedia entre eles, garantindo que todos os parâmetros sejam encaminhados para as atividades de classificação filhas.
Painel de Propriedades
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- ModeloDeObjetoDeDocumento - O Modelo de Objeto de Documento (DOM) que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Document
e pode ser recuperado da atividade Digitize Document. Acesse Digitize Document para saber como usar a atividade. Este campo é compatível apenas com variáveisDocument
. - CaminhoDoDocumento — o caminho para o documento que você deseja validar. Este campo é compatível apenas com strings e variáveis
String
.Nota: Os tipos de arquivo suportados para este campo de propriedade são.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
e.pdf
. - TextoDoDocumento — o texto do próprio documento, armazenado em uma variável
String
. Você pode recuperar esse valor da atividade Digitize Document. Acesse Digitize Document para saber como usar essa atividade. Esse campo é compatível apenas com strings e variáveisString
. - Taxonomia - A taxonomia contra a qual o documento deve ser processado, armazenado em uma variável
DocumentTaxonomy
. Este campo suporta apenasDocumentTaxonomy
variáveis.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- ClassificationResults - Os resultados da execução dos arquivos do classificador no arquivo especificado, armazenados em um objeto
IReadOnlyList<ClassificationResult>
. Este campo suporta apenasIReadOnlyList<ClassificationResult>
variáveis.
O objeto ResultadoDaClassificação contém as seguintes informações:
- DocumentTypeId - O ID correspondente ao tipo de documento correspondente da Taxonomia.
- DocumentId - O nome do arquivo do documento processado.
- ContentType - O tipo de conteúdo contido no documento processado.
- Confiança - Confiança de classificação, exibida como um valor numérico entre
0
e1
. - OcrConfidence - Confiança de OCR para os caracteres que fazem parte da referência relatada, exibidos como um valor numérico entre
0
e1
. - Referência - Comprovação para a classificação, tanto na versão de texto do documento (através de
TextStartIndex
eTextLength
), quanto no Document Object Model (através deTokens
e as caixas de destaque para cada página da qual a comprovação é selecionada ). - DocumentBounds - Informações sobre a qual parte do documento a classificação pertence, com
StartPage
(Int32
, baseado em 0),PageCount
(Int32
),TextStartIndex
(Int32
, baseado em 0),TextLength
(Int32
). -
ClassifierName - Preenchido automaticamente pela atividade Classify Document Scope com o nome de exibição do classificador que relata o ClassificationResultatual.
Observação: oClassificationResults
tem todo o conteúdo classificado em ordem decrescente por pontuação de confiança, o que significa que aquele no topo tem a maior confiança.
O Assistente para configurar classificadores permite configurar a maneira como os classificadores são aplicados a cada tipo de documento e quais resultados são aceitáveis.
Siga os passos abaixo para configurar o assistente:
- Adicione uma atividade Classify Document Scope ao seu fluxo de trabalho.
- Adicione uma ou mais atividades classificadoras dentro da atividade Classificar Escopo do Documento.
- Dê nomes sugestivos aos seus classificadores.
- Ordene os classificadores dentro do escopo, da esquerda para a direita, na ordem de prioridade de aceitação.
- Configure seus classificadores selecionando Configurar Classificadores.
Agora você pode ver o AssistenteFigura 1. Visão geral do assistente Configurar classificadores
- Selecione as caixas de seleção para os pares de classificador e tipo de documento que você deseja ativar.Deixar um tipo de documento desmarcado para um determinado classificador pode ocorrer em um dos seguintes cenários:
- O classificador não é treinado ou configurado para identificar esse tipo de documento.
- O classificador não funciona como esperado para esse tipo de documento específico e, se esses resultados forem retornados pelo classificador, eles devem ser ignorados.
- Se um classificador tiver sua própria taxonomia, use as caixas de texto ao lado de cada caixa de seleção para definir o mapeamento de taxonomia correto entre as duas taxonomias. Por exemplo, se Classifier1 foi configurado para retornar classe
INV
para uma fatura, mas a taxonomia do seu projeto contém um tipo de documento chamado "Fatura recebida", a caixa correspondente a "Fatura recebida" e esse Classifier1 específico devem conter a stringINV
. - Defina um limite de Confiança Mínima, de 0 a 100, para cada classificador no Classificar Escopo do Documento. Qualquer resultado de classificação com uma confiança menor que esse limite não será armazenado na saída da atividade Classificar Escopo do Documento.
Dica: a maioria dos tipos de documentos gera uma previsão com um nível de confiança. A configuração dessa propriedade evita falsos positivos considerando apenas as previsões com um nível de confiança acima do limite. Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso. Aplique o limite ajustando a propriedade Confiança mínima em seu escopo atual.
- Selecione Salvar assim que todos os classificadores forem configurados.
Figura 2. O assistente Configurar Classificadores definido para usar um classificador diferente para cada tipo de documento