- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Classificar Escopo do Documento
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Fornece um escopo para as atividades do classificador, fornecendo todos os arquivos necessários para executar a classificação do documento. Aceita pelo menos um classificador e intermedia entre eles, garantindo que todos os parâmetros sejam encaminhados para as atividades de classificação filhas.
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável
Document
e pode ser recuperado da atividade Digitize Document . Para saber como fazer isso, consulte a documentação da atividade. Este campo é compatível apenas com variáveisDocument
. -
CaminhoDoDocumento — o caminho para o documento que você deseja validar. Este campo é compatível apenas com strings e variáveis
String
.Nota: Os tipos de arquivo suportados para este campo de propriedade são.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
e.pdf
. - TextoDoDocumento — o texto do próprio documento, armazenado em uma variável
String
. Você pode recuperar esse valor da atividade Digitize Document . Para saber como fazer isso, consulte a documentação da atividade. Este campo é compatível apenas com strings e variáveisString
. - Taxonomia - A taxonomia contra a qual o documento deve ser processado, armazenado em uma variável
DocumentTaxonomy
. Este campo suporta apenasDocumentTaxonomy
variáveis.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- ClassificationResults - Os resultados da execução dos arquivos do classificador no arquivo especificado, armazenados em um objeto
IReadOnlyList<ClassificationResult>
. Este campo suporta apenasIReadOnlyList<ClassificationResult>
variáveis.
O objeto ClassificationResult contém:
- DocumentTypeId - O ID correspondente ao tipo de documento correspondente da Taxonomia.
- DocumentId - O nome do arquivo do documento processado.
- ContentType - O tipo de conteúdo contido no documento processado.
- Confiança - Confiança de classificação, exibida como um valor numérico entre 0 e 1.
- OcrConfidence - Confiança de OCR para os caracteres que fazem parte da referência relatada, exibida como um valor numérico entre 0 e 1.
- Referência - Comprovação para a classificação, tanto na versão de texto do documento (através de
TextStartIndex
eTextLength
), quanto no Document Object Model (através deTokens
e as caixas de destaque para cada página da qual a comprovação é selecionada ). - DocumentBounds - Informações sobre a qual parte do documento a classificação pertence, com
StartPage
(Int32
, baseado em 0),PageCount
(Int32
),TextStartIndex
(Int32
, baseado em 0),TextLength
(Int32
). -
ClassifierName - Preenchido automaticamente pela atividade Classify Document Scope com o nome de exibição do classificador que relata o ClassificationResultatual.
Observação: oClassificationResults
tem todo o conteúdo classificado em ordem decrescente por pontuação de confiança, o que significa que aquele no topo tem a maior confiança.
O Assistente para configurar classificadores permite configurar a maneira como os classificadores são aplicados a cada tipo de documento e quais resultados são aceitáveis.
Siga os passos abaixo para configurar o assistente:
- Adicione uma atividade Classify Document Scope ao seu fluxo de trabalho.
-
Coloque uma ou mais atividades do Classificador dentro da atividade Classify Document Scope.
- Dê nomes sugestivos aos seus classificadores.
- Ordene os classificadores dentro do escopo, da esquerda para a direita, na ordem de prioridade de aceitação.
- Configure seus classificadores clicando no botão Configurar classificadores.
-
Agora você pode ver o assistente.
- Marque as caixas de seleção dos pares de classificador e tipo de documento que deseja ativar. Deixar um tipo de documento desmarcado para um determinado classificador significa que (1) o classificador não está treinado ou configurado para identificar aquele tipo de documento específico; ou (2) o classificador não funciona conforme o esperado para aquele tipo de documento específico e, se tais resultados forem retornados pelo classificador, eles devem ser ignorados.
- Se um classificador tiver sua própria taxonomia, use as caixas de texto ao lado de cada caixa de seleção para definir o mapeamento de taxonomia correto entre as duas taxonomias. Por exemplo, se Classifier1 foi configurado para retornar classe
INV
para uma fatura, mas a taxonomia do seu projeto contém um tipo de documento chamado "Fatura recebida", a caixa correspondente a "Fatura recebida" e esse Classifier1 específico devem conter a stringINV
. - Selecione um limite mínimo de confiança para cada um de seus classificadores. Os valores aceitáveis estão entre 0 (sem confiança mínima) e 100. Se um classificador retornar um resultado de classificação com uma confiança inferior ao limite definido, a atividade Classify Document Scope irá ignorar esse resultado de classificação e não reportá-lo.
-
Clique no botão Salvar assim que todos os classificadores estiverem configurados.
Integração de Compreensão de Documentos
A atividade Classify Document Scope faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.