- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Classificar Escopo do Documento
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Fornece um escopo para as atividades do classificador, fornecendo todos os arquivos necessários para executar a classificação do documento. Aceita pelo menos um classificador e intermedia entre eles, garantindo que todos os parâmetros sejam encaminhados para as atividades de classificação filhas.
Painel de Propriedades
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- DocumentObjectModel - The Document Object Model (DOM) you want to use to validate the document against. This model is stored in a
Document
variable and can be retrieved from the Digitize Document activity. Visit Digitize Document to learn how to use the activity. This field supports onlyDocument
variables. - CaminhoDoDocumento — o caminho para o documento que você deseja validar. Este campo é compatível apenas com strings e variáveis
String
.Nota: Os tipos de arquivo suportados para este campo de propriedade são.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
e.pdf
. - DocumentText - The text of the document itself, stored in a
String
variable. You can retrieve this value from the Digitize Document activity. Visit Digitize Document to learn how to use this activity. This field supports only strings andString
variables. - Taxonomia - A taxonomia contra a qual o documento deve ser processado, armazenado em uma variável
DocumentTaxonomy
. Este campo suporta apenasDocumentTaxonomy
variáveis.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- ClassificationResults - Os resultados da execução dos arquivos do classificador no arquivo especificado, armazenados em um objeto
IReadOnlyList<ClassificationResult>
. Este campo suporta apenasIReadOnlyList<ClassificationResult>
variáveis.
The ClassificationResult object contains the following information:
- DocumentTypeId - O ID correspondente ao tipo de documento correspondente da Taxonomia.
- DocumentId - O nome do arquivo do documento processado.
- ContentType - O tipo de conteúdo contido no documento processado.
- Confidence - Classification confidence, displayed as a numeric value between
0
and1
. - OcrConfidence - OCR confidence for the characters that are part of the reported reference, displayed as a numeric value between
0
and1
. - Referência - Comprovação para a classificação, tanto na versão de texto do documento (através de
TextStartIndex
eTextLength
), quanto no Document Object Model (através deTokens
e as caixas de destaque para cada página da qual a comprovação é selecionada ). - DocumentBounds - Informações sobre a qual parte do documento a classificação pertence, com
StartPage
(Int32
, baseado em 0),PageCount
(Int32
),TextStartIndex
(Int32
, baseado em 0),TextLength
(Int32
). -
ClassifierName - Preenchido automaticamente pela atividade Classify Document Scope com o nome de exibição do classificador que relata o ClassificationResultatual.
Observação: oClassificationResults
tem todo o conteúdo classificado em ordem decrescente por pontuação de confiança, o que significa que aquele no topo tem a maior confiança.
O Assistente para configurar classificadores permite configurar a maneira como os classificadores são aplicados a cada tipo de documento e quais resultados são aceitáveis.
Siga os passos abaixo para configurar o assistente:
- Adicione uma atividade Classify Document Scope ao seu fluxo de trabalho.
- Add one or more classifier activities inside the Classify Document Scope activity.
- Dê nomes sugestivos aos seus classificadores.
- Ordene os classificadores dentro do escopo, da esquerda para a direita, na ordem de prioridade de aceitação.
- Configure your classifiers selecting Configure Classifiers.
You can now see the WizardFigura 1. Visão geral do assistente Configurar classificadores
- Select the check boxes for the classifier and document type pairs you want to activate. Leaving a document type unchecked for a certain classifier can appear in one of the following scenarios:
- The classifier is not trained or configured to identify that particular document type
- The classifier does not perform as expected for that particular document type, and if such results are returned by the classifier, they should be ignored.
- Se um classificador tiver sua própria taxonomia, use as caixas de texto ao lado de cada caixa de seleção para definir o mapeamento de taxonomia correto entre as duas taxonomias. Por exemplo, se Classifier1 foi configurado para retornar classe
INV
para uma fatura, mas a taxonomia do seu projeto contém um tipo de documento chamado "Fatura recebida", a caixa correspondente a "Fatura recebida" e esse Classifier1 específico devem conter a stringINV
. - Set a Minimum Confidence threshold, from 0 to 100, for each classifier in the Classify Document Scope. Any classification result with a confidence lower than this threshold will not be stored in the Classify Document Scope activity output.
Tip: Most document types generate a prediction with a confidence level. Setting this property prevents false positives by only considering the predictions with a confidence level above the threshold. You can identify an optimal confidence level by testing various documents within your workflow, recording the results in an Excel spreadsheet, for example, and then analyze what threshold value is the most accurate. Apply the threshold by adjusting the Minimum Confidence property in your current scope.
- Select Save once all the classifiers are configured.
Figure 2. The Configure Classifiers wizard configured to use a different classifier for each document type