- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Using the Classification Station
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades de Document Understanding
Using the Classification Station
linkA Estação de Classificação permite que você execute, revise e corrija informações de classificação de documentos. Uma vez aberto, ele apresenta todas as informações de classificação junto com o arquivo que está sendo processado. A estação de classificação funciona como uma ferramenta de validação humana, que permite atribuir tipos de documentos a qualquer arquivo que você queira processar, para qualquer subconjunto de páginas dentro dos arquivos.
Seção de visualização do documento
linkA área direita da Estação de Classificação contém uma versão interativa do documento original, na qual seções de texto ou documento podem ser selecionadas, e as palavras podem ser clicadas com base na saída do processo de digitalização. Essa área também contém opções para aumentar e diminuir o zoom, selecionar e girar páginas, pesquisar no documento ou alternar para visualização de texto.
A tabela a seguir mostra as opções disponíveis na área direita da tela Estação de classificação e suas descrições. A área que permite que você interaja com o documento e selecione várias partes dele.
Opção |
Description |
---|---|
![]() |
Exibe todos os atalhos de teclado disponíveis compatíveis com a Estação de Classificação, que podem incluir o seguinte:
|
![]() |
Alterna entre a visualização de texto e a visualização de imagem do documento:
|
Observação: ativo apenas quando a opção Visualização somente texto está ativa
|
Define o modo de seleção enquanto na visualização de texto, que inclui as seguintes opções:
|
![]() |
Define o modo de seleção enquanto na visualização de imagem, que inclui as seguintes opções:
|
| Gira a página atual no sentido horário. |
| Inicia uma busca entre resultados no documento utilizado pela Estação de Classificação. |
|
Redefine o nível de zoom no documento para o padrão. Esta opção é habilitada apenas se o documento foi ampliado ou reduzido anteriormente. |
![]() | Amplia o documento. |
![]() | Reduz o zoom no documento.
Observação:
Para ampliar ou diminuir o zoom, você também pode usar a combinação CTRL+rolagem da roda do mouse: CTRL + rolagem para cima para visualizar uma seção específica do documento; CTRL + rolagem para baixo para visualizar uma seção maior do documento. |
Seção de classificação de documentos
linkOs campos de classificação são influenciados pela Taxonomia e fornecem três situações possíveis:
- Se as informações de classificação para uma determinada parte do documento forem fornecidas e estiverem corretas, nenhuma ação será necessária para este campo.
- Se as informações de classificação para parte do documento forem fornecidas, mas estiverem errôneas, você poderá corrigir os tipos de documentos associados a esse intervalo de páginas.
- Se não houver informações de classificação fornecidas para uma determinada parte do documento, você pode deixá-lo como Não classificado ou selecionar o respectivo tipo de documento correto.
- Se o intervalo de páginas fornecido para uma determinada parte do documento (classificado ou não, corretamente ou não) não for preciso no que diz respeito às páginas (faltam páginas ou páginas extras), é possível corrigi-los movendo as páginas para o acima ou partes abaixo.
No lado esquerdo da tela, você pode ver todos os tipos de documentos dentro do arquivo. Você pode selecionar o tipo de documento desejado (previamente definido na Taxonomia) para qualquer intervalo de páginas do documento, na lista suspensa tipo de documento. Passe o mouse sobre a página, selecione Opções e, em seguida, selecione o tipo de documento na lista suspensa.
Selecione Opções para o tipo de documento para visualizar o menu suspenso com as seguintes opções disponíveis:
- Adicionar referência - Uma referência pode ser adicionada como suporte à seleção do tipo de documento realizada pelo usuário.
Observação: uma referência é um token ou coleção de tokens em um documento que pode ser usado como palavras-chave para identificar a classe do documento. As referências selecionadas pelo usuário são adicionadas ao arquivo Aprendizado de palavra-chave por meio do Escopo do classificador de treinos.Figura 4. A ação de adicionar uma referência e destacar a referência
- Remover referência - Remove uma referência que foi adicionada anteriormente para a seção do tipo de documento fornecido.
Figura 5. A ação de remover uma referência
- Referência de alteração - Altera a referência para uma nova, caso uma referência já exista. Selecione Alterar referência e, em seguida, selecione outra parte do documento.
Figura 6. A ação de alterar uma referência
- Mover todas as páginas para cima - Move toda a seção de páginas para cima para o tipo de documento definido anteriormente. A opção está ativa em todas as seções, exceto na primeira. O uso desta opção excluirá a seção sobre a qual você está agindo, unificando o intervalo de páginas com o anterior.
Figura 7. A ação de mover todas as páginas para cima
- Mover todas as páginas para baixo - Move toda a seção de páginas para baixo, para o próximo tipo de documento definido. A opção está ativa em todas as seções, exceto na última. O uso desta opção excluirá a seção sobre a qual você está agindo, unificando o intervalo de páginas com o seguinte.
Figura 8. A ação de mover todas as páginas para baixo
Outras opções de classificação
link- Dividir documento - Marca o início de um novo tipo de documento, de onde é feita a seleção, e o move para uma seção de novo tipo de documento.
Figura 9. A ação de dividir um documento
- Drag and Drop - If the EnablePageReorder property is disabled, then this allows the rearrangement of pages between sections. Pages can be rearranged with the Drag and Drop option only if the order within a document is kept (page numbers should be consecutive). Drag and drop pages in the document to rearrange them.
Figura 10. A ação de reorganizar as páginas de um documento
- Reorder pages - Drag and drop pages within the same document to reorder them. This option is available only if the EnablePageReorder property is set to True in the Present Classification Station activity.
Figura 11. Reordenar páginas dentro do mesmo documento durante a classificação
- Remover referência - Remove uma referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Remover referência.
Figura 12. A ação de remover uma referência
- Referência de destaque - Destaca a referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Destacar referência.
Figura 13. A ação de destacar uma referência
Atalhos do teclado
linkHá muitos atalhos de teclado que podem ser usados para otimizar a interação humana com a Estação de Classificação. Encorajamos você a usá-los tanto quanto possível. Esses podem ser revisados no pop-up Atalhos do teclado.
Para começar a usar atalhos de teclado, acesse Mais opções, selecione Atalhos de teclado e, em seguida, selecione Alternar atalhos de teclado.
A lista a seguir mostra os atalhos de teclado disponíveis e suas descrições correspondentes:
- Classificação
- n: move-se para o próximo campo;
- p: move-se para o campo anterior;
- s: divide-se após a página selecionada;
- h: destaca a referência do grupo;
- a: adiciona/altera uma referência;
- DEL: remove uma referência;
- m + tecla de seta para cima↑: move todas as páginas acima;
- m + tecla de seta para baixo ↓: move todas as páginas abaixo;
- teclas de seta para a esquerda ←→ + teclas de seta para baixo, para cima↑↓: navegue pelas páginas
- Documento:
- d +: aumenta o zoom;
- d -: diminui o zoom;
- d 0: redefine o zoom;
- d r: gira a página no sentido horário;
- d t: alterna o modo de texto;
- d s: altera o modo de seleção;
- d a: limpa a seleção de âncora desenhada;
- /: inicia uma pesquisa.
- Acessibilidade:
- teclas de seta para a esquerda, direita ←→ + teclas de seta para baixo, para cima↑↓: navegue por palavras e crie ou mais seleção de área;
- Shift e teclas de seta para baixo, para cima, para esquerda, para direita: redimensiona seleção de área;
- Enter: confirmar seleção de área;
- Página para baixo para cima: página seguinte ou anterior;
- ESC: desmarcar tudo;
- Alt p: alternar foco do Visualizador de PDF.
- Geral:
- ?: essa tela;
- !: documento de relatório como exceção;
- CTRL ENTER: salvar classificação;
- CTRL DEL: descartar todas as alterações atuais.
Interação com o documento na Estação de Classificação
linkSe o seu caso de uso exigir o destaque dos tipos de documentos selecionados para cada grupo de páginas para o qual você está revisando a classificação, use as opções disponíveis.
- Certifique-se de que a visualização de imagem esteja selecionada.
- Selecione Tokens e, em seguida, selecione Área personalizada.
- Selecione a área desejada em seu documento.
- Acesse as mais opções do documento no lado esquerdo e escolha se você deseja Alterar referência ou Remover referência.
Da mesma forma que você seleciona uma parte do documento usando a opção de área personalizada dentro da visualização de imagem, pode fazer o mesmo dentro da visualização de texto. A única diferença é que você garante que a Visualização de texto seja selecionada.
Confirmação e validação de dados
link- Descartar alterações: descarta todas as alterações feitas pelo usuário e reverte para o estado inicial da tarefa de validação.
- Salvar: salva os dados confirmados e corrigidos.
- Exceção
: relata o documento como sendo uma exceção.