- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Using the Classification Station
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
A Estação de Classificação permite que você realize, revise e corrija informações de classificação de documentos. Uma vez aberto, ela apresenta quaisquer informações de classificação junto com o arquivo que está sendo processado. A estação de classificação funciona como uma ferramenta de validação humana que permite atribuir tipos de documentos a qualquer arquivo que você deseja processar, para qualquer subconjunto de páginas dentro dos arquivos.
Figura 1. Uma visão geral da Estação de Classificação, na qual um documento de amostra é classificado
Seção de visualização do documento
A área direita da Estação de Classificação contém uma versão interativa do documento original, na qual seções de texto ou documento podem ser selecionadas, e as palavras podem ser clicadas com base na saída do processo de digitalização. Essa área também contém opções para aumentar e diminuir o zoom, selecionar e girar páginas, pesquisar no documento ou alternar para visualização de texto.
Figura 2. Visão geral da área interativa da Estação de Classificação, na qual você pode selecionar partes do documento
A tabela a seguir mostra as opções disponíveis na área direita da tela Estação de classificação e suas descrições. A área que permite que você interaja com o documento e selecione várias partes dele.
| Opção | Description |
|---|---|
| Exibe todos os atalhos de teclado disponíveis compatíveis com a Estação de Classificação, que podem incluir o seguinte:
|
| Alterna entre a visualização de texto e a visualização de imagem do documento:
|
|
Observação: ativo apenas quando a opção Visualização somente texto está ativa | Define o modo de seleção enquanto na visualização de texto, que inclui as seguintes opções:
|
| Define o modo de seleção enquanto na visualização de imagem, que inclui as seguintes opções:
|
|
| Gira a página atual no sentido horário. |
|
| Inicia uma busca entre resultados no documento utilizado pela Estação de Classificação. |
|
| Redefine o nível de zoom no documento para o padrão. Esta opção é habilitada apenas se o documento foi ampliado ou reduzido anteriormente. |
| Amplia o documento. |
| Reduz o zoom no documento. Observação: Para ampliar ou diminuir o zoom, você também pode usar a combinação CTRL+rolagem da roda do mouse: CTRL + rolagem para cima para visualizar uma seção específica do documento; CTRL + rolagem para baixo para visualizar uma seção maior do documento. |
Seção de classificação de documentos
Os campos de classificação são influenciados pela Taxonomia e fornecem três situações possíveis:
- Se as informações de classificação para uma determinada parte do documento forem fornecidas e estiverem corretas, nenhuma ação será necessária para este campo.
- Se as informações de classificação para parte do documento forem fornecidas, mas estiverem errôneas, você poderá corrigir os tipos de documentos associados a esse intervalo de páginas.
- If there is no classification information provided for a given part of the document, you can either leave it as Not Classified or select the right document type for it.
- Se o intervalo de páginas fornecido para uma determinada parte do documento (classificado ou não, corretamente ou não) não for preciso no que diz respeito às páginas (faltam páginas ou páginas extras), é possível corrigi-los movendo as páginas para o acima ou partes abaixo.
No lado esquerdo da tela, você pode ver todos os tipos de documentos dentro do arquivo. Você pode selecionar o tipo de documento desejado (que foi definido anteriormente na Taxonomia) para qualquer determinado intervalo de páginas do documento, na lista suspensa Tipo de documento. Passe o mouse sobre a página, selecione Opções e, em seguida, selecione o tipo de documento na lista suspensa.
Figura 3. Seleção do tipo de documento na lista suspensa
Select Options
for the document type to view the dropdown menu with the following options available:
-
Add reference - A reference can be added as support to the document type selection performed by the user.
Observação:Uma referência é um token ou coleção de tokens em um documento que pode ser usado como palavras-chave para identificar a classe do documento. As referências selecionadas pelo usuário são adicionadas ao arquivo Aprendizado de palavra-chave por meio do Escopo do classificador de treinos.
Figura 4. A ação de adicionar uma referência e destacar a referência
-
Remove reference - Removes a reference that was previously added for the given document type section.
Figura 5. A ação de remover uma referência
-
Referência de alteração - Altera a referência para uma nova, caso uma referência já exista. Selecione Alterar referência e, em seguida, selecione outra parte do documento.
Figura 6. A ação de alterar uma referência
-
Move all pages up - Moves the entire section of pages up, to the previously defined document type, Option is active on all sections except for the first one. Using this option will delete the section you are acting upon, unifying the page range with the previous one.
Figura 7. A ação de mover todas as páginas para cima
-
Move all pages down - Moves the entire section of pages down, to the next document type defined. Option is active on all sections except for the last one. Using this option will delete the section you are acting upon, unifying the page range with the next one.
Figura 8. A ação de mover todas as páginas para baixo
Outras opções de classificação
-
Split document - Marks the beginning of a new document type, from where the selection is done, and moves it under a new document type section.
Figura 9. A ação de dividir um documento
-
Arrastar e soltar - Se a propriedade HabilitarReordenaçãoDePágina estiver desabilitada, isso permitirá o rearranjo de páginas entre seções. As páginas podem ser reorganizadas com a opção Arrastar e soltar apenas se a ordem dentro de um documento for mantida (os números das páginas devem ser consecutivos). Arraste e solte páginas no documento para reorganizá-las.
Figura 10. A ação de reorganizar as páginas de um documento
-
Reordenar páginas - Arraste e solte páginas dentro do mesmo documento para reordená-las. Esta opção somente está disponível se a propriedade HabilitarRequisiçãoDePágina estiver definida como True na atividade Present Classification Station .
Figura 11. Reordenar páginas dentro do mesmo documento durante a classificação
-
Remover referência - Remove uma referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Remover referência.
Figura 12. A ação de remover uma referência
-
Referência de destaque - Destaca a referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Destacar referência.
Figura 13. A ação de destacar uma referência
Atalhos do teclado
Há muitos atalhos de teclado que podem ser usados para otimizar a interação humana com a Estação de Classificação. Encorajamos você a usá-los tanto quanto possível. Esses podem ser revisados no pop-up Atalhos do teclado.
Para começar a usar atalhos de teclado, acesse Mais opções, selecione Atalhos de teclado e, em seguida, selecione Alternar atalhos de teclado.
A lista a seguir mostra os atalhos de teclado disponíveis e suas descrições correspondentes:
- Classificação
- n: move-se para o próximo campo;
- p: move-se para o campo anterior;
- s: divide-se após a página selecionada;
- h: destaca a referência do grupo;
- a: adiciona/altera uma referência;
- DEL: remove uma referência;
- m + tecla de seta para cima↑: move todas as páginas acima;
- m + tecla de seta para baixo ↓: move todas as páginas abaixo;
- teclas de seta para a esquerda ←→ + teclas de seta para baixo, para cima↑↓: navegue pelas páginas
- Document:
- d +: aumenta o zoom;
- d -: diminui o zoom;
- d 0: redefine o zoom;
- d: gira a página no sentido horário;
- dt: alterna o modo de texto;
- ds: altera o modo de seleção;
- da: Limpa a seleção de âncora desenhada;
- /: inicia uma pesquisa.
- Acessibilidade:
- teclas de seta para a esquerda, direita ←→ + teclas de seta para baixo, para cima↑↓: navegue por palavras e crie ou mais seleção de área;
- Shift e teclas de seta para baixo, para cima, para esquerda, para direita: redimensiona seleção de área;
- Enter: confirmar seleção de área;
- Página para baixo para cima: página seguinte ou anterior;
- ESC: desmarcar tudo;
- Alt p: alternar foco do Visualizador de PDF.
- Geral:
- ?: esta tela;
- !: relatório documento como exceção;
- CTRL ENTER: Salvar classificação;
- CTRL DEL: descartar todas as alterações atuais.
Interação com o documento na Estação de Classificação
Se o seu caso de uso exigir o destaque dos tipos de documentos selecionados para cada grupo de páginas para o qual você está revisando a classificação, use as opções disponíveis.
Para selecionar uma parte do documento usando a opção de área personalizada dentro da visualização de imagem:
- Certifique-se de que a visualização de imagem esteja selecionada.
- Selecione Tokens e, em seguida, selecione Área personalizada.
- Selecione a área desejada em seu documento.
- Acesse as mais opções do documento no lado esquerdo e escolha se você deseja Alterar referência ou Remover referência.
Figura 14. Imagem animada mostrando como usar a seleção personalizada é na visualização de imagem
Da mesma forma que você seleciona uma parte do documento usando a opção de área personalizada dentro da visualização de imagem, pode fazer o mesmo dentro da visualização de texto. A única diferença é que você garante que a Visualização de texto seja selecionada.
Figura 15. Imagem animada mostrando como usar a seleção personalizada é na visualização de texto
Confirmação e validação de dados
Você tem as seguintes três opções disponíveis na parte inferior da Estação de classificação para confirmar ou descartar as alterações:
- Descartar alterações: descarta todas as alterações feitas pelo usuário e reverte para o estado inicial da tarefa de validação.
- Salvar: salva os dados confirmados e corrigidos.
- Exceção
: relata o documento como sendo uma exceção.
Integração do Document Understanding
A atividade Present Classification Station faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.
- Atalhos de teclado;
- Alterna o lado do painel da esquerda para a direita.
- Visualização apenas de texto. 
- Tokens.
- Área personalizada;
- Escolha após a seleção. 

