- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Using the Classification Station
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Using the Classification Station
A Estação de Classificação permite que você realize, revise e corrija informações de classificação de documentos. Uma vez aberto, ela apresenta quaisquer informações de classificação junto com o arquivo que está sendo processado. Você pode organizar seus documentos usando a opção Dividir documento. Mais informações sobre essa funcionalidade podem ser encontradas na seção Outras opções desta página.
A área direita da Estação de Classificação contém uma versão interativa do documento original, na qual seções de texto ou documento podem ser selecionadas, e as palavras podem ser clicadas com base na saída do processo de digitalização. Essa área também contém opções para aumentar e diminuir o zoom, selecionar e girar páginas, pesquisar no documento ou alternar para visualização de texto.
A tabela a seguir mostra as opções disponíveis na área direita da tela Estação de classificação e suas descrições. A área que permite que você interaja com o documento e selecione várias partes dele.
Opção |
Description |
---|---|
Exibe todos os atalhos de teclado disponíveis compatíveis com a Estação de Classificação, que podem incluir o seguinte:
| |
Alterna entre a visualização de texto e a visualização de imagem do documento:
| |
Observação: ativo apenas quando a opção Visualização somente texto está ativa
|
Define o modo de seleção enquanto na visualização de texto, que inclui as seguintes opções:
|
Define o modo de seleção enquanto na visualização de imagem, que inclui as seguintes opções:
| |
| Gira a página atual no sentido horário. |
| Inicia uma busca entre resultados no documento utilizado pela Estação de Classificação. |
|
Redefine o nível de zoom no documento para o padrão. Esta opção é habilitada apenas se o documento foi ampliado ou reduzido anteriormente. |
Amplia o documento. | |
Reduz o zoom no documento.
Observação:
Para ampliar ou diminuir o zoom, você também pode usar a combinação CTRL+rolagem da roda do mouse: CTRL + rolagem para cima para visualizar uma seção específica do documento; CTRL + rolagem para baixo para visualizar uma seção maior do documento. |
Esta seção descreve como usar as opções disponíveis para interagir com documentos na Estação de Classificação.
- Certifique-se de que a visualização de imagem esteja selecionada.
- Selecione Tokens e, em seguida, selecione Área personalizada.
- Selecione a área desejada em seu documento.
- Acesse as mais opções do documento no lado esquerdo e escolha se você deseja Alterar referência ou Remover referência.
Da mesma forma que você seleciona uma parte do documento usando a opção de área personalizada dentro da visualização de imagem, pode fazer o mesmo dentro da visualização de texto. A única diferença é que você garante que a Visualização de texto seja selecionada.
Há muitos atalhos de teclado que podem ser usados para otimizar a interação humana com a Estação de Classificação. Encorajamos você a usá-los tanto quanto possível. Esses podem ser revisados no pop-up Atalhos do teclado.
Para começar a usar atalhos de teclado, acesse Mais opções, selecione Atalhos de teclado e, em seguida, selecione Alternar atalhos de teclado.
A lista a seguir mostra os atalhos de teclado disponíveis e suas descrições correspondentes:
- Classificação
- n: move-se para o próximo campo;
- p: move-se para o campo anterior;
- s: divide-se após a página selecionada;
- h: destaca a referência do grupo;
- a: adiciona/altera uma referência;
- DEL: remove uma referência;
- m + tecla de seta para cima↑: move todas as páginas acima;
- m + tecla de seta para baixo ↓: move todas as páginas abaixo;
- teclas de seta para a esquerda ←→ + teclas de seta para baixo, para cima↑↓: navegue pelas páginas
- Documento:
- d +: aumenta o zoom;
- d -: diminui o zoom;
- d 0: redefine o zoom;
- d r: gira a página no sentido horário;
- d t: alterna o modo de texto;
- d s: altera o modo de seleção;
- d a: limpa a seleção de âncora desenhada;
- /: inicia uma pesquisa.
- Acessibilidade:
- teclas de seta para a esquerda, direita ←→ + teclas de seta para baixo, para cima↑↓: navegue por palavras e crie ou mais seleção de área;
- Shift e teclas de seta para baixo, para cima, para esquerda, para direita: redimensiona seleção de área;
- Enter: confirmar seleção de área;
- Página para baixo para cima: página seguinte ou anterior;
- ESC: desmarcar tudo;
- Alt p: alternar foco do Visualizador de PDF.
- Geral:
- ?: essa tela;
- !: documento de relatório como exceção;
- CTRL ENTER: salvar classificação;
- CTRL DEL: descartar todas as alterações atuais.
Os campos de classificação são influenciados pela Taxonomia e fornecem três situações possíveis:
- Se as informações de classificação para uma determinada parte do documento forem fornecidas e estiverem corretas, nenhuma ação será necessária para este campo.
- Se não houver informações de classificação fornecidas para uma determinada parte do documento, você pode deixá-lo como Não classificado ou selecionar o respectivo tipo de documento correto.
- Se o intervalo de páginas fornecido para uma determinada parte do documento (classificado ou não, corretamente ou não) não for preciso no que diz respeito às páginas (faltam páginas ou páginas extras), é possível corrigi-los movendo as páginas para o acima ou partes abaixo.
No lado esquerdo da tela, você pode ver todas as classificações. Você pode selecionar o tipo de documento desejado (que foi definido anteriormente na Taxonomia) para qualquer determinado intervalo de páginas do documento, na lista suspensa Tipo de documento. Passe o mouse sobre a página, selecione Opções e, em seguida, selecione o tipo de documento na lista suspensa.
Selecione Opções para o tipo de documento para visualizar o menu suspenso com as seguintes opções disponíveis:
- Adicionar referência - Uma referência pode ser adicionada como suporte à seleção do tipo de documento realizada pelo usuário.
Observação: uma referência é um token ou coleção de tokens em um documento que pode ser usado como palavras-chave para identificar a classe do documento. As referências selecionadas pelo usuário são adicionadas ao arquivo Aprendizado de palavra-chave por meio do Escopo do classificador de treinos.Figura 6. A ação de adicionar uma referência e destacar a referência
- Remover referência - Remove uma referência que foi adicionada anteriormente para a seção do tipo de documento fornecido.
Figura 7. A ação de remover uma referência
- Referência de alteração - Altera a referência para uma nova, caso uma referência já exista. Selecione Alterar referência e, em seguida, selecione outra parte do documento.
Figura 8. A ação de alterar uma referência
- Mover todas as páginas para cima - Move toda a seção de páginas para cima para o tipo de documento definido anteriormente. A opção está ativa em todas as seções, exceto na primeira. O uso desta opção excluirá a seção sobre a qual você está agindo, unificando o intervalo de páginas com o anterior.
Figura 9. A ação de mover todas as páginas para cima
- Mover todas as páginas para baixo - Move toda a seção de páginas para baixo, para o próximo tipo de documento definido. A opção está ativa em todas as seções, exceto na última. O uso desta opção excluirá a seção sobre a qual você está agindo, unificando o intervalo de páginas com o seguinte.
Figura 10. A ação de mover todas as páginas para baixo
- Dividir documento - Marca o início de um novo tipo de documento, de onde é feita a seleção, e o move para uma seção de novo tipo de documento.
Figura 11. A ação de dividir um documento
- Arrastar e soltar - Permite o rearranjo de páginas entre seções. As páginas podem ser reorganizadas com a opção Arrastar e soltar apenas se a ordem dentro de um documento for mantida (os números de páginas devem ser consecutivos). Arraste e solte páginas no documento para reorganizá-las.
Figura 12. A ação de reorganizar as páginas de um documento
- Remover referência - Remove uma referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Remover referência.
Figura 13. A ação de remover uma referência
- Referência de destaque - Destaca a referência de uma página específica. Selecione Mais opções na página documento e, em seguida, Destacar referência.
Figura 14. A ação de destacar uma referência
- Descartar alterações: descarta todas as alterações feitas pelo usuário e reverte para o estado inicial da tarefa de validação.
- Salvar: salva os dados confirmados e corrigidos.
- Exceção: relata o documento como sendo uma exceção.