- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Instalar e usar
- Experiência de primeira execução
- Implantar o UiPathDocumentOCR
- Implante um Pacote de ML pré-configurado
- Pacotes offline 2023.10.12+patch1
- Pacotes offline 2023.10.12
- Pacotes offline 2023.10.11
- Pacotes offline 2023.10.10
- Pacotes offline 2023.10.9
- Pacotes offline 2023.10.8
- Pacotes offline 2023.10.7+patch1
- Pacotes offline 2023.10.7
- Pacotes offline 2023.10.6
- Pacotes offline 2023.10.5
- Pacotes offline 2023.10.4
- Pacotes offline 2023.10.3
- Pacotes offline 2023.10.2
- Pacotes offline 2023.10.1
- Pacotes offline 2023.10.0
- Use o Document Manager
- Usar o Framework
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Visão geral da classificação de documentos
O que é a Classificação de documentos
Document Classification is a component in the Document UnderstandingTM Framework that helps in identifying what types of files the robot is processing.
Um arquivo pode ser classificado em um ou mais tipos de documentos, dependendo de seu conteúdo e dos métodos de classificação utilizados:
- se um arquivo contiver um único tipo de documento lógico (por exemplo, uma fatura ou um prontuário médico em sua totalidade), o componente de classificação deve ser configurado de acordo e retornar um único resultado de classificação;
- se um arquivo contiver vários tipos de documentos lógicos (por exemplo, contém uma fatura da página 1 à página 5 e um registro médico para as próximas 10 páginas, e um contrato de seguro da página 16 até o final), o componente de classificação deve retornar vários resultados de classificação, cada um correspondendo ao intervalo de páginas correto do arquivo de entrada.
Os Tipos de documentos nos quais a classificação é tentada são os definidos na Taxonomia do projeto.
Quando a Classificação de documentos deve ser usada.
Por um lado, se um projeto precisa processar arquivos que são todos do mesmo tipo de documento e estão sempre presentes como uma instância por arquivo (por exemplo, uma fatura em um arquivo), a classificação não é necessária e pode ser ignorada em sua totalidade.
Por outro lado, se o projeto estiver lidando com dois ou mais tipos de documentos (por exemplo, o fluxo de trabalho deve processar faturas e registros médicos que não podem ser distinguidos antes do processamento), ou espera-se que os arquivos contenham dois ou mais tipos de documentos distintos dentro deles (por exemplo, um arquivo contém 3 faturas), então a classificação é fortemente recomendada.
Como usar o componente de Classificação de documentos
Classification is done through the Classify Document Scope activity. To classify the documents, you can use one or more classifiers, as the scope activity has the role of configuring and executing one or more algorithms for document classification and of offering an easy, unitary configuration option for all your needs.
Resumindo, é isso que Classify Document Scope faz:
- Fornece a todos os Classificadores (algoritmos de classificação) as configurações necessárias para sua execução.
- Aceita um ou mais classificadores.
- Permite filtragem de tipo de documento, mapeamento de taxonomia e configurações de limite mínimo de confiança ao nível do classificador.
- Relata informações de classificação de forma unificada, independentemente da fonte de classificação.
The Classify Document Scope allows you to configure it by using the Configure Classifiers wizard. You can customize
- quais tipos de documentos são aceitos de cada classificador,
- qual é o limite mínimo de confiança para um determinado resultado que é aceitável para cada classificador,
- qual é o mapeamento de taxonomia, em nível de tipo de documento, entre a taxonomia do projeto e a taxonomia interna do classificador (se houver).
Please note that the order of the classifiers in the Classify Document Scope is important:
- os classificadores são executados com prioridade, da esquerda para a direita;
- um resultado de classificação retornado por um classificador é aceito se relatar um dos tipos de documentos aceitáveis e tiver um limite de confiança igual ou superior ao limite de confiança mínimo definido para esse classificador;
- um classificador é executado com os intervalos de páginas que permaneceram não classificados apenas pelos classificadores anteriores (assim pode ser chamado várias vezes em uma execução).
Classificadores disponíveis
Com base nos requisitos do caso de uso, você pode escolher entre vários métodos de classificação, chamados de classificadores.
Classifiers can be found in the UiPath.IntelligentOCR.Activities or UiPath.DocumentUnderstanding.ML.Activities packages.
Os classificadores disponíveis são:
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Machine Learning Classifier
- Classificador Generativo
Você pode construir seu próprio Classificador utilizando os Contratos de Processamento de Documentos públicos, podendo assim implementar qualquer algoritmo que se adeque ao seu caso de uso.