- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos 2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Declarações de fechamento de hipoteca dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
- Carregue documentos e classifique-os automaticamente.
- Carregue documentos diretamente nos tipos de documentos.
- Gerenciar arquivos do projeto (adicionar, remover arquivos e adicionar, alterar tags).
- Anotar documentos.
- Adicione ou remova campos.
- Tenha uma experiência guiada sobre treinamento de modelos de classificação e extração usando as recomendações.
Depois de criar com sucesso seu projeto e carregar seus documentos para um tipo de documento específico, eles serão pré-anotados automaticamente. Isso é feito usando uma combinação de modelos generativos e especializados, com base no esquema do tipo de documento. O esquema define claramente os campos que você deseja extrair de um tipo de documento específico. Para encontrar o esquema do tipo de documento, acesse a página Anotação e verifique a seção Campos.
Para obter informações mais detalhadas sobre como anotar seus documentos, consulte a página de tutorial Anotar documentos.
Você pode usar documentos que foram validados na Validation Station para melhorar ainda mais o desempenho de seus modelos.
Se houver alguma alteração após a etapa de validação, o botão Exceções para revisão será exibido para o tipo de documento impactado.
Para obter informações mais detalhadas sobre como retreinar seus modelos, consulte a página de instruções sobre como treinar extratores.
Depois de carregar seus documentos, você pode adicionar tags a eles.
Você pode adicionar uma tag com até 100 caracteres para cada documento.
Para adicionar uma tag aos documentos, selecione os documentos que deseja adicionar e selecione o botão Tags no menu acima da lista de tipos de documento.
Filtre usando tags para pesquisar seus documentos. Você também pode verificar os resultados por tags no arquivo de configuração avançada quando um modelo é treinado.
Você pode editar as configurações de vários campos no Gerenciador de tipos de documento.
Para chegar lá, selecione o ícone de três pontos ⋮ ao lado do tipo de documento que você deseja editar e selecione Gerenciador de tipo de documento no menu.
Campos de extração
Edição ou adição de novos campos
- Nome do campo: o nome exclusivo do campo.
- Tipo de conteúdo: o tipo de conteúdo do campo:
- String: usada para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que você queira criar a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
- Número: usado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
- Data: analisar, formatar e unificar a saída usando o formato AAAA-MM-DD.
- Telefone: use para o número de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
- Número de ID: usado para códigos alfanuméricos, números de IDs. É semelhante ao tipo de conteúdo da string, mas remove todos os caracteres que vêm antes do caractere
:
. Se o número de ID que você precisa extrair puder conter:
caracteres, use o tipo de conteúdostring
para evitar a perda de dados.
- Atalho: a tecla de atalho do campo. É permitido usar uma tecla ou uma combinação de duas teclas.
- Configurações avançadas: as opções disponíveis diferem dependendo do tipo de Conteúdo do campo selecionado. Selecione o botão Configurações avançadas para o campo que deseja editar:
Figura 3. Configurações avançadas do tipo de documento
- ID do campo: o ID exclusivo para o campo.
- Pós-processamento:
- first_span: se o modelo previr mais de uma instância de um campo em um documento, faça com que ele retorne a primeira.
- longest_value: se o modelo previr mais de uma instância de um campo em um documento, faça com que ele retorne o valor com o maior número de caracteres.
- highest_confidence: se o modelo previr mais de uma instância de um campo em um documento, faça com que ele retorne o valor com a maior confiança.
- exact_match: a previsão só será considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela for diferente, mesmo que seja por apenas um caractere, será considerada incorreta (pontuação de 0). Esta é a configuração padrão para todos os campos, exceto para campos String.
- levenshtein: a previsão será considerada parcialmente correta de acordo com a distância Levenshtein entre a previsão e o valor verdadeiro. Por exemplo, se um valor de 10 letras for previsto corretamente exceto pelos dois últimos caracteres, a pontuação dessa previsão será de 0,8.
- Formato de data: este campo está disponível apenas para campos com tipo de conteúdo Data e indica como datas ambíguas são analisadas e retornadas:
- Auto
- Estilo dos EUA: AAAA-DD-MM
- Estilo fora dos EUA: AAAA-MM-DD
- Multilinha: campos que abrangem várias linhas de texto (endereços ou descrições) precisam ter essa verificação. Caso contrário, apenas a primeira linha será retornada.
- Multivalor: o campo retorna uma lista com todos os valores detectados no documento.
Você também pode reordenar os campos a partir dessa exibição.
As alterações nas configurações do tipo de documento não são refletidas na nova versão do projeto se você publicar uma nova versão do projeto antes de disparar novamente um treinamento.
Solução alternativa: para evitar isso, treine novamente o tipo de documento após fazer modificações nos campos do tipo de documento. Você pode pontilhá-lo marcando ou confirmando documentos adicionais para esse tipo antes de publicar uma nova versão.
Pesquisar nomes de campo
Você pode pesquisar pelos nomes de campos disponíveis. Para fazer isso, use a barra de pesquisa no canto superior esquerdo da interface do Gerenciador de tipos de documento. Para uma pesquisa mais eficiente, use a funcionalidade Filtrar para filtrar por Tipo de conteúdo.
Excluir campos
Selecione o botão Excluir ao lado do campo que você deseja excluir.
Campos de Classificação
Os campos de classificação são pontos de dados que se referem a um documento como um todo. Por exemplo, o tipo de despesa de um recibo (alimentação, hotel, companhia aérea ou transporte) ou a moeda de uma fatura (USD, EUR, JPY) são campos de classificação.
- Ao usar a atividade Extrair dados de documento, os campos de classificação são compatíveis para extratores de projetos modernos e modelos prontos para uso, mas não para extratores de projetos clássicos.
- Os campos de classificação são extraídos para tipos de documentos personalizados apenas após um treinamento bem-sucedido.
Edição ou adição de campos de classificação
Para adicionar um novo campo de classificação, selecione Adicionar campo e digite um nome para o novo campo.
Você também pode reordenar os campos a partir dessa exibição.
Para verificar o ID do campo de classificação, selecione Configurações avançadas ao lado do campo de classificação necessário.
Edição ou adição de classes
Para adicionar uma nova classe para um campo de classificação, selecione Adicionar classe e digite um nome de classe e uma descrição opcional.
Você pode editar o nome e a descrição para cada classe.
Você também pode reordenar as classes dessa visualização.
Para remover uma classe, selecione Excluir ao lado da classe que você deseja remover.
Configurações
Você pode alterar as configurações do tipo de documento na aba Configurações.
è possível alterar as seguintes configurações:
- Modelo base: as estimativas de tamanho do conjunto de dados usadas nas Ações recomendadas dependem do modelo base usado no treinamento. Usar o modelo de base mais semelhante ao tipo de documento reduzirá a quantidade da tarefa de anotação necessária.
- Número de idiomas: a estimativa de tamanho do conjunto de dados usada nas Ações recomendadas depende do número de idiomas no conjunto de dados. Mais idiomas geralmente exigem mais anotações.
- Tipo de documento: escolha o tipo de documento desejado na lista suspensa.
- Data de carregamento: escolha um intervalo de data em que o documento foi carregado.
- Status: escolha o status do documento.
- Tag: escolha as tags que você deseja filtrar.
Você pode verificar a pontuação geral do seu projeto no canto superior direito. Esta pontuação inclui as pontuações do classificador e do extrator para todos os tipos de documentos. Selecione Pontuação do projeto para exibir a seção Medir . Você pode verificar medições de desempenho em mais profundidade naquela seção.
Você pode verificar a pontuação para cada tipo de documento separadamente na seção Tipo de documento. Esta pontuação inclui o desempenho geral do modelo, além do tamanho e qualidade do conjunto de dados.
- Insatisfatório (0-49)
- Médio (50-69)
- Bom (70-89)
- Excelente (90-100)
Selecione Pontuações detalhadas do modelo para acessar a seção Medir para obter informações detalhadas.