- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 - tipo de documento
- 1040 Schedule C - tipo de documento
- 1040 Schedule D - tipo de documento
- 1040 Schedule E - tipo de documento
- 1040x - tipo de documento
- 3949a - tipo de documento
- 4506T - tipo de documento
- 709 - tipo de documento
- 941x - tipo de documento
- 9465 - tipo de documento
- ACORD125 — tipo de documento
- ACORD126 — tipo de documento
- ACORD131 — tipo de documento
- ACORD140 — tipo de documento
- ACORD25 - tipo de documento
- Extratos bancários - tipo de documento
- ConhecimentoDeEmbarque - tipo de documento
- Certificado de Constituição - tipo de documento
- Certificado de origem — tipo de documento
- Cheques - tipo de documento
- Certificado de Segurança de Produto Secundário - tipo de documento
- CMS1500 — tipo de documento
- Declaração de Conformidade da UE - tipo de documento
- Demonstrações financeiras - tipo de documento
- FM1003 — tipo de documento
- I9 - tipo de documento
- Cartões de identificação — tipo de documento
- Faturas - tipo de documento
- Faturas da Austrália - tipo de documento
- FaturasChina - Tipo de documento
- Faturas em hebraico - tipo de documento
- Faturas da Índia - Tipo de documento
- Faturas do Japão - tipo de documento
- Envio de faturas - tipo de documento
- Listas de embalagem - tipo de documento
- Contracheques — tipo de documento
- Passaportes - tipo de documento
- Pedidos de compra - tipo de documento
- Recibos - tipo de documento
- Recibos Japão - tipo de documento
- Avisos de remessas - tipo de documento
- UB04 - tipo de documento
- Contas de serviços - tipo de documento
- Títulos de veículos - tipo de documento
- W2 - Tipo de documento
- W9 - tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
UiPath® DocPath
O modelo de linguagem abrangente (LLM) do DocPath é nossa tecnologia de modelo de extração de dados mais recente, projetada para substituir modelos de geração atuais usados dentro do UiPath® Document UnderstandingTM. Embora o DocPath opere de forma semelhante aos modelos anteriores, ele foi treinado usando uma ampla variedade de documentos. Isso permite que ele processe tipos de documentos comuns com pouco ou nenhum treinamento necessário. O que diferencia o DocPath LLM é sua arquitetura generativa, que melhora significativamente a precisão e simplifica a extração. Além disso, você também pode ajustar o modelo com seus conjuntos de dados exclusivos.
Para obter mais informações sobre a arquitetura do DocPath e as técnicas usadas para treinamento, consulte a página DocPath em nosso blog de IA.
Atualmente, o UiPath DocPath está disponível apenas para tenants baseados nos EUA em projetos modernos do Document Understanding.
- Os modelos de extração na região da Europa são baseados no DocPath, exceto para Faturas do Japão e Recibos do Japão.
- Os endpoints públicos para modelos de extração na Europa são baseados no DocPath, exceto para o seguinte:
- 9465
- Demonstrações financeiras
- Faturas da China
- Faturas em hebraico
- Faturas do Japão
- Recibos Japão
- Os seguintes endpoints públicos são baseados no DocPath na região do Japão:
- Faturas da China
- Faturas do Japão
- Recibos Japão
O DocPath LLM oferece inúmeros aprimoramentos em relação aos modelos anteriores. Melhora a precisão, especialmente com tabelas, adapta-se a vários layouts de documentos para reduzir os esforços de anotação e aumenta as taxas de automação.
- Precisão aprimorada: o DocPath LLM oferece uma taxa de precisão maior e uma pontuação F1 superior para documentos semiestruturados, como faturas, recibos e ordens de compra. Isso garante uma extração de dados precisa e consistente.
- Anotação sem esforço: o modelo reduz o trabalho manual exigindo apenas uma anotação por documento, eliminando a necessidade de anotar cada instância de campo em cada página.
- Automação aprimorada: com uma maior correlação entre nível de confiança e precisão, o DocPath LLM aprimora as taxas de automação enquanto reduz o número de documentos enviados ao Action Center para o mesmo nível de precisão.
Em nossos testes internos, o DocPath superou seu antecessor em desempenho. Reduziu a taxa de falsos positivos em cerca de 15% e a taxa de falsos negativos caiu quase 17%.
O DocPath LLM está disponível exclusivamente para projetos modernos do Document Understanding. Apesar da introdução do DocPath, todas as versões do projeto existentes ainda usarão versões de modelo atuais. Isso garante uma transição perfeita sem qualquer interrupção nos fluxos de trabalho de produção em andamento.
Para começar a treinar um tipo de documento existente no DocPath, desmarque e confirme todos os campos em alguns documentos.
Os nomes de campos que você escolher podem afetar muito o desempenho do modelo. Para garantir resultados ideais, use linguagem natural e gramática adequada para nomes de campos. Você deve usar apenas acrônimos amplamente reconhecidos, como Número (Nº), Conta (Cta), Endereço (End) e Apartamento (Apto). Atualmente apenas idiomas da Europa Ocidental são compatíveis, então certifique-se de que os nomes de campos escolhidos alinhem-se com esses idiomas. Abstenha-se de usar nomes não descritivos, como "Coluna 3", a menos que o documento use especificamente essa terminologia.
Atualmente, o UiPath DocPath é compatível apenas com idiomas de scripts latinos. Se você precisar treinar um modelo em idiomas de script não latinos, escolha o tipo de modelo legado. Se o modelo legado for selecionado, escolha o modelo de base apropriado para seu tipo de documento.
Para escolher entre o tipo de modelo DocPath ou legado, navegue até a guia Configurações no Document Type Manager e selecione o tipo de modelo necessário na lista suspensa Tipo de modelo .
- Os campos extraídos devem corresponder exatamente ao texto nos documentos. Esse processo não inclui resumo ou outros tipos de análise de texto.
- Os seguintes tipos de documentos não se baseiam atualmente no DocPath e ainda funcionam na geração anterior:
- Demonstrações financeiras
- Faturas da China
- Faturas em hebraico
- Faturas do Japão
O tipo de documento será treinado usando o modelo legado.
Atualmente, o UiPath DocPath não oferece suporte a idiomas de script não latinos.