- Visão geral
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Dados e segurança
- Lógica de licenciamento e carregamento
- Como fazer
UiPath® DocPath
O modelo de linguagem grande do DocPath (LLM) é nossa mais recente tecnologia de modelo de extração de dados, projetada para substituir os modelos da geração atual usados no UiPath® Document UnderstandingTM. Embora o DocPath opere de maneira semelhante aos modelos anteriores, ele foi treinado usando uma grande variedade de documentos. Isso permite processar tipos de documentos comuns com pouco ou nenhum treinamento necessário. O que diferencia o DocPath LLM é sua arquitetura generativa, que melhora significativamente a precisão e simplifica a extração. Além disso, você também pode ajustar o modelo com seus conjuntos de dados exclusivos.
Para obter mais insights sobre a arquitetura DocPath e as técnicas usadas para treinamento, consulte a página DocPath em nosso blog de IA.
Atualmente, o UiPath DocPath está disponível apenas para tenants baseados nos EUA. O suporte para outras regiões está planejado para ser lançado no início de 2025.
O DocPath LLM oferece inúmeras melhorias em relação aos modelos anteriores. Melhora a precisão, especialmente com tabelas, adapta-se a vários layouts de documentos para reduzir os esforços de anotação e aumenta as taxas de automação.
- Precisão aprimorada: o DocPath LLM oferece uma taxa de precisão maior e uma pontuação F1 superior para documentos semiestruturados, como faturas, recibos e pedidos de compra. Isso garante uma extração de dados precisa e consistente.
- Anotação sem esforço: o modelo reduz o trabalho manual exigindo apenas uma anotação por documento, eliminando a necessidade de anotar cada instância de campo em todas as páginas.
- Automação aprimorada: com uma correlação maior entre nível de confiança e precisão, o DocPath LLM aprimora as taxas de automação ao mesmo tempo em que reduz o número de documentos enviados ao Action Center para o mesmo nível de precisão.
Em nossos testes internos, o DocPath superou seu antecessor em desempenho. Isso reduz a taxa de falsos positivos em cerca de 15% e a de falsos negativos em cerca de 17%.
O DocPath LLM está disponível exclusivamente para projetos modernos do Document Understanding. Apesar do lançamento do DocPath, todas as versões de projeto existentes ainda usarão versões de modelo atuais. Isso garante uma transição perfeita, sem qualquer interrupção nos fluxos de trabalho de produção em andamento.
Para começar a treinar um tipo de documento existente no DocPath, cancele a confirmação e confirme todos os campos em alguns documentos.
Os nomes de campo que você escolher podem afetar muito o desempenho do modelo. Para garantir resultados ideais, use linguagem natural e gramática adequada para nomes de campo. Você deve usar apenas acrônimos amplamente reconhecidos, como Número (Não), Conta (Acct), Endereço (Addr) e Espaço (Apt). Atualmente, apenas os idiomas da Europa Ocidental são suportados; portanto, certifique-se de que os nomes dos campos escolhidos se alinhem a esses idiomas. Evite usar nomes não descritivos, como "Coluna 3", a menos que o documento use especificamente essa terminologia.
- Os campos extraídos devem corresponder exatamente ao texto nos documentos. Esse processo não inclui o resumo ou outros tipos de análise de texto.
- O treinamento personalizado não é aplicável para os seguintes tipos de documento. Se você tentar usar o DocPath para isso, resultará em um erro:
- Faturas da China
- Faturas em hebraico
- Faturas do Japão