- Visão geral
- Criação do modelo
- Validação do modelo
- Implantação do modelo
- API
- Perguntas frequentes
- Perguntas frequentes

Guia do usuário de Documentos complexos e não estruturados
Onde o recurso está disponível de forma geral
- Europa
- Estados Unidos
- Estados Unidos (região com atraso)
- Japão
- Canadá
- Austrália
- Reino Unido
Você também pode encontrar a lista de regiões em Serviços de nuvem globais.
O recurso está disponível para usuários Community?
Sim, o recurso está disponível para usuários Community, que têm acesso apenas a uma funcionalidade restrita, e todos os tenants ou projetos estão sujeitos a limites predefinidos de tempo de design e Runtime / runtime.Para obter mais detalhes, marque as seções Design-time e Runtime / runtime.
Quais são as opções de implantação de IXP? A capacidade está disponível no local?
Atualmente, os recursos de Extração e Processamento Inteligente (IXP) Communications Mining e Documentos complexos e não estruturados estão disponíveis apenas no UiPath® Automation Cloud™.
O Document Understanding está disponível nas implantações do Automation Cloud, do Automation Suite e em implantações autônomas. Para obter mais informações sobre opções de implantação do Document Understanding, verifique Escolhendo o tipo de implantação.
Quais idiomas são compatíveis no recurso?
Os usuários podem carregar documentos e criar modelos em qualquer idioma que seja compatível com o modelo selecionado dentro do IXP.
Quais formatos de arquivo são compatíveis no recurso?
Atualmente, a capacidade é compatível com os formatos de arquivo PNG, JPG ou JPEG, PDF e TIF ou TIFF.
A Extração e Processamento Inteligente (IXP) usa IA especializada ou generativa?
O Communications Mining usa recursos de IA especializados e IA generativa, onde todos os recursos de IA generativa podem ser desabilitados, se necessário.
O Document Understanding usa recursos de IA especializados e IA generativa, onde todos os recursos de IA generativa podem ser desabilitados, se necessário.
A extração generativa para Documentos complexos e não estruturados usa IA generativa por meio de LLMs de terceiros. Não é possível usar essa capacidade sem IA generativa.
O UiPath Helix está disponível no IXP?
O UiPath Helix Extractor 1.0 (IXP-Comms) está disponível no Communications Mining ao usar a funcionalidade Extração generativa.
O UiPath Helix Extractor 1.0 (IXP-Docs) e o UiPath Helix Extractor 2.0 (IXP-Docs) estão disponíveis no Document Understanding, apenas na experiência Moderna. Não está disponível na experiência do Document Understanding Classic.
Nenhum dos dois está disponível na capacidade de extração generativa para Documentos complexos e não estruturados.
A Extração e Processamento Inteligente (IXP) passa pela AI Trust Layer (AITL)?
Sim, todos os recursos da Extração e Processamento Inteligente (IXP) que usam LLMs de terceiros passam pela AITL da UiPath. O UiPath Helix é o modelo de família proprietário da UiPath, e as chamadas do Helix não passam pela AITL, pois são internas ao ambiente da UiPath.
Quais LLMs o recurso usa?
A visão GPT-4o e os modelos Gemini estão disponíveis na funcionalidade de Documentos complexos e não estruturados. O modelo do Gemini está disponível como uma funcionalidade de pré-processamento inteligente para dados tabulares e para potencializar a atribuição baseada em modelos.
O recurso habilita a assinatura BYO (trazer sua própria assinatura)?
Atualmente não, mas a assinatura BYO será compatível em versões futuras.
Posso migrar meu caso de uso da experiência do Document Understanding Classic para a capacidade de Documentos complexos e não estruturados de Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Posso migrar meu caso de uso da experiência moderna do Document Understanding para a capacidade de Documentos complexos e não estruturados de Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Posso migrar meu caso de uso das atividades do Extrator Generativo do Document Understanding para a capacidade de Documentos complexos e não estruturados da Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Existe algum limite de tempo de design para esse recurso?
Os limites de tempo de design incluem:
- Número de campos por grupo de campos: até 32 campos.
- Número de caracteres por nome do campo: até 128 caracteres.
- Número de caracteres por instrução de solicitação: até 4096 caracteres.Isso é aplicável para todas as solicitações, incluindo instruções gerais, instruções de grupo de campo, instruções de campo e instruções de tipo de campo.
Posso criar campos genéricos na capacidade de documentos?
Não, não há conceito de campos genéricos na Extração e Processamento Inteligente (IXP). Todos os campos precisam pertencer a um grupo de campos. Cada grupo de campos representa uma tabela separada, onde os campos significam colunas de tabela. No entanto, é possível definir um grupo de campos em nível pai representando um tipo de documento e adicionar mais campos gerais como uma tabela abaixo desse grupo de campos.
Os modelos de Documentos complexos e não estruturados da Extração e Processamento Inteligente (IXP) melhoram o desempenho com rotulagem ou anotações?
Não, o modelo ainda não aprende diretamente com as anotações do usuário. A maneira de melhorar atualmente o desempenho do seu modelo é modificar suas instruções de solicitação ou configuração do modelo. Um modelo ajustável que aprende com anotações estará disponível em uma versão futura.
Por que preciso fazer anotações em documentos se isso não melhora o desempenho do modelo?
Ainda é importante validar e anotar documentos para estabelecer a verdade fundamental para a avaliação de desempenho do modelo, que é capturada nas métricas de desempenho integradas na página Medir.
Quantos documentos preciso carregar para testar minhas instruções de solicitação?
Você deve carregar uma amostra representativa de seus documentos para cobrir todas as variações possíveis. Deve ser de pelo menos 20-30 documentos diferentes. É recomendável que você revise as previsões iniciais em 2 a 3 documentos e decida se precisa modificar suas instruções de solicitação antes de aumentar gradualmente a amostra de teste para 10, 20, 30 documentos, onde isso será um processo iterativo.
Quantos documentos preciso fazer para anotar e obter métricas de desempenho confiáveis?
Recomenda-se que você valide pelo menos 10 documentos ou 10 exemplos, ou ambos, para cada campo, para que o modelo possa fornecer estatísticas significativas de validação. Esse é o número mínimo de anotações e dependerá dos requisitos específicos do caso de uso.
Os modelos de Documentos complexos e não estruturados são consumidos por meio de robôs ou APIs independentes do Document Understanding?
Os modelos de Documentos complexos e não estruturados podem ser consumidos por meio de robôs e da API autônoma do Document Understanding Automation Cloud.
Como posso consumir saídas de Documentos complexos e não estruturados?
As saídas do modelo podem ser consumidas por meio de APIs, Atividades do Document Understanding ou Atividades IntelligentOCR. Certifique-se de:
- Instale o pacote IOCR v6.23.2-visualização ou mais recente e selecione a atividade Document Understanding Project Extractor
- Instale o pacote do Document Understanding v2.13.2-visualização ou mais recente e selecione a atividade Extract Document Data
A capacidade de Documentos complexos e não estruturados da Extração e Processamento Inteligente (IXP) fornece pontuações de confiança? Como eles são calculados?
Sim, fornecemos pontuações de confiança na resposta do modelo e no Action Center (runtime), mas não na interface do usuário da Extração e Processamento Inteligente (IXP) (tempo de design). Usamos as probabilidades de Token retornadas pelo LLM para estimar as confianças de campo e nível de extração.
As saídas do modelo de Documentos complexos e não estruturados podem ser consumidas de implantações híbridas, que são no modelo do Orchestrator ou do Automation Suite e Extração e Processamento Inteligente (IXP)?
Sim, isso é compatível por meio de Apps Externos. Para obter mais detalhes, verifique Apps OAuth.
As saídas do modelo de Documentos complexos e não estruturados podem ser consumidas de diferentes organizações ou tenants, que são Produção, Desenvolvimento ou UAT?
Sim, isso é compatível por meio de Apps Externos. Para obter mais detalhes, verifique Apps OAuth.
A estação de validação funciona com a capacidade de Documentos complexos e não estruturados?
Sim, funciona da mesma forma que os projetos do Document Understanding Moderno ou Clássico. No entanto, todos as extrações precisam para ser validadas como tabelas.
O modelo de Documentos complexos e não estruturados aprende com base na validação HITL de Action Center?
Não, atualmente não há um loop de feedback entre o Action Center e modelos de Documentos complexos e não estruturados. Isso está planejado para ser suportado para versões futuras junto com modelos ajustáveis.
Na prática, o Extração e Processamento Inteligente (IXP) pode extrair de forma confiável até aproximadamente 1.200 valores de Campo por Documento.
Isso significa que, se um documento exigir mais de 1.200 valores de campo para serem extraídos, o modelo pode atingir seu limite de tokens. Isso pode acontecer mesmo que o documento esteja bem dentro dos limites de páginas listados nesta seção. O trabalho de pesquisa e desenvolvimento está em andamento para oferecer suporte a limites de valor de campo mais altos em versões futuras.
Se os limites de tokens forem excedidos, as previsões podem estar incompletas ou vazias, independentemente do número de páginas. Por exemplo, um documento de 80 páginas com 1.400 valores de campo extraídos pode disparar um warning de limite de tokens na interface do usuário.No Runtime, quando o limite de tokens for excedido, a resposta da API mostrará isso retornando valores de confiança de ocorrência e extração de 0.
Se os limites de páginas forem excedidos, apenas as páginas dentro dos limites especificados abaixo são processadas. Ambos os comportamentos aplicam-se para o Gemini e GPT-4o.
Os limites de Runtime / runtime incluem:
- Número de páginas por documento:
- Para o Gemini, até 500 páginas.
- Para GPT-4o, 50 páginas e até 150 páginas usando a funcionalidade de visualização Particular de chamadas iterativas.
- Limites de tokens - Documentos com muitos dados com mais de 200 extrações, como tabelas longas, provavelmente atingirão o limite de tokens se tiverem um número típico de campos por extração.Se o GPT4-o atingir seu limite, você pode usar a funcionalidade de visualização privada de chamadas iterativas para aumentar a saída do campo.O Gemini, no entanto, tem um limite de tokens de saída mais alto por padrão, então ambos os modelos podem retornar quantidades semelhantes de valores de campo — Gemini em uma única chamada e GPT por meio de várias chamadas.
O recurso oferece alguma ferramenta de monitoramento? São diferentes dos projetos modernos do Document Understanding? Existem dependências do Insights?
Atualmente, a capacidade de Documentos complexos e não estruturados não fornece nenhum Recursos de monitoramento, como a página de Monitoramento em Projetos Modernos. Detalhes adicionais sobre recursos de monitoramento serão compartilhados em versões futuras.
Podemos monitorar o consumo de AI Unit para projetos de Documentos complexos e não estruturados?
Sim, você pode fazer isso por meio dos painéis de AI Unit do IXP do Insights e dos painéis de tenant de AI Unit.Para obter mais detalhes, consulte os painéis de consumo de AI Unit da Extração e Processamento Inteligente (IXP).
Podemos detectar automaticamente a decadência de desempenho, por exemplo, deriva de sados, pontuações F1 mais baixas e assim por diante?
Por enquanto, não fornecemos nenhuma notificação ou alertas de desempenho do modelo.
Com que frequência os usuários precisam atualizar seus modelos ou solicitações?
Isso depende de cada caso de uso, mas você deve refinar suas solicitações sempre que suas extrações estiverem com desempenho ruim.