- Visão geral
- Criação do modelo
- Validação do modelo
- Implantação do modelo
- Perguntas frequentes
- Perguntas frequentes

Guia do usuário de documentos não estruturados e complexos
Como os clientes e parceiros obtêm acesso à capacidade de documentos não estruturados e complexos da Extração e Processamento Inteligente (IXP)?
Os clientes e parceiros podem registrar seu interesse no Portal do Insider, pois a capacidade de documentos não estruturados e complexos está disponível no programa de visualização. Revisamos regularmente os registros e os clientes e parceiros selecionados são notificados para participar do programa de visualização. Certifique-se para fornecer o máximo de detalhes sobre o caso de uso possível.
Quando a capacidade estará oficialmente disponível de forma geral?
A data destino para lançar oficialmente a capacidade de documentos não estruturados e complexos é o final de julho de 2025. Os clientes selecionados podem participar de uma Disponibilidade Geral controlada durante o restante do período de visualização. Todos os casos de uso disponível controlados precisarão ser aprovados pela Equipe de Produto e suportados por suas respectivas equipes de conta.
O recurso está disponível para usuários Community?
Sim, o recurso está disponível para usuários Community, que têm acesso apenas a uma funcionalidade restrita, e todos os tenants ou projetos estão sujeitos a limites predefinidos de tempo de projeto e runtime. Para obter mais detalhes, consulte as seções Tempo de projeto e Runtime.
Quais são as opções de implantação de IXP? A capacidade está disponível no local?
Atualmente, os recursos de Extração e Processamento Inteligente (IXP) Communications Mining e Documentos não estruturados e complexos estão disponíveis apenas no UiPath® Automation Cloud™.
O Document Understanding está disponível nas implantações do Automation Cloud, do Automation Suite e em implantações autônomas. Para obter mais informações sobre opções de implantação do Document Understanding, verifique Escolhendo o tipo de implantação.
O recurso está disponível em todas as regiões?
Atualmente, o recurso de documentos não estruturados e complexos está disponível de modo geral nos tenants dos Estados Unidos e Europa, e disponível em pré-visualização particular nas regiões do Canadá, Japão e Austrália.
Quais idiomas são compatíveis no recurso?
Os usuários podem carregar documentos e criar modelos em qualquer idioma que seja compatível com o modelo selecionado dentro do IXP.
Quais formatos de arquivo são compatíveis no recurso?
Atualmente, a capacidade é compatível com os formatos de arquivo PNG, JPG ou JPEG, PDF e TIF ou TIFF.
A Extração e Processamento Inteligente (IXP) usa IA especializada ou generativa?
O Communications Mining usa recursos de IA especializados e IA generativa, onde todos os recursos de IA generativa podem ser desabilitados, se necessário.
O Document Understanding usa recursos de IA especializados e IA generativa, onde todos os recursos de IA generativa podem ser desabilitados, se necessário.
A extração generativa para documentos não estruturados e complexos usa IA generativa por meio de LLMs de terceiros. Não é possível usar essa capacidade sem IA generativa.
O CommPath e o DocPath estão disponíveis na Extração e Processamento Inteligente (IXP)?
O CommPath está disponível no Communications Mining ao usar a funcionalidade extração generativa.
O DocPath está disponível no Document Understanding, apenas na experiência moderna. Não está disponível na experiência do Document Understanding Classic.
Nenhum dos dois está disponível na capacidade de extração generativa para documentos não estruturados e complexos.
A Extração e Processamento Inteligente (IXP) passa pela AI Trust Layer (AITL)?
Sim, todos os recursos de Extração e Processamento Inteligente (IXP) que usam LLMs de terceiros passam pela AITL da UiPath. O CommPath e o DocPath são os modelos proprietários da UiPath e não passam pelo AITL.
Quais LLMs o recurso usa?
The GPT-4o vision and Gemini models are available in the Unstructured and complex documents capability. The Gemini model is available as an intelligent pre-processing feature for tabular data.
O recurso habilita a assinatura BYO (trazer sua própria assinatura)?
Atualmente não, mas a assinatura BYO será compatível em versões futuras.
Posso migrar meu caso de uso da experiência do Document Understanding Classic para a capacidade de documentos não estruturados e complexos de Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Posso migrar meu caso de uso da experiência moderna do Document Understanding para a capacidade de documentos não estruturados e complexos de Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Posso migrar meu caso de uso das atividades do Extrator Generativo do Document Understanding para a capacidade de documentos não estruturados e complexos da Extração e Processamento Inteligente (IXP)?
Ainda não, mas a funcionalidade de importação e exportação estará disponível em versões futuras.
Existe algum limite de tempo de design para esse recurso?
Os limites de tempo de design incluem:
- Número de campos por grupo de campos: até 32 campos.
- Number of characters per field name: up to 128 characters.
- Número de caracteres por solicitação de instrução: para até 2048 caracteres. Isso é aplicável para todas as solicitações, incluindo instruções gerais, instruções de grupo de campo, instruções de campo e instruções de tipo de campo.
Posso criar campos genéricos na capacidade de documentos?
Não, não há conceito de campos genéricos na Extração e Processamento Inteligente (IXP). Todos os campos precisam pertencer a um grupo de campos. Cada grupo de campos representa uma tabela separada, onde os campos significam colunas de tabela. No entanto, é possível definir um grupo de campos em nível pai representando um tipo de documento e adicionar mais campos gerais como uma tabela abaixo desse grupo de campos.
Os modelos de documentos não estruturados e complexos da Extração e Processamento Inteligente (IXP) melhoram o desempenho com rotulagem ou anotações?
Não, o modelo ainda não aprende diretamente com as anotações do usuário. A maneira de melhorar atualmente o desempenho do seu modelo é modificar suas instruções de solicitação ou configuração do modelo. Estamos pesquisando diferentes soluções, incluindo aprendizado em contexto, melhorias de feedback de instruções e modelos ajustáveis.
Por que preciso fazer anotações em documentos se isso não melhora o desempenho do modelo?
Ainda é importante validar e anotar documentos para estabelecer a verdade fundamental para a avaliação de desempenho do modelo, que é capturada nas métricas de desempenho integradas na página Medir.
Quantos documentos preciso carregar para testar minhas instruções de solicitação?
Você deve carregar uma amostra representativa de seus documentos para cobrir todas as variações possíveis. Deve ser de pelo menos 20-30 documentos diferentes. É recomendável que você revise as previsões iniciais em 2 a 3 documentos e decida se precisa modificar suas instruções de solicitação antes de aumentar gradualmente a amostra de teste para 10, 20, 30 documentos, onde isso será um processo iterativo.
Quantos documentos preciso fazer para anotar e obter métricas de desempenho confiáveis?
Recomenda-se que você valide pelo menos 10 documentos ou 10 exemplos, ou ambos, para cada campo, para que o modelo possa fornecer estatísticas significativas de validação. Esse é o número mínimo de anotações e dependerá dos requisitos específicos do caso de uso.
Existe algum limite de tempo de execução para a capacidade de documentos não estruturados e complexos?
Os limites de tempo de execução incluem:
-
Número de páginas por documento - Documentos de até 150 páginas. Os documentos com mais de 50 páginas exigirão uma funcionalidade de loop, que está atualmente em pré-visualização particular, e o acesso está disponível mediante solicitação.
Limites de token – Documentos com muitos dados com mais de 200 extrações, como tabelas longas, provavelmente atingirão o limite de token. Tais documentos exigirão uma funcionalidade de loop, que está atualmente em pré-visualização particular, e o acesso está disponível mediante solicitação.
Em uma versão pré-disponibilidade geral, esses limites devem ser aumentados significativamente.O limite aumentado para um documento será um produto do número de páginas e do número de valores de campo que precisam ser extraídos. Se a combinação desses dois for alta o suficiente, o limite máximo será atingido, mas a expectativa é suportar documentos com 100-200 páginas e um alto número de valores de campo que requerem extração.
Não há limite rígido para os valores de campo a serem extraídos, pois dependerá do documento. No entanto, se o limite de token for atingido, um indicador é fornecido na resposta da API para quaisquer previsões de documento em tempo de execução em que a ocorrência e a confiança de extração para uma extração serão retornadas como zero.
Atualmente, se mais de 50 páginas forem enviadas, sem a funcionalidade de loop, o recurso usa apenas as primeiras 50 páginas. Se os limites do token forem atingidos, ele retorna previsões vazias.
Os modelos de documentos não estruturados e complexos são consumidos por meio de robôs ou APIs independentes do Document Understanding?
Os modelos de documentos não estruturados e complexos podem ser consumidos por meio de robôs e da API autônoma do Document Understanding Automation Cloud.
Como posso consumir saídas de documentos não estruturados e complexos?
As saídas do modelo podem ser consumidas por meio de APIs, Atividades do Document Understanding ou Atividades IntelligentOCR. Certifique-se de:
- Instale o pacote IOCR v6.23.2-visualização ou mais recente e selecione a atividade Document Understanding Project Extractor
- Instale o pacote do Document Understanding v2.13.2-visualização ou mais recente e selecione a atividade Extract Document Data
A capacidade de documentos não estruturados e complexos da Extração e Processamento Inteligente (IXP) fornece pontuações de confiança?Como eles são calculados?
Sim, fornecemos pontuações de confiança na resposta do modelo e no Action Center (tempo de execução), mas não na interface do usuário da Extração e Processamento Inteligente (IXP) (tempo de design). Usamos as probabilidades de Token retornadas pelo LLM para estimar as confianças de campo e nível de extração.
As saídas do modelo de documentos não estruturados e complexos podem ser consumidas de implantações híbridas, que são no modelo do Orchestrator ou do Automation Suite e Extração e Processamento Inteligente (IXP)?
Sim, isso é compatível por meio de Apps Externos. Para obter mais detalhes, verifique Apps OAuth.
As saídas do modelo de documentos não estruturados e complexos podem ser consumidas de diferentes organizações ou tenants, que são Produção, Desenvolvimento ou UAT?
Sim, isso é compatível por meio de Apps Externos. Para obter mais detalhes, verifique Apps OAuth.
A estação de validação funciona com a capacidade de documentos não estruturados e complexos?
Sim, funciona da mesma forma que os projetos do Document Understanding Moderno ou Clássico. No entanto, todos as extrações precisam para ser validadas como tabelas.
O modelo de documentos não estruturados e complexos aprende com base na validação HITL de Action Center?
Não, atualmente não há um loop de feedback entre o Action Center e modelos de documentos não estruturados e complexos. Isso está planejado para ser suportado para versões futuras junto com modelos ajustáveis.
O recurso oferece alguma ferramenta de monitoramento? São diferentes dos projetos modernos do Document Understanding? Existem dependências do Insights?
Atualmente, a capacidade de documentos não estruturados e complexos não fornece nenhum Recursos de monitoramento, como a página de Monitoramento em Projetos Modernos. Detalhes adicionais sobre recursos de monitoramento serão compartilhados em versões futuras.
Podemos monitorar o consumo de AI Unit para projetos de documentos não estruturados e complexos?
Atualmente, não há rastreamento de consumo por projeto disponível. Após estar totalmente integrado, o consumo provavelmente aparecerá no painel de consumo da AI Unit e em um painel de documentos não estruturados e complexos separado
Podemos detectar automaticamente a decadência de desempenho, por exemplo, deriva de sados, pontuações F1 mais baixas e assim por diante?
Por enquanto, não fornecemos nenhuma notificação ou alertas de desempenho do modelo.
Com que frequência os usuários precisam atualizar seus modelos ou solicitações?
Isso depende de cada caso de uso, mas você deve refinar suas solicitações sempre que suas extrações estiverem com desempenho ruim.