activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A tradução dos pacotes de Conetores disponíveis no Integration Service é efetuada automaticamente.
Atividades do Integration Service
Last updated 21 de out de 2024

Melhores práticas

Esta seção inclui informações sobre como usar a embasamento de contexto de forma eficaz.

Introdução

Para começar a usar o Embasamento de Contexto, siga estas etapas primeiro:

  1. Certifique-se de usar o Studio Web ou o Studio Desktop versão 2024.4 ou mais recente.
  2. No Automation Cloud, no Integration Service, estabeleça uma conexão com o conector de atividades da UiPath GenAI .

Como o embasamento de contexto interage com seus dados nas atividades da GenAI

Para usar a embasamento de contexto , você precisa de um conjunto de dados (por exemplo, um grupo de documentos) prontamente disponível. Em seguida, a ancoragem de contexto pode interagir com seus dados em três fases:

  1. Estabeleça sua origem de dados para Embasamento de contexto.
    • Use uma automação ou carregue arquivos diretamente em um bucket do Orchestrator, em uma pasta compartilhada do Orchestrator. A pasta do Orchestrator deve ser compartilhada, porque o Contexto embasado tem escopo de tenant.
    • Você deve ter permissões de Edição para essa pasta para garantir que você possa carregar ou remover documentos do bucket. Nenhuma permissão adicional é necessária.
  2. Ingerir dados de sua origem de dados para Embasamento de contexto.
  3. Consulte e confirme com seus dados.
    • Use a geração de conteúdo para consultar documentos e use as informações para ampliar ou embasar solicitações.

Gerenciamento do pipeline de ingestão

Embasamento de contexto na AI Trust Layer

No UiPath® Automation CloudTM Admin, como parte da experiência de administração do AI Trust Layer, você pode gerenciar e governar os dados que você usa como contexto com funcionalidades do UiPath GenAI.

Você pode criar e gerenciar índices de embasamento de contexto disponíveis em tenants específicos. Depois de criado, você pode consultar um índice de outros produtos e funcionalidades usando a GenAI, como Atividades da GenAI e Autopilot para todos.

Consulte Governança de dados contextuais para funcionalidades da GenAI no Guia do usuário Admin do Automation Cloud para saber como criar e gerenciar um índice.

Indexar e ingerir atividade da GenAI

A atividade Indexar e Ingerir (Visualização pública) fornece um mecanismo assíncrono para ingerir documentos que são carregados e armazenados em buckets do Orchestrator.

Na atividade Index and Ingerir (Visualização pública) , em Propriedades adicionais, o campo suspenso Tipo de dados permite especificar o tipo de arquivo que você gostaria de ingerir:

  • PDF - para ingerir arquivos PDF (seleção padrão).
  • CSV - para ingerir arquivos CSV.
  • JSON - para ingerir arquivos JSON.

Se você adicionar mais arquivos ao bucket do Orchestrator, será necessário executar novamente essa atividade para garantir que o índice permaneça atualizado.

O campo Padrão global do arquivo foi projetado para o tipo de arquivo que você definiu Tipo de dados:

  • Se você tiver um tipo de dados no bucket do Orchestrator (por exemplo, todos PDFs), selecione PDF na lista suspensa Tipo de dados e mantenha o valor padrão Glob do arquivo como *..
  • Se você tiver vários tipos de arquivo em seu bucket do Orchestrator, precisará especificar no menu suspenso Tipo de dados e no Padrão global do arquivo os tipos de dados que você deseja ingerir. Os padrões são os mesmos do tipo de dados. Especificamos a diferença para ajudar a esclarecer a solicitação de ingestão:
    • *.pdf para PDFs.
    • *.csv para CSVs.
    • *.json para JSONs.
Por exemplo: se você carregar PDFs para seu bucket do Orchestrator, você deve executar Indexar e Ingerir (Visualização pública) com seu índice, Tipo de dados definido como PDF e Padrão global do arquivo definido como *.. Em seguida, você carrega arquivos CSV para o mesmo bucket do Orchestrator. Você precisa executar o Index e o Ingerir (Visualização pública) novamente, selecionar o mesmo índice, mas definir o campo Tipo de dados como CSV e Padrão global do arquivo como *.CSV.

Siga um padrão semelhante ao remover documentos de sua origem de dados: ao reingerir por meio de Índice e Ingerir (Visualização pública), você precisa especificar o Tipo de dados e o arquivo Glob para garantir que a ingestão reconheça para remover esse tipo de documento do índice .

Observação: a ingestão e nova ingestão de arquivos CSV podem levar um pouco mais tempo do que outros tipos de dados.

Após criar um índice, atividades e outros produtos da UiPath podem usá-lo para consultar documentos importantes para seu caso de uso.

Tempo de ingestão

A ingestão é um processo assíncrono. Depois de executar a atividade, isso não significa que os dados podem ser consultados imediatamente. As cargas de ingestão menores são processadas mais rapidamente. Portanto, recomendamos que você carregue documentos em lotes e execute essa atividade periodicamente. A duração desse processo depende da quantidade de dados e de quantos outros usuários enviam solicitações de ingestão.

Após enviar a solicitação de ingestão, supondo que cada documento tenha menos ou igual a 1 MB, normalmente recomendamos aguardar:

  • <10 minutos: para 10 documentos ou menos;
  • <30 minutos: para 50 documentos ou menos;
  • até 2 horas: para 50 documentos ou mais.
Observação: eles não são SLAs ou SLOs. O desempenho depende da natureza dos documentos, tamanho e quantidade de solicitações simultâneas.

Execute a atividade Indexar e Ingerir (Visualização pública) cada vez que você adicionar ou excluir dados de sua origem de dados. Isso garante a paridade com sua origem de dados e as incorporações usadas para pesquisa e RAG.

O nome do índice pode não aparecer na atividade Geração de Conteúdo antes da conclusão da ingestão. Se você não encontrar o nome do índice na atividade Geração de Conteúdo :

Após executar a atividade Indexar e Ingerir (Visualização pública) , se você estiver usando um índice existente, selecione o menu do botão Forçar Atualização ao lado do campo Índice :

docs image

Erros comuns e padrões de resolução

  • Você pode receber um erro ("Nenhum resultado encontrado") se o trabalho de ingestão não tiver sido concluído.
  • Você pode receber um erro ("Nenhum esquema encontrado") se o trabalho de ingestão tiver falhado. Nesse caso, aguarde alguns minutos, tente novamente a consulta e repita a ingestão.
  • Você pode receber um erro ("Sincronização da origem de dados já está em progresso") que significa que você tem um trabalho de ingestão para esse índice que está atualmente em andamento. Aguarde alguns minutos e tente novamente a ingestão.

Você pode executar a atividade Indexar e Ingerir (Visualização pública) :

  • Manualmente (altamente recomendado).
  • Baseado em evento: configure uma automação para executar o pipeline de ingestão sempre que um novo documento for adicionado ou removido de um bucket de armazenamento. Faça isso se você adicionar ou remover regularmente documentos dos buckets.
  • Baseado em tempo: configure uma automação para executar o pipeline de ingestão de forma agendada. Faça isso se você esperar regularmente um alto volume de entrada/saída de documentos. Para que qualquer criação de gatilho funcione com essas atividades, você deve considerar que as instruções anteriores de ingestão são um processo assíncrono.

Excluir Índice

Use a atividade Delete Index (Visualização pública) se você quiser excluir o índice e as incorporações, removendo-os como uma fonte de dados que pode ser consultada de outras experiências de atividades da UiPath GenAI. Isso não exclui os documentos ou dados na origem de dados (por exemplo, buckets do Orchestrator).

Dica: para as atividades Index e Ingerir (Visualização pública) e Excluir índice (Visualização pública) , recomendamos o uso de um projeto do Studio separado para executá-las separadamente da atividade Geração de conteúdo (consulta/RAG). Dessa forma, o processo assíncrono de ingestão/exclusão pode ocorrer.

Consulta e RAG com embasamento de contexto

A atividade Geração de conteúdo apresenta duas opções para trabalhar com documentos: Recurso de arquivo e Índice existente.

Recurso de arquivo

A opção Recurso Arquivo permite que você use variáveis de arquivo de atividades anteriores (por exemplo, um documento baixado do Google Drive) e faça com que a Embasamento de Contexto execute um estilo just-in-time (JIT) de RAG. Isso significa que ele ingere o documento em um índice, pesquisa nele, aumenta o prompt e, então, exclui o índice, para que esses dados não sejam persistentes.

Observação:
  • No momento, a opção Recurso de arquivo suporta apenas o formato PDF.
  • Mantenha esses documentos menores (menos de 50 páginas). As atividades do Integration Service têm uma janela de tempo limite na qual todo o processamento acima deve ocorrer.

  • Se você tiver um PDF com imagens digitalizadas, recomendamos usar a opção Document Understanding OCR na atividade Extract Data após ter baixado um arquivo para extrair o texto dessas imagens (já que o Contexto embasamento ainda não suporta imagens). Passe essa saída extracted_data no prompt com esse Recurso de arquivo apontando para seu arquivo baixado.

Índice Existente

A opção Índice existente permite usar um índice criado com a atividade Indexar e Ingerir (Visualização pública) . Você consulta em um índice persistente no qual você ingeriu documentos de sua origem de dados. Você pode reutilizar esse índice quantas vezes quiser até excluí-lo.

Recomendamos usar a atividade Log Message após Content Generation em sua sequência de fluxo de trabalho para inserir a variável Top Generate Text e ver a resposta da geração LLM após a execução do fluxo de trabalho.

A atividade Content Generation também possui uma variável de saída chamada Citations String (Public Preview). Use-o como entrada em uma atividade Log Message para ver os resultados da pesquisa semântica usados para influenciar a saída da geração. Isso funciona apenas para tipos de dados PDF e JSON.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.