process-mining
2024.10
true
UiPath logo, featuring letters U and I in white
Process Mining
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov de 2024

Recursos de desempenho

O tempo de resposta dos aplicativos Process Mining é determinado por muitos fatores. No entanto, em geral, o seguinte princípio vale:

  • Quanto menos dados, mais rapidez

No Process Mining, existem duas áreas com características de desempenho distintas: execuções de dados para carregar os dados, e painéis para visualizar os dados.

Dados de desenvolvimento versus dados de produção

No Process Mining, cada aplicativo de processo tem um estágio de desenvolvimento e um estágio publicado. Se o aplicativo desejado exigir um conjunto de dados grande, é recomendável usar um conjunto de dados menor (<10 milhões de registros) para desenvolver as transformações de dados e painéis.

O conjunto de dados de desenvolvimento é usado para testar as transformações de dados. Ele não afeta os dados exibidos nos painéis do app de processoss publicado. Quando seu app estiver pronto para ser usado por usuários de negócios, você poderá publicar o app e ingerir novos dados para uso no app de processos publicado.

Um cenário comum é usar um conjunto de dados com um prazo menor para o desenvolvimento, por exemplo, apenas 100 mil eventos em uma janela de tempo de 2 semanas. Ao publicar, um conjunto de dados maior, por exemplo, abrangendo 12 meses, pode ser usado.

Desempenho da execução de dados

As execuções de dados no Process Mining são disparadas nos seguintes casos de uso:

  • Criação de um aplicativo

  • Carregamento de dados

  • Disparando Aplicar a painéis , Executar todos ou Executar arquivo no editor de transformações de dados .

  • Publicar um aplicativo que tenha alterações nas transformações de dados.

Uma execução de dados normalmente consiste nas seguintes etapas, cada uma com características de desempenho diferentes:

1. Carregamento de dados

Ao carregar dados, o tamanho geral dos dados carregados no disco é o fator mais importante para a velocidade. Consulte Carregamento de dados. Os fatores que afetam o desempenho são:

  • O número de tabelas;

  • O número de registros nas tabelas;

  • O número de colunas nas tabelas;

  • Os dados nas tabelas. Por exemplo, uma coluna de descrição com várias linhas é mais lenta do que uma coluna booleana simples.

2. Transformação de dados

As transformações de dados alteram os dados de entrada para o modelo de dados que é necessário para os painéis. Consulte Transformações de dados.

Cada arquivo .sql nas transformações executa uma consulta SQL adicional. Os fatores a seguir afetam a velocidade das transformações de dados:
  • O número de arquivos .sql ;
  • O número de registros em cada tabela;

  • O número de colunas em cada tabela;

  • A complexidade da consulta SQL: condições de associação, número de Expressões de tabela comuns (CTEs) e expressões na consulta SQL.

3. Modelo de dados

O modelo de dados determina o conjunto de tabelas que ficam expostas aos painéis. Durante uma execução de dados, testes são executados para validar a estrutura dessas tabelas no modelo de dados. No entanto, a parte mais demorada são os pré-calculações que são feitas para acelerar a exibição de painéis posteriormente.

A velocidade geral dessa etapa é determinada por:

  • O número de tabelas no modelo de dados;

  • A relação entre as tabelas de saída;

  • O número de colunas nas tabelas de saída

  • O número de registros nas tabelas de saída.

4. Modelo de processo

A última parte de uma execução de dados é a execução de pré-computações para acelerar o gráfico do processo.

  • O número de variantes;

  • O número de eventos.

Se você usar um modelo BPMN de importação para exibir o processo, a complexidade do modelo BPMN também afeta o desempenho. Quanto mais atividades e bordas houver, mais lentas serão as computações.

Como melhorar o desempenho da execução de dados

Reduza o volume de dados

Para melhorar a velocidade do upload de dados, reduza o tamanho de seus dados para o mínimo necessário. Esse aviso é válido para todos os estágios dos dados:

  • Extraia apenas os dados de entrada necessários;

  • Transforme apenas os dados necessários;

  • Só adicione tabelas ao modelo de dados se for necessário para a análise de dados.

A maneira mais fácil de fazer isso é geralmente diminuir a janela de tempo usada para extração de dados, pois isso reduz o número de registros para a maioria das tabelas de dados da entrada para a transformação para a saída.

Quanto mais cedo você reduzir o tamanho dos dados, mais eficiente:

  • Filtre os arquivos sql o mais cedo possível em suas transformações de dados ou, se possível, na sua extração de dados.
  • Para o desenvolvimento, normalmente um conjunto de dados menor é usado. Para acelerar as consultas de teste, consulte Desenvolvimento versus produção de dados.

Reduzir tabelas e colunas de dados

Além disso, tome cuidado para carregar apenas colunas que sejam realmente usadas. Quanto mais cedo no processo eles puderem ser deixados de fora, melhor.

  • Reduza o conjunto de colunas de dados extraídos para o necessário.

  • Remova qualquer arquivo .sql que não seja necessário para o modelo de dados de saída.
  • Remova quaisquer colunas de dados desnecessárias nas consultas.

  • Remova quaisquer atividades desnecessárias do conjunto de eventos.

Reduzir complexidade

Quanto mais complicados forem os cálculos nas transformações de dados e o modelo de dados, mais lenta será a execução de dados. Reduzir a complexidade pode ser um desafio, mas pode ter um grande impacto no tempo de execução dos dados.

  • Reduza a complexidade das instruções SQL quando possível, consulte Dicas para escrever SQL .

  • Reduza os dados no modelo de dados para os dados necessários para a análise de dados. Quaisquer tabelas ou colunas que não são necessárias para a análise de dados devem ser removidas.

  • Se você estiver usando um modelo BPMN de importação para exibir o processo, manter o número de atividades e bordas baixo melhorará o desempenho.

Desempenho do painel

Em geral, os tempos de carregamento do painel são afetados pela quantidade de dados usados pelos gráficos e pelas métricas que são calculadas.

Sempre que um painel é carregado no Process Mining, cada gráfico é calculado em paralelo. A velocidade do carregamento de um gráfico é afetada pelos seguintes fatores:

  • O número de métricas exibidas no gráfico.

  • Para cada métrica, o tamanho da junção necessário para calcular a métrica é importante. Isso é determinado pela tabela usada para agrupar um gráfico, combinada com a tabela da métrica.

    • A complexidade da relação entre essas duas tabelas.

    • A distância entre essas duas tabelas no modelo de dados.

  • O tipo de dados dos campos usados. Campos numéricos são mais rápidos que campos de texto.

  • A complexidade das métricas em si. As métricas podem ser baseadas em vários campos.

Como melhorar o desempenho do painel

Remover qualquer métrica que não seja necessária para um gráfico acelerará o tempo de carregamento.

  • Considere os KPIs mostrados na barra superior;

  • Considere as métricas mostradas nos seus gráficos. Se um gráfico mostrar várias métricas, cada uma delas adiciona um tempo de cálculo adicional.

Simplificar a definição de métricas também pode acelerar o tempo de carregamento do gráfico.

  • Considere se você pode simplificar a definição de métricas;

  • Considere pré-computar partes da métrica nas transformações de dados. Qualquer cálculo estático que já tenha sido feito antes, não precisa ser feito no runtime.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.