Process Mining — Transformações

process-mining

latest

false

Guia do usuário do Process Mining

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Transformações

Edite transformações de projeto dbt para aplicativos de processo que incluem arquivos de configuração de datas de vencimento e uma pasta de sementes.

Estrutura da pasta

Importante:

As informações nesta página são aplicáveis apenas para modelos de aplicativos que possuem arquivos de configuração de datas de vencimento e uma pasta seeds\ .

As transformações de um aplicativo de processo consistem em um projeto dbt . A tabela a seguir descreve o conteúdo de uma pasta de projeto dbt .

Pasta/Arquivo	Contém
`dbt_packages\`	o pacote `pm_utils` e suas macros.
`macros\`	pasta opcional para macros personalizadas
`models\`	`.sql` arquivos que definem as transformações.
`models\schema\`	`.yml` arquivos que definem testes nos dados.
`seeds`	`.csv` arquivos com definições de configuração.
`dbt_project.yml`	as configurações do projeto dbt .

Observação:

Os modelos de aplicativos Log de evento e Processo personalizado têm uma estrutura de transformações de dados simplificada. Os aplicativos de processo criados com esses modelos de aplicativos não têm essa estrutura de pastas.

dbt_project.yml

O arquivo dbt_project.yml contém as configurações do projeto dbt , que define suas transformações. A seção vars contém variáveis que são usadas nas transformações.

Formato de data/hora

Cada modelo de aplicativo contém variáveis que determinam o formato para análise de dados de data/hora. Essas variáveis devem ser ajustadas se os dados de entrada tiverem um formato de data/hora diferente do esperado.

Transformações de dados

As transformações de dados são definidas em arquivos .sql no diretório models\ . As transformações de dados são organizadas em um conjunto padrão de subdiretórios.

Confira Estrutura das transformações para obter mais informações.

The .sql files are written in Jinja SQL, which allows you to insert Jinja statements inside plain SQL queries. When dbt runs all .sql files, each .sql file results in a new view or table in the database.

Normalmente, os arquivos .sql têm a seguinte estrutura: Select * from {{ ref('Table_A') }} Table_A.

O código a seguir mostra um exemplo de consulta SQL.

select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA
select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA

Observação:

Em alguns casos, para aplicativos de processo criados com versões anteriores dos modelos de aplicativos, os arquivos .sql têm a seguinte estrutura:

Instruções Com: uma ou mais instruções com para incluir as subtabelas necessárias.

{{ ref(‘My_table) }} refere-se à tabela definida por outro .sql arquivo.
{{ source(var("schema_sources"), 'My_table') }} refere-se a uma tabela de entrada.

Consulta principal: a consulta que define a nova tabela.
Consulta final: normalmente uma consulta como Select * from table é usada no final. Isso facilita a criação de subseleções durante a depuração.

Para obter mais dicas sobre como escrever transformações de forma eficaz, consulte Dicas para escrever SQL.

Adição de tabelas de origem

Quando você carrega um novo arquivo de entrada, uma nova tabela de origem é adicionada automaticamente em models\schema\sources.yml no projeto dbt . Dessa forma, outros modelos podem referenciá-lo usando {{ source(var("schema_sources"), 'My_table') }}. ConfiraGerenciamento de dados de entrada para obter mais informações sobre como configurar tabelas de entrada.

A ilustração a seguir mostra um exemplo.

Para obter informações mais detalhadas, consulte a documentação oficial do dbt em Origens.

Saída de dados

As transformações de dados devem gerar o modelo de dados exigido pelo aplicativo correspondente; cada tabela e campo esperados devem estar presentes.

Se você quiser adicionar novos campos ao seu aplicativo de processo, você pode adicionar esses campos nas transformações.

Macros

As macros facilitam a reutilização de construções SQL comuns. Para obter informações detalhadas, consulte a documentação oficial do dbt sobre macros Jinja.

pm_utils

O pacote pm-utils contém um conjunto de macros que normalmente são usadas em transformações do Process Mining. Para obter mais informações sobre as macros pm_utils , consulte ProcessMining-pm-utils.

A ilustração a seguir mostra um exemplo de código Jinja chamando a macro pm_utils.optional() .

sementes

Sementes são arquivos csv usados para adicionar tabelas de dados às suas transformações. Para obter informações detalhadas, consulte a documentação oficial do dbt sobre sementes jinja.

No Process Mining, isso é normalmente usado para facilitar a configuração de mapeamentos em suas transformações.

Depois de editar os arquivos semente, execute o arquivo selecionando Executar arquivo ou Executar todos, para atualizar a tabela de dados correspondente.

Confira Configuração de atividades: definição da ordem da atividade e Simulação de potencial de automação para obter exemplos de uso de arquivos semente.

Testes

A pasta models\schema\ contém um conjunto de arquivos .yml que definem os testes. Estes validam a estrutura e o conteúdo dos dados esperados. Para obter informações detalhadas, consulte a documentação oficial do dbt sobre testes.

Projetos dbt

As transformações de dados são usadas para transformar dados de entrada em dados adequados para o Process Mining. As transformações no Process Mining são escritas como projetos dbt .

Esta página fornece uma introdução ao dbt. Para informações mais detalhadas, consulte a documentação oficial do dbt.

pm-utils package

Os modelos de aplicativos do Process Mining vêm com um pacote dbt chamado pm_utils. Esse pacote pm-utils contém funções utilitárias e macros para projetos dbt do Process Mining. Para obter mais informações sobre o pm_utils , consulte ProcessMining-pm-utils.

Atualização da versão pm-utils usada para seu modelo de aplicativo

A UiPath® melhora constantemente o pacote pm-utils adicionando novas funções.

Quando uma nova versão do pacote pm-utils é lançada, é recomendável atualizar a versão usada em suas transformações para garantir que você esteja usando as funções e macros mais recentes do pacote pm-utils .

Você encontra o número da versão mais recente do pacote pm-utils no painel Versões do ProcessMining-pm-utils.

Siga estas etapas para atualizar a versão pm-utils em suas transformações.

Baixe o código-fonte (zip) da versão de pm-utils.
Extraia o arquivo zip e renomeie para a pasta pm_utils.
Exporte as transformações do editor de transformações de dados em linha e extraia os arquivos.
Substitua a pasta pm_utils das transformações exportadas pela nova pasta pm_utils .
Compacte o conteúdo das transformações novamente e importe-o no editor Transformações de dados .

Esta página foi útil?

AnteriorModelo do processo de descoberta

AvançarMétricas personalizadas de tempo de transferência

Estrutura da pasta​

dbt_project.yml​

Formato de data/hora​

Transformações de dados​

Adição de tabelas de origem​

Saída de dados​

Macros​

pm_utils​

sementes​

Testes​

Projetos dbt​

pm-utils package​

Atualização da versão pm-utils usada para seu modelo de aplicativo​