Process Mining: transformaciones

process-mining

2024.10

false

Guía del usuario de Process Mining

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Transformaciones

Configura las transformaciones del proyecto dbt en Process Mining en Automation Suite, incluido el registro de eventos, los archivos de configuración de fechas de vencimiento y la estructura de carpetas de semillas.

Estructura de la carpeta

Importante:

La información de esta página solo es aplicable a las plantillas de aplicación que tienen archivos de configuración de fechas de vencimiento y una carpeta seeds\ .

Las transformaciones de una aplicación de proceso consisten en un proyecto dbt . La siguiente tabla describe el contenido de una carpeta de proyecto dbt .

Carpeta/Archivo	Contiene
`dbt_packages\`	el paquete `pm_utils` y sus macros.
`macros\`	carpeta opcional para macros personalizadas
`models\`	`.sql` archivos que definen las transformaciones.
`models\schema\`	`.yml` archivos que definen pruebas en los datos.
`seeds`	`.csv` archivos con los ajustes de configuración.
`dbt_project.yml`	la configuración del proyecto dbt .

Nota:

Las plantillas de aplicación Registro de eventos y Proceso personalizado tienen una estructura de transformaciones de datos simplificada. Las aplicaciones de proceso creadas con estas plantillas de aplicación no tienen esta estructura de carpetas.

dbt_project.yml

El archivo dbt_project.yml contiene la configuración del proyecto dbt que define tus transformaciones. La sección vars contiene variables que se utilizan en las transformaciones.

Formato de fecha / hora

Cada plantilla de aplicación contiene variables que determinan el formato para analizar los datos de fecha / hora. Estas variables deben ajustarse si los datos de entrada tienen un formato de fecha / hora diferente al esperado.

Transformaciones de datos

Las transformaciones de datos se definen en archivos .sql en el directorio models\ . Las transformaciones de datos se organizan en un conjunto estándar de subdirectorios.

Consulta Estructura de las transformaciones para obtener más información.

The .sql files are written in Jinja SQL, which allows you to insert Jinja statements inside plain SQL queries. When dbt runs all .sql files, each .sql file results in a new view or table in the database.

Normalmente, los archivos .sql tienen la siguiente estructura: Select * from {{ ref('Table_A') }} Table_A.

El siguiente código muestra un ejemplo de consulta SQL.

select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA
select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA

Nota:

En algunos casos, para las aplicaciones de proceso creadas con versiones anteriores de las plantillas de aplicación, los archivos .sql tienen la siguiente estructura:

Con declaraciones: una o más declaraciones con para incluir las subtablas necesarias.

{{ ref(‘My_table) }} se refiere a la tabla definida por otro archivo .sql archivo.
{{ source(var("schema_sources"), 'My_table') }} se refiere a una tabla de entrada.

Consulta principal: la consulta que define la nueva tabla.
Consulta final: normalmente se utiliza una consulta como Select * from table al final. Esto facilita la realización de subselecciones durante la depuración.

Para obtener más consejos sobre cómo escribir transformaciones de forma efectiva, consulta Consejos para escribir SQL.

Añadir tablas de origen

Para añadir una nueva tabla de origen al proyecto dbt , debe aparecer en models\schema\sources.yml. De esta manera, otros modelos pueden referirse a él utilizando {{ source(var("schema_sources"), 'My_table') }}. La siguiente ilustración muestra un ejemplo.

Importante:

Each new source table must be listed in sources.yml.

Para obtener información más detallada, consulta la documentación oficial de dbt en Fuentes.

Salida de datos

Las transformaciones de datos deben generar el modelo de datos que requiere la aplicación correspondiente; todas las tablas y campos esperados deben estar presentes.

Si quieres añadir nuevos campos a tu aplicación de proceso, puedes añadir estos campos en las transformaciones.

Macros

Las macros facilitan la reutilización de construcciones SQL comunes. Para obtener información detallada, consulta la documentación oficial de dbt sobre las macros de Jinja.

pm_utils

El paquete pm-utils contiene un conjunto de macros que se utilizan normalmente en las transformaciones de Process Mining. Para obtener más información sobre las macros pm_utils , consulta ProcessMining-pm-utils.

La siguiente ilustración muestra un ejemplo de código Jinja que llama a la macro pm_utils.optional() .

Semillas

Las semillas son archivos csv que se utilizan para añadir tablas de datos a tus transformaciones. Para obtener información detallada, consulta la documentación oficial de dbt sobre semillas de jinja.

En Process Mining, esto se utiliza normalmente para facilitar la configuración de las asignaciones en tus transformaciones.

Después de editar los archivos semilla, ejecuta el archivo seleccionando Ejecutar archivo o Ejecutar todo, para actualizar la tabla de datos correspondiente.

Consulta Configuración de actividades: definir el orden de las actividades y Simular el potencial de automatización para ver ejemplos de uso de archivos de semillas.

Configuración de actividad: definición del orden de actividad

El campo Activity_order se utiliza como desempate cuando se producen dos eventos en la misma marca de tiempo.

Opción 1: configuración de SQL

El siguiente código muestra un ejemplo de configuración de Activity_order con una instrucción SQL CASE :

    case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"
    case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"

Opción 2: archivo de semillas CSV

En lugar de utilizar una instrucción SQL CASE , puedes definir Activity_order utilizando el archivo activity_configuration.csv .

La siguiente ilustración muestra un archivo activity_configuration.csv de ejemplo:

Recomendaciones

La mayoría de las plantillas de aplicaciones de UiPath vienen con campos predefinidos para la configuración de actividades, que puedes adaptar a tus requisitos empresariales específicos. Si los campos predefinidos no están disponibles o son insuficientes, siempre puedes crear campos personalizados utilizando SQL o el archivo de semillas activity_configuration.csv , como se indica.

Pruebas

La carpeta models\schema\ contiene un conjunto de archivos .yml que definen pruebas. Estos validan la estructura y el contenido de los datos esperados. Para obtener información detallada, consulta la documentación oficial de dbt sobre pruebas.

Nota:

When you edit transformations, make sure to update the tests accordingly. The tests can be removed if desired.

Proyectos Dbt

Las transformaciones de datos se utilizan para transformar los datos de entrada en datos adecuados para Process Mining. Las transformaciones en Process Mining se escriben como proyectos dbt .

Esta página ofrece una introducción a dbt. Para obtener información más detallada, consulta la documentación oficial de dbt.

pm-utils package

Las plantillas de aplicación de Process Mining vienen con un paquete dbt llamado pm_utils. Este paquete pm-utils contiene funciones de utilidad y macros para proyectos dbt de Process Mining. Para obtener más información sobre pm_utils , consulta ProcessMining-pm-utils.

Actualizar la versión de pm-utils utilizada para la plantilla de su aplicación

UiPath® mejora constantemente el paquete pm-utils añadiendo nuevas funciones.

Cuando se lanza una nueva versión del paquete pm-utils , se recomienda actualizar la versión utilizada en tus transformaciones, para asegurarte de que utilizas las últimas funciones y macros del paquete pm-utils .

Encontrarás el número de versión de la última versión del paquete pm-utils en el panel Versiones de ProcessMining-pm-utils.

Siga estos pasos para actualizar la versión pm-utils en sus transformaciones.

Descarga el código fuente (zip) de la versión de pm-utils.
Extrae el archivo zip y cámbiale el nombre a la carpeta pm_utils.
Exporta las transformaciones desde el editor de transformaciones de datos en línea y extrae los archivos.
Reemplaza la carpeta pm_utils de las transformaciones exportadas con la nueva carpeta pm_utils .
Vuelve a comprimir el contenido de las transformaciones e impórtalo en el editor Transformaciones de datos .

¿Te ha resultado útil esta página?

AnteriorEtiquetas y fechas de vencimiento listas para usar

Sig.Métricas personalizadas de tiempo de procesamiento

Estructura de la carpeta​

dbt_project.yml​

Formato de fecha / hora​

Transformaciones de datos​

Añadir tablas de origen​

Salida de datos​

Macros​

pm_utils​

Semillas​

Configuración de actividad: definición del orden de actividad​

Opción 1: configuración de SQL​

Opción 2: archivo de semillas CSV​

Recomendaciones​

Pruebas​

Proyectos Dbt​

pm-utils package​

Actualizar la versión de pm-utils utilizada para la plantilla de su aplicación​

¿Te ha resultado útil esta página?

Estructura de la carpeta

dbt_project.yml

Formato de fecha / hora

Transformaciones de datos

Añadir tablas de origen

Salida de datos

Macros

pm_utils

Semillas

Configuración de actividad: definición del orden de actividad

Opción 1: configuración de SQL

Opción 2: archivo de semillas CSV

Recomendaciones

Pruebas

Proyectos Dbt

pm-utils package

Actualizar la versión de pm-utils utilizada para la plantilla de su aplicación