- Notas relacionadas
- Antes de empezar
- Primeros pasos
- Integraciones
- Trabajar con apps de proceso
- Trabajar con paneles y diagramas
- Trabajar con diagramas de proceso
- Trabajar con modelos de proceso Descubrir e Importar modelos BPMN
- Showing or hiding the menu
- Información del contexto
- Exportar
- Filtros
- Envío de ideas de automatización a UiPath® Automation Hub
- Etiquetas
- Fechas límite
- Comparar
- Comprobación de conformidad
- Análisis de causa raíz
- Simular el potencial de automatización
- Triggering an automation from a process app
- Ver datos del proceso
- Creación de aplicaciones
- Cargar datos
- Personalizar apps de proceso
- Plantillas de la aplicación
- Recursos adicionales
- Etiquetas y fechas de vencimiento listas para usar
- Editar transformaciones de datos en un entorno local
- Setting up a local test environment
- Designing an event log
- Ampliar la herramienta de extracción de SAP Ariba
- Características de rendimiento
Process Mining
Transformaciones
Las transformaciones de una aplicación de proceso consisten en un proyecto dbt . A continuación se muestra una descripción del contenido de una carpeta de proyecto dbt .
Carpeta/Archivo |
Contiene |
---|---|
|
el paquete
pm_utils y sus macros.
|
|
registros creados al ejecutar dbt. |
|
macros personalizadas. |
|
.sql archivos que definen las transformaciones.
|
|
.yml archivos que definen las pruebas en los datos.
|
|
Archivos
.csv con ajustes de configuración.
|
|
la configuración del proyecto dbt. |
Consulta la siguiente ilustración.
El archivo dbt_project.yml contiene la configuración del proyecto dbt que define sus transformaciones. La sección vars contiene variables que se usan en las transformaciones.
Formato de fecha / hora
Cada plantilla de aplicación contiene variables que determinan el formato para analizar los datos de fecha / hora. Estas variables deben ajustarse si los datos de entrada tienen un formato de fecha / hora diferente al esperado.
.sql
en el directorio models\
. Las transformaciones de datos están organizadas en un conjunto estándar de subdirectorios:
1_input
:2_entities
:3_events
:4_event_logs
:5_business_logic
.
Consulta Estructura de las transformaciones.
.sql
están escritos en Jinja SQL, lo que te permite insertar instrucciones Jinja dentro de consultas SQL simples. Cuando dbt ejecuta todos los archivos .sql
, cada archivo .sql
da como resultado una nueva vista o tabla en la base de datos.
.sql
tienen la siguiente estructura:
-
Con instrucciones: una o más instrucciones con para incluir las tablas secundarias necesarias.
{{ ref(‘My_table) }}
se refiere a la tabla definida por otro archivo .sql archivo.{{ source(var("schema_sources"), 'My_table') }}
se refiere a una tabla de entrada.
- Consulta principal: la consulta que define la nueva tabla.
-
Consulta final: normalmente se utiliza una consulta como
Select * from table
al final. Esto facilita hacer subelecciones durante la depuración.
Para obtener más consejos sobre cómo escribir transformaciones de forma efectiva, consulta Consejos para escribir SQL.
models\schema\sources.yml
. De esta manera, otros modelos pueden referirse a ella usando {{ source(var("schema_sources"), 'My_table') }}
. Consulta la siguiente ilustración para ver un ejemplo.
sources.yml
.
Para obtener más información sobre el uso de tablas de origen en las consultas, consulta Estructura de las transformaciones:1. Entrada. Para obtener más información detallada, consulta la documentación oficial de dbt en Fuentes.
Las transformaciones de datos deben generar el modelo de datos que requiere la aplicación correspondiente; todas las tablas y campos esperados deben estar presentes.
models\5_business_logic
no deben eliminarse. Además, los campos de salida de las consultas correspondientes no se deben eliminar.
Si quieres añadir nuevos campos a tu aplicación de proceso, puedes añadir estos campos en las transformaciones.
dbt docs
para generar un sitio de documentación para el proyecto dbt y abrirlo en tu explorador predeterminado. El sitio de documentación también contiene un gráfico de linaje que proporciona un diagrama de relación de entidad con una representación gráfica de la vinculación entre cada tabla de datos de tu proyecto.
dbt docs
.
Las macros facilitan la reutilización de construcciones SQL comunes. Para obtener información detallada, consulta la documentación oficial de dbt sobre macros Jinja.
pm-utils
contiene un conjunto de macros que se usan normalmente en las transformaciones de Process Mining. Para obtener más información sobre las macros pm_utils
, consulta ProcessMining-pm-utils.
pm_utils.optional()
.
csv
que se utilizan para añadir tablas de datos a tus transformaciones. Para obtener información detallada, consulta la documentación oficial de dbt sobre semillas de jinja.
En Process Mining, esto se usa normalmente para facilitar la configuración de las asignaciones en tus transformaciones.
Después de editar los archivos de inicialización, estos archivos no se actualizan automáticamente en la base de datos de forma inmediata. Para indicar a dbt que cargue el contenido del nuevo archivo de inicialización en la base de datos, ejecute
dbt seed
, que solo actualizará las tablas de archivos de inicialización, o-
dbt build
, que también ejecutará todos los modelos y pruebas.Nota: si el archivo de inicialización no tenía registros de datos inicialmente, es posible que los tipos de datos de la base de datos no se hayan configurado correctamente. Para solucionar este problema, llama arun dbt seed --full-refresh
. Esto también actualizará el conjunto de columnas en la base de datos.
models\schema\
contiene un conjunto de .yml
archivos que definen las pruebas. Validan la estructura y el contenido de los datos esperados. Para obtener información detallada, consulta la documentación oficial de dbt sobre pruebas.
sources.yml
en cada ingestión de datos. Esto se hace para comprobar si los datos de entrada tienen el formato correcto.
Las transformaciones de datos se utilizan para transformar los datos de entrada en datos adecuados para Process Mining. Las transformaciones en Process Mining se escriben como proyectos dbt .
Esta página le ofrece una introducción a dbt. Para obtener información más detallada, consulta la documentación oficial dela base de datos.
pm_utils
. Este paquete pm-utils
contiene funciones de utilidad y macros para proyectos dbt de Process Mining. Para obtener más información sobre pm_utils
, consulta ProcessMining-pm-utils.
pm-utils
añadiendo nuevas funciones.
pm-utils
, se recomienda actualizar la versión utilizada en tus transformaciones, para asegurarte de que utilizas las últimas funciones y macros del paquete pm-utils
.
pm-utils
en el panel Versiones de ProcessMining-pm-utils.
pm-utils
en sus transformaciones.
-
Descarga el código fuente (zip) de la versión de
pm-utils
. -
Extrae el archivo
zip
y cámbiale el nombre a la carpeta pm_utils. -
Exporta las transformaciones desde el editor de transformaciones de datos en línea y extrae los archivos.
-
Reemplaza la carpeta pm_utils de las transformaciones exportadas con la nueva carpeta pm_utils .
-
Vuelve a comprimir el contenido de las transformaciones e impórtalo en el editor de Transformaciones de datos .