document-understanding

2022.10

false

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Document Understanding.

Regex Based Extractor

O que é o RegEx Based Extractor

O Regex Based Extractor é a ferramenta perfeita para casos de uso simples, nos quais, para determinados campos, os dados são sempre encontrados em um formato e contexto rigorosos e previsíveis. Em outras palavras, se você tiver um campo para o qual possa definir uma Expressão Regular que seja consistentemente boa quando correspondida, o Regex Based Extractor é uma boa escolha.

A atividade vem com um assistente de configuração que o ajuda a definir as expressões regulares para os campos que você deseja direcionar para extração de dados dessa maneira.

A atividade suporta campos simples e extração de campos de tabela.

Recomenda-se procurar outros métodos de extração, caso haja uma alta variabilidade do contexto e formato dos valores esperados. Nesses casos, um Form Extractor ou um Machine Learning Extractor pode ser mais adequado.

Este extrator não possui recursos de aprendizado (treinamento) e requer configuração antecipada.

Requisitos especiais

Não há requisitos especiais para usar o Regex Based Extractor.

Como configurar

Configuração da atividade

O Regex Based Extractor tem duas configurações principais a serem consideradas:

o assistente Configurar expressões regulares - que permite definir expressões regulares para determinados campos. Este assistente também disponibiliza o assistente Regex Editor, que o auxilia na construção de suas expressões regulares.
a configuração UseVisualAlignment - que permite controlar se as expressões regulares configuradas para um extrator devem ser aplicadas à saída de texto do componente de digitalização ou a uma versão de texto na qual as linhas de texto são organizadas visualmente e as palavras são reorganizadas em linhas com base em seu alinhamento visual.

Saiba mais

Saiba mais sobre o Assistente para Configurar expressões regulares seguindo este link.

Nesta página

O que é o RegEx Based Extractor
Requisitos especiais
Como configurar
Configuração da atividade
Saiba mais

Esta página foi útil?

AnteriorAssistente para configurar extratores de Escopo de Extração de Dados

AvançarForm Extractor