activities
latest
false
UiPath logo, featuring letters U and I in white

Atividades de Document Understanding

Última atualização 5 de dez de 2024

OmniPage OCR

UiPath.OmniPage.Activities

Importante: o reconhecimento de escrita funciona apenas para texto impresso à mão, onde os caracteres não têm uma conexão. O tamanho ideal para um documento está entre 25 e 45 pixels.

Description

Extrai uma string e suas informações de um elemento ou imagem de interface do usuário indicado usando o OmniPage OCR Engine. O OmniPage OCR é uma alternativa aos outros mecanismos de OCR, em todas as atividades que requerem implementações de mecanismos de OCR. Aqui estão alguns exemplos de atividades que podem ser usadas junto com o OmniPage OCR:Clique em Texto OCR, Passe o mouse em Texto OCR, Clique duas vezes em Texto OCR, Obter texto OCR, Localizar posição de texto OCR, Digitalizar documento, Escopo da tela CV, Obter texto CV.

Nota: O pacote UiPath.OmniPage.Activities, v1.9.0 ou superior, foi atualizado para .NET5 core. Essa alteração implica ter a estrutura .NET5 instalada em sua máquina se o pacote for executado em um fluxo de trabalho herdado não Windows.
Nota: A atividade OmniPage OCR é compatível com o pacote UiPath.IntelligentOCR.Activities, v2.0.0 ou superior e pode ser usada em qualquer contexto de OCR.

Compatibilidade do projeto

Windows-Legacy | Windows

Configuração

Painel de Propriedades

Comum

  • NomeDeExibição - o nome de exibição da atividade.

Entrada

  • Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis Image.

Diversos

  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.

Opções

  • PacoteDeMecanismo - Especifica qual mecanismo incorporado deve ser usado para o processamento de imagens. Há duas opções, conforme a seguir: Básico - suporta uma ampla gama de idiomas, Estendido - contém suporte extra para idiomas asiáticos, árabe, tailandês, hebraico e vietnamita. Verifique a lista de todos os idiomas disponíveis para o pacote Básico no final desta página.
    Observação: para usar o mecanismo estendido , você deve instalar manualmente o pacote UiPath.OmniPage.Bundle.Extended no projeto atual do Gerenciador de pacotes.
  • ExtractWords - Se selecionado, extrai a posição na tela de todas as palavras detectadas.
  • Idioma - O idioma usado pelo mecanismo de OCR. A opção padrão é auto, o que significa que o idioma é detectado automaticamente. Vários idiomas podem ser usados separados por vírgulas.
    Observação:

    Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.

    Observe que as configurações dos idiomas japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.

    Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.

  • Perfil - Escolha um perfil de pré-processamento para a imagem especificada ou elemento de interface gráfica para alcançar uma leitura de OCR melhor. As seguintes opções estão disponíveis:
    • Nenhum - não aplica um perfil de pré-processamento, essa é a opção padrão;
    • Tela - pré-processamento adequado para aplicativos de áreas de trabalho remotas;
    • Digitalização - pré-processamento adequado para arquivos digitalizados;
    • Legado - usa as configurações padrão do mecanismo para pré-processar imagens.
  • Escala - O fator de escala do elemento ou imagem da interface do usuário selecionada. Quanto maior o número, mais você amplia a imagem. Isso pode fornecer uma melhor leitura de OCR e é recomendado para imagens pequenas. Se você deseja reduzir, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.
    Observação: se você quiser usar essa atividade OCR do pacote UiPath.OmniPage.Activities v1.8.0 no Studio v19.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior.
    Importante: imagens de tamanho grande podem resultar em erro quando o fator de escala for maior que 1.

Saída

  • Resultado - O texto extraído pelo mecanismo de OCR junto com sua posição na tela, armazenado em um KeyValuePair<Rectangle,String>. Este campo suporta apenas KeyValuePair<Rectangle,String>.
  • Texto - O texto extraído pelo mecanismo de OCR, armazenado em uma variável String. Este campo suporta apenas String variáveis.

Idiomas suportados

A tabela a seguir mostra uma lista de todos os idiomas suportados pelo OmniPage OCR, bem como seus códigos de idioma correspondentes.

Tabela 1. Idiomas e códigos de idioma suportados para OmniPage OCR - Idiomas do Pacote Básico
 

Código de idioma

Africâner

AFR

Albanês

SQI

aimará

AYM

Basco

EUS

bemba

BEM

Blackfoot

BLA

Brasileiro

QBP

Bretão

BRE

Bugotu

BGT

Búlgaro

BUL

bielorrusso

BEL

Catalão

CAT

Chamorro

CHA

Checheno

CHE

corso

COS

Croata

HRV

Corvo

CRO

Checo

CES

Dinamarquês

DAN

Holandês

NLD

English

ENG

Esquimó (Inuit)

QES

esperanto

EPO

Estoniano

EST

faroense

FAO

Fijiano

FIJ

Finlandês

FIN

Francês

FRA

frísio

FRY

Friulano

FUR

Gaélico (irlandês)

GLE

Gaélico (escocês)

GLA

Galego

GLG

Ganda

LUG

Alemão

DEU

Grego

ELL

guarani

GRN

Hani *

HNI

havaiano

HAW

Húngaro

HUN

Islandês

ISL

Ido

IDO

Indonésio

IND

Interlingua

INA

Italiano

ITA

Kasub

CSB

Kawa*

WBM

Kikuyu

KIK

Congo

KON

Kpelle

KPE

curdo *

KUR

Latim

LAT

Letão

LAV

Lituano

LIT

luba

LUA

Luxemburguês

LTZ

Macedônio

MKD

Malgaxe

MLG

Malaio

MSA

Malinke

MLQ

maltês

MLT

maori

MRI

maia

MYN

Miao*

HMN

Minangkabau

Mín.

moicano

MOH

moldávio

MOL

náuatle

NAH

Norueguês

NOR

Nyanja

NYA

Ocidental

OCC

Ojibway

OJI

papiamento

PAP

Inglês pidgin

TPI

Polonês

POL

Português

POR

Provençal

PRV

Quechua

QUE

rético

ROH

Romeno

RON

romani

ROM

Ruanda

KIN

Rundi

Executar

Russo

RUS

Sami

SMI

Sami, Lule

SMJ

Sami, Norte

SME

Sami, Sul

SMA

samoano

SMO

sardo

SRD

Sérvio

SRP

sérvio, latino

QSL

Shona

SNA

sioux

DAK

Eslovaco

SLK

Esloveno

SLV

somali

SOM

Sorbian (Wend)

WEN

sotho

SOT

Espanhol

SPA

Sundanês

Dom

Suaíli

SWA

suazi

SSW

Sueco

SWE

Tagalog

TGL

taitiano

TAH

pirez

QTI

Tonganês

TON

Tswana (Chuana)

TSN

Tun *

TUG

Turco

TUR

Ucraniano

UKR

Visayan

QIS

Galês

CYM

Wolof

WOL

xhosa

XHO

zapoteca

ZAP

Zulu

ZUL

= Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino.

 
Tabela 2. Idiomas e códigos de idioma suportados para o OmniPage OCR - Idiomas do pacote estendido
 

Código de idioma

Todos os idiomas incluídos no Basic Pack

 

Japonês

JPN

Chinês simplificado

QCS

Chinês tradicional

QCT

Coreano

KOR

Tailandês

THA

Árabe

ARA

Hebraico

HEB

vietnamita (latim)

VIE

Nota: O Extended Pack pode ser usado com os códigos de idioma ISO/DIS 639-3 mencionados acima, com os códigos de idioma ISO 639-1 e ISO 639-2 ou com o nome real do idioma.
  • Description
  • Compatibilidade do projeto
  • Configuração
  • Idiomas suportados

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.