activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding アクティビティ
Last updated 2024年10月29日

ドキュメントのデジタル化の手動検証

以下の例では、画像からデータを手動で抽出し、出力を別のファイルに表示する方法について説明します。これは、[ドキュメントをデジタル化][検証ステーションを提示] などのアクティビティを示します。これらのアクティビティは、UiPath.IntelligentOCR.Activities パッケージに含まれています。

注: このワークフローは UiPath.IntelligentOCR.Activities パッケージの古いバージョンを使用しています。

Steps:

  1. Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
    注: プロジェクト フォルダー内に必要なすべてのファイル (.json ファイルとすべての画像) を必ず追加してください。
  2. ワークフロー デザイナー[シーケンス] コンテナーを追加して、次の表に示す変数を作成します。
    表 1. 作成する変数

    変数名

    変数の型

    既定値

    Text

    文字列

     

    DOM

    UiPath.DocumentProcessing.Contracts.Dom.Document

     

    Data

    UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy

     

    DocumentTaxonomy

    UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy

     

    TaxonomyJSON

    文字列

     

    HumanValidated

    UiPath.DocumentProcessing.Contracts.Results.ExtractionResult

     
  3. シーケンス内に [テキスト ファイルを読み込み] アクティビティをドラッグします。
    • [プロパティ] パネルで [FileName] フィールドにファイルの名前 (この場合は、"taxonomy.json") を追加します。
    • Content (コンテンツ) フィールドに変数 TaxonomyJSON を追加します。
  4. [テキスト ファイルを読み込み] アクティビティの後に [代入] アクティビティを追加します。
    • [To] フィールドに変数 Data を追加し、[Value] フィールドに式 DocumentTaxonomy.Deserialize(TaxonomyJSON) を追加します。このアクティビティは抽出用のタクソノミーを構築します。
  5. [代入] アクティビティの下に [ドキュメントをデジタル化] アクティビティを追加します。
    • [プロパティ] パネルで [並列度] フィールドに値 1 を追加します。
    • [ドキュメント パス] フィールドに式 "Input\Invoice01.tif" を追加します。
    • [ドキュメント オブジェクト モデル] フィールドに変数 DOM を追加します。
    • [ドキュメント テキスト] フィールドに変数 Text を追加します。
  6. [ドキュメントをデジタル化] アクティビティ内に Google OCR エンジンを追加します。
    • [プロパティ] パネルで [Image] フィールドに変数 Image を追加します。
    • [ExtractWords] オプションのチェック ボックスをオンにします。このオプションは、検出されたすべての単語の画面上の位置を抽出します。
    • [Language] フィールドに式 "eng" を追加します。
    • Profile ドロップダウン リストからオプション Legacy を選択します。
    • [Scale] フィールドに値 2 を追加します。
  7. [ドキュメントをデジタル化] アクティビティの後に [検証ステーションを提示] アクティビティを追加します。
    • [プロパティ] パネルで [ドキュメント オブジェクト モデル] フィールドに変数 DOM を追加します。
    • [ドキュメント パス] フィールドに式 "Input\Invoice01.tif" を追加します。
    • [ドキュメント テキスト] フィールドに変数 Text を追加します。
    • [Taxonomy] フィールドに変数 Data を追加します。
    • [承認された抽出結果] フィールドに変数 HumanValidated を追加します。
  8. [検証ステーションを提示] アクティビティの下に [繰り返し (コレクションの各要素)] アクティビティを追加します。
    • [プロパティ] パネルで TypeArgument ドロップダウン リストからオプション UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint を選択します。
    • HumanValidated.ResultsDocument.FieldsValue (値) フィールドに追加します。
  9. [繰り返し (コレクションの各要素)]アクティビティの [本体] 内に [メッセージをログ] アクティビティを追加します。
    • [レベル] ドロップダウン リストからオプション Info を選択します。
    • item.FieldNameMessage フィールドに追加します。
  10. 最初の [メッセージをログ] アクティビティの下に [メッセージをログ] アクティビティを追加します。
    • [レベル] ドロップダウン リストからオプション Info を選択します。
    • item.Values(0).Value.ToStringMessage フィールドに追加します。
  11. [メッセージをログ] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
    • Text (テキスト) フィールドに値 "" を追加します。
  12. プロセスを実行します。ロボットは Intelligent OCR アクティビティを使用して、データを手動で処理し、結果を表示します。
この例を ZIP ファイルとしてダウンロードするには、こちらのリンクにアクセスしてください。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.