アクティビティ
最新
バナーの背景画像
連携アクティビティ (クラシック)
最終更新日 2024年4月22日

Analyze Multipage Document

[複数ページのドキュメントを分析] アクティビティは、Amazon Textract の StartDocumentAnalysis および GetDocumentAnalysis API を使用して、S3 バケットに格納された複数ページのドキュメント ( [バケット ]、[ ドキュメント名 ]、[ バージョン ]) を分析します。ドキュメントに表が含まれている場合は、最初の行に列ヘッダーが含まれているかどうかを示すか ([列ヘッダーの検出]) と、空の行を無視するかどうか ([空の行を無視]) を設定できます。

ドキュメントを分析すると、アクティビティはドキュメントのプロパティを PageDetailCollection オブジェクト ([ページ]) で返します。これは、Amazon Textract アクティビティ パッケージ以外の他のアクティビティで入力変数として使用できます。

[ 複数ページのドキュメントを分析] アクティビティは、基本的には 、[ドキュメント分析を開始]、[ドキュメント分析ステータスを取得]、および [ ドキュメント分析取得 ] アクティビティを 1 つのアクティビティに組み合わせたアクティビティです。

大事な: このアクティビティの以前のバージョンでは、[(Pages)] 出力パラメーターに PageDetail[] オブジェクトが返されていました。 2.0 ではこれを PageDetailCollection に変更し、メソッド呼び出しの RawJson プロパティを返すようにしました。このプロパティを配列で行うことはできませんでした。

動作のしくみ

以下の手順とメッセージ シーケンス ダイアグラムは、設計時 (つまり、アクティビティの依存関係と入/出力プロパティ) から実行時に至るまでの、アクティビティの動作のしくみの例を示したものです。

  1. セットアップ」の手順を完了します。
  2. プロジェクトに [Amazon スコープ] アクティビティを追加します。
  3. [Amazon スコープ] アクティビティ内に [ 単一ページのドキュメントを分析 ] アクティビティを追加します。
  4. S3 Storage の入力プロパティの値を入力します。
  5. [ 出力] セクションのプロパティのために PageDetailCollection 変数を作成し、入力します。
  6. アクティビティを実行します。

    • 入力したプロパティは、 AnalyzeDocument API に渡されます。
    • API は、[出力] セクションのプロパティ変数に PageDetail の値を返します。


プロパティ

以下のプロパティの値は、このアクティビティを UiPath Studio でプロジェクトに追加するときに指定します。



共通

表示名

アクティビティの表示名です。

属性

詳細

入力

String

Required

はい

既定値

Analyze Multipage Document

許容値

String または String 型変数を入力します。

備考

N/A

入力

ステータスの変更をポーリングするには外部の遅延メカニズムが必要な ドキュメント分析ステータスとは異なり、[複数ページのドキュメントを分析] には、初期ステータスチェック遅延 (InitialDelay) およびステータスチェック間隔 (StatusCheckInterval) を設定するための以下のオプションの入力プロパティが含まれています。

InitialDelay

アクティビティが Amazon Textract GetDocumentAnalysis API を呼び出して JobStatus の値を取得するまでの待機時間です。

属性

詳細

入力

Int32 (ミリ秒)

Required

いいえ

既定値

15000 (表示されません)

許容値

Int32 または Int32 型変数を入力します。

備考

値をミリ秒単位で入力します (例: 30000 回 30 秒)。値は 15000以上である必要があります。

大きなドキュメントを分析する場合は、Amazon Textract サービスが分析を完了するのに要する推定時間を入力することをお勧めします。 たとえば、ドキュメントの分析に最大で 2 分かかる場合は、値として「120000」と入力し、[ StatusCheckInterval] プロパティを使用して、ジョブが 2 分の予測内で完了しない場合に、更新されたステータスを確認する頻度を指定します。

StatusCheckInterval

Amazon Textract GetDocumentAnalysis API への呼び出しの間にジョブステータスの値を取得するまでに待機する時間です。

属性

詳細

入力

Int32 (ミリ秒)

Required

いいえ

既定値

10000 (表示されません)

許容値

Int32 または Int32 型変数を入力します。

備考

値をミリ秒単位で入力します (例: 15000 for 30 秒)。値は 10000以上である必要があります。

このプロパティの目的は、アクティビティが Amazon Textract API に対して行う呼び出しの数を管理することです。

オプション

分析の種類

実行する分析の種類を指定します。 [表] を使用して、入力ドキュメントで検出されたテーブルに関する情報を返し、検出されたフォーム データを返すフォームを使用します。

属性

詳細

入力

ENUM

Required

No.

既定値

すべて

許容値

すべて、表、フォーム

備考

N/A

DiscoverColumnHeaders

ドキュメントのテーブルに列ヘッダーを含めるかどうかを指定します。

属性

詳細

入力

チェックボックス

Required

いいえ

既定値

非選択

許容値

選択または非選択

備考

N/A

空の行を無視

ドキュメントの分析時に、ドキュメントの表内の空の行を無視するかどうかを指定します。

属性

詳細

入力

チェックボックス

Required

いいえ

既定値

非選択

許容値

選択または非選択

備考

N/A

S3 ストレージ

バケット

ドキュメントが保存される S3 バケットの名前です。

属性

詳細

入力

String

Required

はい

既定値

許容値

String または String 型変数を入力します。

備考

ドキュメントを含む S3 バケットの AWS リージョンは、[ Amazon スコープ] アクティビティで選択した リージョン と一致する必要があります。

Amazon Textract で S3 バケット内のファイルを処理するには、ユーザーに S3 バケットにアクセスする権限が必要です。詳細については、「 セットアップ 」ガイドの「 IAM ユーザーを作成 する」セクションの 手順 6 をご覧ください。

DocumentName

分析する仕様の バケット 内のファイルの名前で、大文字と小文字が区別されます。

属性

詳細

入力

String

Required

はい

既定値

許容値

String または String 型変数を入力します。

備考

サポートされているドキュメントの形式 ( PNG、JPEG、PDF)

バージョン

バケットでバージョン管理が有効化されている場合は、オブジェクトのバージョンを指定できます。

属性

詳細

入力

String

Required

いいえ

既定値

許容値

String または String 型変数を入力します。

備考

N/A

その他

プライベート (Private)

選択すると、変数と引数の値が Verbose レベルでログ記録されなくなります。

属性

詳細

入力

チェックボックス

Required

いいえ

既定値

非選択

許容値

選択または非選択

備考

N/A

出力

ページ数

指定したドキュメントから抽出されたプロパティが配列として返されます。

属性

詳細

入力

PageDetailCollection

Required

いいえ (後続のアクティビティで出力データを使用する予定がある場合に推奨)

既定値

許容値

PageDetailCollection 型変数を入力します。

備考

配列の各オブジェクトは、1 つのページの結果を表します。 これは、 PageDetail[] オブジェクトを返した以前のバージョンからの変更です。

PageDetail オブジェクトとそのプロパティについては、「ページの 詳細 」をご覧ください。

次の画像は、アクティビティの依存関係と入力/出力プロパティの値の例です。

ステップバイステップの手順および例は、「クイックスタート」ページをご覧ください。





  • 動作のしくみ
  • プロパティ
  • 共通
  • 入力
  • オプション
  • S3 ストレージ
  • その他
  • 出力

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.