ixp
latest
false
UiPath logo, featuring letters U and I in white

Communications Mining ガイド

最終更新日時 2025年10月20日

CSV ファイルをソースにアップロードする

メモ: CSV ファイルをソースにアップロードするには、Automation Cloud ユーザーとして IXP プロジェクト管理者 ロールを割り当てているか、レガシ ユーザーとして ソース管理者 権限と メッセージの編集 権限を割り当てている必要があります。

CSV ファイルからデータソースにデータをアップロードするには、以下の手順を実行します。
注:
  • ユーザー プロパティ以外を更新すると、関連付けられているデータセット内にある一般フィールドのアノテーションが失われます。たとえば、ソース内の既存のメッセージの更新、メッセージ プロパティ (メッセージ テキスト、sent_atのタイムスタンプ、宛先または送信元など) の変更などです。変更する前に、関連付けられているデータセットの最新のモデル バージョンをピン留めしてください。

  • データ ソースの作成について詳しくは、「GUI でデータ ソースを作成または削除する」をご覧ください。

  1. [管理者] ページに移動します。
  2. [ ソース ] タブを選択し、データのアップロード先のソースを見つけます。
  3. データ ソース カードのアップロード アイコンを選択します。
  4. [ファイルを選択] を使用して、コンピューターから CSV ファイルを選択します。
  5. アップロードする CSV ファイルを選択します。ファイルが次の条件を満たしていることを確認します。
    • ファイルの最初の行にはヘッダーが含まれており、コンマまたはタブで区切られている必要があります。
    • ファイルには、以下の 3 つ以上の列が含まれている必要があります。
      • メッセージ: メッセージ テキストです。
      • タイムスタンプ: メッセージが作成された日時を示すタイムスタンプです。
      • 一意の ID: 各メッセージの個別の識別子。
    • ファイル内では、すべてのテキスト フィールドを二重引用符で囲みます。
    • ファイルは、UTF-8、UTF-16、UTF-32 のいずれかでエンコードされている必要があります。正しいエンコードが自動的に検出されます。
    • ファイルは 128 MiB 以下である必要があります。ファイルがこの制限を超える場合は、それぞれ 128 MiB 未満の複数のファイルに分割します。
  6. 必要な列を選択します。ドロップダウン メニューには、CSV ファイルで検出された列ヘッダーが含まれます。
    • メッセージ ID 列 - メッセージを識別できる一意の ID を持つ列です。メッセージ ID に含められるのは、ASCII の英数字 (A から Z、a から z、0 から 9) と句読点のみです (スラッシュ /を除く)。

      注: ソース内に同じ ID の既存のメッセージが存在する場合、新しいファイルの内容に一致するように更新されます。

    • メッセージ列 - プラットフォームで分析するメッセージ テキストを含む列です。
    • タイムスタンプ 列 - メッセージが記録された日時を含む列です。タイムスタンプの形式は柔軟であり、プラットフォームによって自動的に推測されます。詳しくは、「 正しい形式を使用する」をご覧ください。
  7. ケースやメールのスレッドでよく遭遇する件名、スレッド、または参加者を含むデータがある場合は、以下の列を追加で選択できます。
    • 件名の列 - メッセージの件名を含む列です。
    • 送信者列 - 送信者を含む列です。
    • 宛先列 - 受信者を 1 人以上含む列です。複数の受信者は、セミコロン ; で区切られていることを確認してください。
    • Cc 列 - [Cc] フィールドに 1 人以上の受信者を含む列です。複数の受信者を指定する場合は、必ずセミコロンで区切 ;
      • [送信者]、[宛先]、[CC] フィールドで正しい形式を使用する方法について詳しくは、「 正しい形式を使用する」をご覧ください。
    • スレッド ID 列 - メッセージのスレッド ID を含む列です。スレッド ID は、異なるメッセージを同じスレッドに結び付けるものです。
  8. メッセージとともにアップロードする追加のユーザー プロパティを選択できます。ユーザー プロパティは、プラットフォームでフィルター処理できる、各メッセージに関連付けられたコンテキストのメタデータです。プラットフォームのマシン ラーニング モデルでは、これらのユーザー プロパティを利用することもできます。このようなユーザー プロパティの種類は次のとおりです。
    • 文字列ユーザー プロパティは 、ID、国、取引先などのカテゴリ メタデータです。
    • 数値 ユーザー プロパティは 、NPS、メール統計情報、金額などの数値メタデータです。

    注: ファイルにユーザー プロパティとして NPS スコアが含まれる場合、ネイティブの NPS グラフをプラットフォームに読み込むには、NPS スコアを数値プロパティとして含め、名前を NPS のみにする必要があります。

  9. ユーザー プロパティをすべて選択したら、[アップロード] を選択します。

    データのアップロード先のソースを含むデータセット内で、アップロードされたメッセージを精査するように求められます。ソースがどのデータセットにも関連付けられていない場合は、新しいデータセットを作成して、期待どおりにアップロードされていることを確認できます。

    注: ユーザー プロパティを選択する際に間違いがあった場合は、同じファイルをもう一度アップロードできます。その場合、列 ID を識別子として使用し、既存のメッセージとプロパティが上書きされます。既存のメッセージに適用されているラベルに影響はありません。

正しい形式を使用する

送信者/宛先/CC の形式

以下の点をご確認ください。

  • 受信者の数は、スレッドあたり最大 2,048 人を超えません。
  • 送信者または受信者が 512 文字の制限を超えないようにします。
  • 連続するセミコロンは 1 つだけです。たとえば、次の形式は正しくありません: john@email.com ;beth@email.com。

受信者の前後の空白は削除されますが、追加のデータ クリーニングは実行されません。次に、データに使用できる形式の例をいくつか示します。
  • 例 1: Robert Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
  • 例 2: rob.bog@gmail.com ;john.smith@gmail.com
  • 例 3: rob.bog@gmail.com ; john.smith@gmail.com

異なる受信者はセミコロン ; で区切られます。

データをアップロードする前に、メールが適切な形式であることを確認してください。

手記: メール スレッドなどの標準的なスレッドのユース ケースでは、各送信者セルに送信者を 1 人だけ含める必要があります。

タイムスタンプの形式

選択したタイムスタンプ形式の日、月、年の順序が曖昧な場合 (例: 01/02/03 10:10など) は、正しい解釈を提案できます。
  • 2003 年 1 月 2 日 - 指定なし
  • 2003 年 2 月 1 日 - 日が最初
  • 2001 年 2 月 3 日 - 年が最初
  • 2001 年 3 月 2 日 - 日が最初 + 年が最初

曖昧さを避けるため、タイムスタンプは RFC 3339 形式で指定することをお勧めします。たとえば、UTC の場合は 2020-01-31T12:34:56Z 、タイムゾーンは 2020-08-031T11:20:60-08:00です。

トラブルシューティング

注: アップロードの途中で CSV のアップロードに失敗した場合は、エラーを修正した後に同じ CSV をもう一度アップロードできます。アップロード済みのメッセージのメッセージ ID とテキスト (件名と本文) が変更されていなければ、アップロードをリトライしても追加の AI ユニットやプラットフォーム ユニットは消費されません。

このセクションでは、アップロード プロセス中に発生する可能性のあるエラー メッセージと、それぞれの解決策を示します。

以下のエラー メッセージでは、{something} は、エラーが発生した場所に関するコンテキスト情報にマッピングされます。さらに、ファイル内の位置を参照する方法は、次のように標準化されています。

文字列展開後の状態:
{position}行 {line-number} の列 {column-number} のレコード {row-number} (バイト {byte-number})

次の画像に示すように、エラー メッセージのタイトルが説明とともに表示されます。



手記: 表に記載されているエラーとは異なるエラーが発生した場合は、アップロードをリトライしてください。
エラーの種類エラー メッセージ説明
十分な列がないThe CSV file only contains {number-columns} columns, but at least 3 are needed, that is, text, timestamp and id.アップロードされた CSV に 3 つ以上の列が含まれていないか、ファイルのエンコードが間違って検出されました。
無効なエンコードThe file contains invalid characters, where the encoding is detected as {detected-encoding}.ファイルが UTF-8、UTF-16、UTF-32 として正しくエンコードされていません。ファイルの形式は自動的に検出されます。
無効なヘッダーstring:ti:er' 一致する '(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'と一致しない列ヘッダーがユーザー プロパティとして無効な名前である場合、リクエストのスキーマが無効であるときの既定のメッセージが返されます。各列ヘッダーが、その目的に対して有効な形式であることを確認します。列ヘッダーの最大長は英数字 32 文字です。
行の長さが等しくないThe CSV contains unequal row lengths. Message {position} has {number} fields, but the previous record has {number} fields.CSV に、セルの数が異なる行、またはヘッダーの数と一致しない行が含まれています。
ID の形式Invalid message id for {record}. IDs can only consist of ASCII alphanumeric characters and punctuation, except for forward slash /. Cell value: {cell-value}. エラー メッセージの説明のとおり、ID フィールドが無効な文字で構成されている場合に発生します。
ID の長さId is too long for message {record}. It has {number} bytes, expected at most 1024.ID フィールドが許容される最大長 (1024 文字) よりも長い場合に発生します。
タイムスタンプの形式Incorrectly formatted timestamp in message {position}: {timestamp-error-message}. Cell value: {cell-value}.タイムスタンプ フィールドを解析できなかった場合に発生します。
メッセージの長さMessage is too long for message {position}. It has {number} bytes, expected at most 65536.メッセージ フィールドが最大長 (65536 文字) よりも長い場合に発生します。
数値プロパティの形式Incorrectly formatted number in message {position}: {number-error-message}.Cell value: {cell-value}.数値のユーザー プロパティ フィールドを解析できなかった場合に発生します。プラットフォームは、数値として適切にデコードできる形式であれば、すべて許容する必要があります。
プロパティの長さProperty is too long for message {position}. It has {number} bytes, expected at most 4096.ユーザー プロパティ フィールドが最大長 (4096 文字) よりも長い場合に発生します。
不明なエラーUnknown CSV error: {underlying-error-message}.不明なエラーが発生した場合は、アップロードをリトライしてください。
  • 正しい形式を使用する
  • トラブルシューティング

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.