デジタルデータは非常にコピーしやすいことが特性の一つです。また、情報伝達の間に多くのコピーが発生し、その際に内容そのものや作成者、所有者などの付随情報が書き変えられてしまうこともあります。極端に言えば、情報伝達の間でデータの改ざんが発生し、データの信頼性が損なわれる可能性があるのです。
本記事ではデータプロビナンス、コンテンツプロビナンスという考え方について、どのように情報の真正性確保、移動時の透明性維持を行い、付加価値を提供するのかを解説します。サプライチェーン・データマネジメントの実現にお役立てください。
データプロビナンス/コンテンツプロビナンスとは?真正性を担保する「来歴」の概念
プロビナンス(Provenance、プロビナンス)とは、「来歴」、「起源」、「出所」などを意味する言葉です。
データプロビナンスおよびコンテンツプロビナンスは、デジタルデータやコンテンツの生成・加工・変更・移動の履歴やそれに伴う責任情報を含む「来歴」などを記録・管理するものです。作成者、変更履歴および変更責任者などの詳細情報により、データやコンテンツの真正性・責任追跡性・完全性などを確保し、利用価値を保証します。
なぜ今プロビナンス(来歴管理)が重要なのか
ビッグデータとしての集約・加工やAIによる生成・分析の普及などにより、デジタルデータやコンテンツは量と価値の両面で拡大しています。一方でデータやコンテンツの本来の所有者とは関係ないところで、コピーされたデータに対して偽造・改ざん・盗用などが行われる問題の存在も指摘されています。所有者は自分のあずかり知らぬところで利用されたデータやコンテンツにより被害を受ける可能性さえあります。
企業、組織や研究者などデータの作成者・提供者側では、誤ったデータやコンテンツを示してしまうことによって信頼性を大きく損なう可能性があります。また、既に存在するデータやコンテンツを新たな目的で加工・編集して活用する際にも、真正性や透明性の確保が必要となります。
そのため、データやコンテンツの取り扱いについて透明性・説明責任をカバーできる方法として、来歴を管理するプロビナンスが重要視されています。デジタルデータやコンテンツの所有者にとって、悪用や盗用を防ぐ自衛の手段としても有用です。
データプロビナンスとコンテンツプロビナンスの違い
データプロビナンスは、構造化データやログなどを含む広義のデジタルデータ全般を対象とし、データの作成元や移転・変遷の履歴などを記録・追跡するものです。
一方、コンテンツプロビナンスは、画像・動画・音声・文書といった人が意味を読み取るデジタルコンテンツに対象を限定したプロビナンスを意味します。履歴を記録・追跡する点は共通していますが、それに加え、コンテンツそのものにプロビナンスデータと呼ばれる作成情報や編集履歴を埋め込む技術を含む点が特徴です。
つまり、コンテンツプロビナンスはデータプロビナンスの考え方を基盤とした応用的な考え方・技術のことで、偽情報対策や真正性の担保といった用途に特化しているものだと整理できます。
プロビナンスを支える技術とワークフロー
データおよびコンテンツのプロビナンスでは、生成から加工、コピーや伝達などライフサイクルプロセスを追跡できることが重要となります。そのため、データの生成、加工などに伴って生まれるメタデータの収集・記録・管理を行います。
また、トレーサビリティとしてデータを追跡、可視化する仕組みも必要です。トレーサビリティの実現にはブロックチェーンを用いる場合や、追跡プロセスの自動化を含む仕組みが採用されることもあります。
プロビナンスのワークフローをまとめると、下記のステップとなります。
- データの生成に対するメタデータなどの収集
- 収集したメタデータの管理
- データの連結と可視化、利用
- プロビナンスデータの保存、保持
プロビナンスのためのオープン標準については、標準化組織「C2PA(Coalition for Content Provenance and Authenticity)」を中心に策定が推進中です。これは、画像や動画などのデジタルコンテンツについて、「誰が作成し、どのような編集が加えられたのか」を後から検証できるようにするための、国際的な標準化の取り組みです。
C2PAはコンテンツに編集履歴の証明書を付与し、閲覧環境を用意することにより誰もが確認可能です。例えば「CRマーク」はその一例で、クリックすることで作成者、作成・編集の履歴、使用ツール・生成方法、改ざん検出結果や欠損の有無がわかり、履歴が失われている場合は警告表示されます。
C2PAの運営にはMicrosoft、Adobe、Google、Meta、SONYなどが名を連ねており、デジタル企業にとってのプロビナンスの重要性が高いことを表していると言えます。
企業が導入を検討すべき背景とメリット
データの利活用は事業活動上必須であり、来歴・真正性・責任追跡性・透明性はますます重要視されることが予測されます。データやコンテンツの改ざんや盗用などは、企業の信頼性を大きく損ねるものです。
また、現代の企業活動は複雑なサプライチェーンの上に成り立っています。サプライチェーンの中の情報伝達の流れにおいて、外部から流入するデータの透明性・真正性を確保するサプライチェーン・データマネジメントは不可欠と言えます。
プロビナンスはこれらの課題を解決する対策として欠かせない考え方、技術です。プロビナンスを確保することにより、ビッグデータやAIを活用して利益を得られるという大きなメリットがあります。また、サプライチェーン・データマネジメントの実現においては、プロビナンスはリスクマネジメントの一端を担うことも重要な点です。
まとめ:信頼できるデータ活用基盤の構築に向けて
データプロビナンスおよびコンテンツプロビナンスは、デジタルデータやコンテンツのライフサイクルにおける履歴、記録です。プロビナンスによりデータやコンテンツの真正性・責任追跡性などを担保することができます。AIによりデータやコンテンツを複製・改変することが容易になった現代の状況下では、本来の所有者の自衛手段としてもプロビナンスの導入が必要となるでしょう。
企業においては事業活動上、データの真正性や透明性確保は必須の要件です。サプライチェーン・データマネジメントにおけるリスク対策の一つとして、プロビナンスの導入を推し進めることが求められます。