AI価値の最大化とデータ駆動型社会実現のためのガイド「データ品質マネジメントガイドブック」を公表 AISI
AIセーフティ・インスティテュートはこのほど、データ品質マネジメントガイドブックを公表しました。AIが適切に利用されるデータ駆動型社会の実現に向け、データとAIの価値を最大化するために必要なことを整理し、英語の正式版と日本語のサマリが公開されました。
まず、前提としてデータ駆動型社会、信頼できるAI社会のいずれにおいても、データ品質は不可欠な要素だと述べています。適切なデータ品質マネジメントを行うことは、▽データ正確性の向上▽効率性の向上▽データ利用者の体験向上▽コスト削減▽コンプライアンスとセキュリティの強化など、さまざまなメリットをもたらすと記されました。
品質を確保するために必要なこととしては、(1)高品質なデータの作成、(2)低品質なデータを作り出さない、(3)信頼構築、(4)正しいデータ利用という4つの方法を紹介しています。例えば(1)については、データモデリング(※1)や人による悪意あるデータ操作をなくすことで実現可能、(4)については訓練や研修を行ったりSSOT(※2)やASOT(※3)といった概念を浸透させたりすることで実現可能だとされました。
※1:情報システムのデータ構造や関係を図式化して視覚的に表現すること。
※2:Single Source of Truth(信頼できる唯一の情報源)の略称で、組織内の全員が同じデータに基づいて意思決定を行うこと。
※3:Authoritative Source of Truth(権威ある真実の源)の略称で、組織の関係者が安全にアクセス、管理できるデータを提供すること。
また、本ガイドブックによると、データ品質管理のフレームワークは、ゲートウェイ・ビュー(評価特性を定義するもの)、プロセス・ビュー(各場面でのアクションを特定するもの)、ガバナンスサイクル・ビュー(組織の持続力を確保するもの)、という3つの観点で構成されています。これらの観点を基に、データ全体のライフサイクル(データのインプットや評価、システム管理者へのフィードバックなど、データ管理に関わるさまざまなアクションのサイクル)を評価・管理することで、適切なデータ品質管理ができるとされました。
このほか、正式版ではデータライフサイクルを「データ計画」、「データ取得」、「データ準備」というようにオペレーションの種類ごとに8つにグループ化し、それぞれに求められるアクションやチェックポイントなどを解説しています。