投稿元:
レビューを見る
実案件が少ないのと、AIの実用が本格的に進んでいないこともあり、やや抽象的な議論が多かった印象。ただし、重要なテーマではあるので、今後もウォッチしていかねば。
・AIに与える学習用データ
①個人情報を含むデータ:移動・行動・購買履歴、属性情報、ウェアラブル機器からのデータ
②匿名加工されたデータ:個人を特定できないように加工された人流情報、商品情報など
③個人に関わらないデータ:生産現場のIoT機器データ、橋梁に設置されたIoT機器からのセンシングデータ(歪み、振動、進行車両の形式・重要)
・匿名加工情報の加工方法
項目削除:加工対象となる個人情報データベース等に含まれる個人情報の項目を削除するもの。例えば、年齢のデータを全ての個人情報から削除すること
レコード削除:加工対象となる個人情報データベース等に含まれる個人情報のレコードを削除するもの。例えば、特定の年齢に該当する個人のレコードを全て削除すること
セル削除:加工対象となる個人情報データベースなどに含まれる個人情報の特定のセルを削除するもの。例えば、特定の個人に含まれる年齢の値を削除すること。
一般化:加工対象となる情報に含まれる記述等について、上位概念若しくは数値に置き換えること。例えば、購買履歴のデータで「きゅうり」を「野菜」に置き換えること。
トップ(ボトム)コーディング:加工対象となる個人情報データベース等に含まれる数値に対して、特に大きい又は小さい数値をまとめることとするもの。例えば、年齢に関するデータで、80歳以上の数値データを「80歳以上」というデータにまとめること。
レコード一部抽出:加工対象となる個人情報データベース等に含まれる個人情報の一部のレコードを(確率的に)抽出すること。いわゆるサンプリングも含まれる。
項目一部抽出:加工対象となる個人情報データベース等に含まれる個人情報の項目の一部を抽出すること。例えば、購買履歴に該当する項目の一部を抽出すること。
ミクロアグリゲーション:加工対象となる個人情報データベース等を構成する個人情報をグループ化した後、グループの代表的な記述等に置き換えることとするもの。
丸め(ラウンディング):加工対象となる個人情報データベース等に含まれる数値に対して、四捨五入等して得られた数値に置き換えることとするもの。
データ交換(スワッピング):加工対象となる個人情報データベース等を構成する個人情報相互に含まれる記述等を(確率的に)入れ替えることとするもの。例えば、異なる地域の属性を持ったレコード同士の入れ替えを行うこと。
ノイズ(誤差)付加:一定の分布に従った乱数的な数値等を付加することにより、他の任意の数値等へと置き換えることとするもの。
類似データ生成:人工的な合成データを作成し、これを加工対象となる個人情報データベース等に含ませることとするもの。
投稿元:
レビューを見る
実案件が少ないのと、AIの実用が本格的に進んでいないこともあり、やや抽象的な議論が多かった印象。ただし、重要なテーマではあるので、今後もウォッチしていかねば。
・AIに与える学習用データ
?個人情報を含むデータ:移動・行動・購買履歴、属性情報、ウェアラブル機器からのデータ
?匿名加工されたデータ:個人を特定できないように加工された人流情報、商品情報など
?個人に関わらないデータ:生産現場のIoT機器データ、橋梁に設置されたIoT機器からのセンシングデータ(歪み、振動、進行車両の形式・重要)
・匿名加工情報の加工方法
項目削除:加工対象となる個人情報データベース等に含まれる個人情報の項目を削除するもの。例えば、年齢のデータを全ての個人情報から削除すること
レコード削除:加工対象となる個人情報データベース等に含まれる個人情報のレコードを削除するもの。例えば、特定の年齢に該当する個人のレコードを全て削除すること
セル削除:加工対象となる個人情報データベースなどに含まれる個人情報の特定のセルを削除するもの。例えば、特定の個人に含まれる年齢の値を削除すること。
一般化:加工対象となる情報に含まれる記述等について、上位概念若しくは数値に置き換えること。例えば、購買履歴のデータで「きゅうり」を「野菜」に置き換えること。
トップ(ボトム)コーディング:加工対象となる個人情報データベース等に含まれる数値に対して、特に大きい又は小さい数値をまとめることとするもの。例えば、年齢に関するデータで、80歳以上の数値データを「80歳以上」というデータにまとめること。
レコード一部抽出:加工対象となる個人情報データベース等に含まれる個人情報の一部のレコードを(確率的に)抽出すること。いわゆるサンプリングも含まれる。
項目一部抽出:加工対象となる個人情報データベース等に含まれる個人情報の項目の一部を抽出すること。例えば、購買履歴に該当する項目の一部を抽出すること。
ミクロアグリゲーション:加工対象となる個人情報データベース等を構成する個人情報をグループ化した後、グループの代表的な記述等に置き換えることとするもの。
丸め(ラウンディング):加工対象となる個人情報データベース等に含まれる数値に対して、四捨五入等して得られた数値に置き換えることとするもの。
データ交換(スワッピング):加工対象となる個人情報データベース等を構成する個人情報相互に含まれる記述等を(確率的に)入れ替えることとするもの。例えば、異なる地域の属性を持ったレコード同士の入れ替えを行うこと。
ノイズ(誤差)付加:一定の分布に従った乱数的な数値等を付加することにより、他の任意の数値等へと置き換えることとするもの。
類似データ生成:人工的な合成データを作成し、これを加工対象となる個人情報データベース等に含ませることとするもの。