Google Photos、すごいですね。ほんと一生分の写真が入れられるようです。
「Google Photos」の機能--写真をスマートに整理する新サービス - CNET Japan
ただ、なぜこんなすごいサービスを無料で提供するのか?サーバー用意するだけでも膨大なコストがかかるはずです。そのコストを負担してもgoogleは写真を集めたいわけです。
その理由の一つは、言わずもがなビックデータかと。それについては、一時期流行ったこちら本でも述べられています。
クラウドからAIへ アップル、グーグル、フェイスブックの次なる主戦場 (朝日新書)
- 作者: 小林雅一
- 出版社/メーカー: 朝日新聞出版
- 発売日: 2013/07/12
- メディア: 新書
- この商品を含むブログ (23件) を見る
米IT3強のビジョンは一致している
…
何故彼らが、ゲートウェイにこだわるかというと、そこからユーザーの様々な嗜好や活動に伴う膨大なデータ、つまりビックデータが入っているからです。
…
これらの点を押さえれば当然、巨額の広告収入が見込めるし、更なるデータの流入が期待できます。それを解析することによって新しいビジネスも生まれるでしょう。
ここでは、モバイル戦略の話ではありますが、各社ともにビックデータを手に入れたいのは事実です。
写真や動画からは単なる検索データ以上にリッチな情報が得られ、各社とも、のどから手が出るほど欲しい情報には違いありません。
Googleが写真を解析しているのは自分で言っている
さて、Photosですが、実際Googleがビックデータとして解析しているかといえば、それはGoogle自身が真っ先にサービス紹介で述べてます。
Google フォトは、思い出を「人」・「場所」・「テーマ」に応じて、自動で整理してくれます。いちいち写真ごとにタグやラベルをつけたり、都度アルバムを作ったりする必要はありません。特定の写真を探すときは、該当するキーワードで写真を検索するだけで見つけることができます。(たとえば、「犬」「誕生日パーティー」「地名」など)。もちろん、すべての自動整理は非公開で行われ、あなただけにしか見えない状態で管理できます。
というように、写真や動画を分析しています。写真や動画の中身を見て分析して、タグ付を行うサービスを提供しています。「中に何が写っているかは分析しているよ」ということです。
こういったサービスは、自動認識の技術に支えられており、Googleだけでなく、各社ともにここ数年力を入れており、著しい進歩が見られます。
今から3年ほど前にGoogleでディープラーニングを利用した機械学習で、猫を認識した件は有名です。
更に、3年経った今では、より高度に進歩しているのは確実です。
例えば、「クリスマス」とか入れて検索すれば、勝手に「クリスマスツリー」や「サンタクロース」が移っている画像が抽出されます。
どこまで知られるのか
では、実際どういった分析がされてどう使われるのか。ユーザーとしては、サービスの利便性の変わりにどの程度自分のデータが利用されるのか、それが重要かと思います。
例えば、6歳の幼稚園生の男の子供を持つ田中さん(仮称)が、息子の太郎くん(さらに仮称)のこれまでの写真や動画を入れたとします。そうすると、こんなことは、容易に自動認識できるのではないかと
- 小さな男の子の画像が多数存在する→「5,6歳の男の子」
- 幼稚園のイベントの写真多数ある→「幼稚園生」
- 3年ほど前に「入園式」という文字のある写真がある→「年長」
- 動画の中で大人の男の人が”太郎”と呼びすてている→「Photosユーザーはお父さんでその息子の太郎君」
- 写真のアップする曜日が土日→「お父さんは土日休みの仕事」
- 夜の東京タワーの写真が多い→「都内在住」
くらいは、ディープラーニングが、ベイジアンネットワークかわかりませんが、お茶の子さいさいでしょう。
それぞれが正確に当たっているかは分かりませんが、Googleの持つデータに基づき、確率的に高い結果が導かれると思います。
このように、個人の属性的なデータは容易に自動で推測可能でしょう。
更に、
- 子供の服が青が多い→「青色が好き」
- 動画の中で、子供の「はずかしい」という言葉や、写真を撮ろうとすると逃げることが多い→「はずかしかりやの子供」
といったように、人物の嗜好や性格などもある程度特定できるのかと思います。
ここまで言われると気持ち悪い
さて、Googleが持ったこれらのメタデータをもとに何をするのかは、分かりませんが、少なくとも広告ビジネスには使えそうです。
先ほどの田中太郎君であれば、「来年小学校で、そろそろランドセルを考え始めるころだ。青色が好きではずかしがりやなので、ちょっと地味目の青のランドセルをレコメンドすると良いではないだろうか」くらいは言えそうです。
これを都内のカバン屋にデータとして売ることはお金になりそうです。ある日突然、いきなりカバン屋からメールが来て
XXカバンです!
太郎君来年は小学生ですね!青色が大好きで恥ずかしがりやな太郎君には、このブルーのYY型ランドセルがおすすめです!
お父さんがお休みの来週の土曜でしたら、15%オフになります。ぜひご来店ください。
お店は東京タワーすぐ横のビルになります。田中さん家のすぐ近くです。
お待ちしております。
なんてのが来たら気味悪いを通り越して、怒り心頭で、消費者センターに即連絡です。
当然こんなことはまずありません。Googleも直接アドレスを第3者に販売することはないでしょうし、Photosから知りえた個人情報を直接外部に外販することはまずないでしょう。規約にもそれくらい書いてあるのではないかと。
では、広告表示なら良いのか
さて、直接カバン屋からメールがくるのは気持ち割るのですが、Gmailのプロモーション欄の広告や、検索時の右の広告欄に、「XXカバンのランドセル」がくるのは問題ないのでしょうか?
結局のところ、XXカバンという広告主と優良な潜在的購買者である田中さんをマッチングしているのにはどちらも違いがありません。ただ、直接データは出していないだけです。
確かに、直接XXカバンにデータを渡さなければ、実際に買わない限り、個人情報がXXカバンに渡ることもありません。
「じゃあそれでいいのか?」となると、後は個人の感覚のような気もします。広告表示でなんとなく写真が分析されているのを許せるのか、それとも許せないのか、それは個人の感覚かと思います。
Googleが提供するサービスレベルと、自分が晒している個人情報のレベルを比較して、サービスを利用するかどうかを決めればよいのかとも思います。
実際Gmailでもメール内容見て広告を出すようなことは行われているでしょうが、それについて抵抗を持つ人も徐々に減ってきたのではないかと。
ただ、人間、「自分だけは大丈夫」という、バイアスがかかりやすいので、その辺は注意が必要かと思います。あくまで流出してもいたくない写真や動画をアップしておくのにとどめるのは最低限のリスク管理かと。
ただ、これは現時点の話で、将来的にディープラーニングが何を学習して、どういった反応をするのかはわかりません。近い将来に、個人のかなりコアな情報まで分析されてしまう可能性は高いかと思います。そのリスクも込みで、Photosをどう使うのかは検討した方がよいのではないかと。
じゃ、お前はどうなんだといわれると、多くの人と同様で、個人情報をさらして利便性を取っちゃいます。やっぱり便利です。
(あわせてこちらも)
クラウドからAIへ アップル、グーグル、フェイスブックの次なる主戦場 (朝日新書)
- 作者: 小林雅一
- 出版社/メーカー: 朝日新聞出版
- 発売日: 2013/07/12
- メディア: 新書
- この商品を含むブログ (23件) を見る