Google Photosに写真入れるとなにがおこるんだろう

Google Photos、すごいですね。ほんと一生分の写真が入れられるようです。

「Google Photos」の機能--写真をスマートに整理する新サービス - CNET Japan

ただ、なぜこんなすごいサービスを無料で提供するのか？サーバー用意するだけでも膨大なコストがかかるはずです。そのコストを負担してもgoogleは写真を集めたいわけです。

その理由の一つは、言わずもがなビックデータかと。それについては、一時期流行ったこちら本でも述べられています。

クラウドからAIへアップル、グーグル、フェイスブックの次なる主戦場 (朝日新書)

作者: 小林雅一
出版社/メーカー: 朝日新聞出版
発売日: 2013/07/12
メディア: 新書
この商品を含むブログ (23件) を見る

米IT3強のビジョンは一致している

…

何故彼らが、ゲートウェイにこだわるかというと、そこからユーザーの様々な嗜好や活動に伴う膨大なデータ、つまりビックデータが入っているからです。

…

これらの点を押さえれば当然、巨額の広告収入が見込めるし、更なるデータの流入が期待できます。それを解析することによって新しいビジネスも生まれるでしょう。

ここでは、モバイル戦略の話ではありますが、各社ともにビックデータを手に入れたいのは事実です。

写真や動画からは単なる検索データ以上にリッチな情報が得られ、各社とも、のどから手が出るほど欲しい情報には違いありません。

Googleが写真を解析しているのは自分で言っている

さて、Photosですが、実際Googleがビックデータとして解析しているかといえば、それはGoogle自身が真っ先にサービス紹介で述べてます。

Google フォトは、思い出を「人」・「場所」・「テーマ」に応じて、自動で整理してくれます。いちいち写真ごとにタグやラベルをつけたり、都度アルバムを作ったりする必要はありません。特定の写真を探すときは、該当するキーワードで写真を検索するだけで見つけることができます。（たとえば、「犬」「誕生日パーティー」「地名」など）。もちろん、すべての自動整理は非公開で行われ、あなただけにしか見えない状態で管理できます。

というように、写真や動画を分析しています。写真や動画の中身を見て分析して、タグ付を行うサービスを提供しています。「中に何が写っているかは分析しているよ」ということです。

こういったサービスは、自動認識の技術に支えられており、Googleだけでなく、各社ともにここ数年力を入れており、著しい進歩が見られます。

今から３年ほど前にGoogleでディープラーニングを利用した機械学習で、猫を認識した件は有名です。

&lt;a href="http://wired.jp/2012/07/06/google-recognizes-kittens/" data-mce-href="http://wired.jp/2012/07/06/google-recognizes-kittens/"&gt;猫を認識できるGoogleの巨大頭脳 « WIRED.jp&lt;/a&gt;wired.jp

更に、3年経った今では、より高度に進歩しているのは確実です。

例えば、「クリスマス」とか入れて検索すれば、勝手に「クリスマスツリー」や「サンタクロース」が移っている画像が抽出されます。

どこまで知られるのか

　では、実際どういった分析がされてどう使われるのか。ユーザーとしては、サービスの利便性の変わりにどの程度自分のデータが利用されるのか、それが重要かと思います。

　例えば、６歳の幼稚園生の男の子供を持つ田中さん（仮称）が、息子の太郎くん（さらに仮称）のこれまでの写真や動画を入れたとします。そうすると、こんなことは、容易に自動認識できるのではないかと

小さな男の子の画像が多数存在する→「５，６歳の男の子」
幼稚園のイベントの写真多数ある→「幼稚園生」
３年ほど前に「入園式」という文字のある写真がある→「年長」
動画の中で大人の男の人が”太郎”と呼びすてている→「Photosユーザーはお父さんでその息子の太郎君」
写真のアップする曜日が土日→「お父さんは土日休みの仕事」
夜の東京タワーの写真が多い→「都内在住」

　くらいは、ディープラーニングが、ベイジアンネットワークかわかりませんが、お茶の子さいさいでしょう。

それぞれが正確に当たっているかは分かりませんが、Googleの持つデータに基づき、確率的に高い結果が導かれると思います。

このように、個人の属性的なデータは容易に自動で推測可能でしょう。

　更に、

子供の服が青が多い→「青色が好き」
動画の中で、子供の「はずかしい」という言葉や、写真を撮ろうとすると逃げることが多い→「はずかしかりやの子供」

といったように、人物の嗜好や性格などもある程度特定できるのかと思います。

ここまで言われると気持ち悪い

さて、Googleが持ったこれらのメタデータをもとに何をするのかは、分かりませんが、少なくとも広告ビジネスには使えそうです。

先ほどの田中太郎君であれば、「来年小学校で、そろそろランドセルを考え始めるころだ。青色が好きではずかしがりやなので、ちょっと地味目の青のランドセルをレコメンドすると良いではないだろうか」くらいは言えそうです。

これを都内のカバン屋にデータとして売ることはお金になりそうです。ある日突然、いきなりカバン屋からメールが来て

ＸＸカバンです！

太郎君来年は小学生ですね！青色が大好きで恥ずかしがりやな太郎君には、このブルーのＹＹ型ランドセルがおすすめです！

お父さんがお休みの来週の土曜でしたら、15%オフになります。ぜひご来店ください。

お店は東京タワーすぐ横のビルになります。田中さん家のすぐ近くです。

お待ちしております。

なんてのが来たら気味悪いを通り越して、怒り心頭で、消費者センターに即連絡です。

当然こんなことはまずありません。Googleも直接アドレスを第３者に販売することはないでしょうし、Photosから知りえた個人情報を直接外部に外販することはまずないでしょう。規約にもそれくらい書いてあるのではないかと。