AIがAIを生み出すAIファーストの「7つの進化」。Google I/O 2017
シリコンバレーも一気に季節が変わり、昼間の気温が30℃を超える暑い日が増えてきました。
先週は、ついにGoogleの開発者会議、Google I/Oが開催され、ずっと続いた開発者会議シリーズもあとは再来週のAppleのWWDCを残すのみとなりました。
昨年のGoogle I/Oでは、AIアシスタントのGoogle Assistant、Amazon Echo対抗のGoogle Home、VRのDayDream、など新しい製品の発表が目白押しで、「家に「ログイン」する時代がやってくる。「検索 X AI」で変わる生活 」と言うポストを書きました。
一方、今年はこれと言った新製品の発表はありませんでしたが、Googleが、昨年からのキーワード「AIファースト」を猛烈に推進していることを感じる内容でした。
今回のポストは、初日の二時間のキーノートの中から、GoogleのAIの7つの進化ポイントについて書きたいと思います。
- AIの進化①:スマートリプライ
- AIの進化②:Google Lens
- AIの進化③:Cloud TPU
- AIの進化④:AutoML
- AIの進化⑤:Proactive Assistant
- AIの進化⑥:Suggested Sharing
- AIの進化⑦:VPS
AIの進化①:スマートリプライ
今回、Android端末の20億アクティブユーザ超えという大きなマイルストーンを発表したGoogleですが、そのモバイルに変わる新しいプラットフォームとしてのAI、「AI ファースト」を昨年から掲げています。
ウェブ時代からモバイル時代になり、マルチタッチ、ロケーション、決済など全てがモバイル対応で一から変わったように、今、全ての製品をAI時代に対応し始めていると言うことです。
すでに、検索、マップ(ストリートビューで自動的にレストランの看板を認識)、ビデオチャット(ネットワーク状態に自動的に最適化)、など様々な形でDeep Learningが活用されています。
昨年、Google Assistantのリリースに合わせてリリースされたメッセージングアプリAllo(一向に流行る気配はありませんが、、)の機能、「スマートリプライ(会話の内容から自動的に回答オプションを提示する機能)」が、今回GMail向けにリリースされました。
じわじわと私の環境でも表示されるようになってきましたが、非常に便利で、内容も素っ気無さすぎず結構いい感じです。Predictive Typingと同様に、すぐに一般的になりそうな機能です。
AIの進化② Google Lens
AIの進化が著しい「画像」の分野で、新たに発表されたコンセプトが「Google Lens」です。
Google Lensは、「ユーザが何を見ているのかを理解をして、そこからアクションを取ることをサポートする」AI機能です。
まずは動画をご覧ください。
花の名前がわからない時にカメラをかざすだけで教えてくれたり、レストランの看板からそのレビューを表示したり、ルーターの裏の接続情報にカメラをかざすだけでWiFiに接続できたりすると言った、非常にスマートな機能です。
今後、Google PhotoとGoogle Assistantに導入され、そこから様々な製品に広がっていく予定だそうです。
AIの中でも画像認識、Computer Visionの進化は特に目覚ましいので、意外と簡単なことのように見えるかもしれませんが、これはFacebookでもなく、Amazonでもなく、膨大なKnowledge Graphを持っているGoogleだから実現できる機能です。
Googleが、検索を軸に膨大なデータを蓄積してきたことが結実した製品で、文字による検索と同様、今後確実に一般化する機能だと思います。
ものすごい余談ですが、この発表を見ていて、自分たちでちょうど10年前にウィルコムの端末に “Magic Loupe“という名称で同様のコンセプトのソフトウェアを提供していたことを思い出しました。もちろん認識精度や認識できる対象ははるかに及びませんが。
AIの進化③ Cloud TPU
Googleの膨大なデータ処理を司るデータセンターも、AI時代に合わせて進化を遂げ、「AIファーストデータセンター」を構築しているといいます。
昨年のGoogle I/Oで発表されたMachine Learningに適したチップ「TPU」は、従来のCPUやGPUよりも、15-30倍高速で、30-80倍エネルギー効率の良いチップでした。TPUは、現在Googleの様々な製品に活用されています。
TPUは、上の図にあるMachine Learningの二つの処理のうち、 学習(Training:どんな画像が猫かを教える)と推論(Inference:画像に写っているのが犬なのか猫なのかを判断する)のうち、推論にのみに適したチップでした。
今回、学習/推論、いずれの処理にも最適化された新しいチップ、Cloud TPUが発表されました。
Cloud TPUは、一つのボードに4つのチップが搭載されており、180テラフロップス(1秒間に180兆回の演算)の能力を備えていると言います。
日本の理化学研究所のスーパーコンピュータ「京」の18倍と言うとてつもない計算能力です。
そして、自社の製品に活用されるだけでなく、Google Compute Engineを通して誰でも活用できるようになると言うことです。AIソフトウェア、Tensor Flowをオープンソース化するのと同様に、コミュニティを巻き込んで一気にAIを進化させようと言うGoogleの意図が感じられます。
しかも、研究者たちは「無料」でCloud TPUが利用できると言うこと大盤振る舞いです。
今後、クラウド分野でのAIの競争にも注目です。
AIの進化④ Auto ML
Google全体として、AIに関する開発を加速するために「Google.ai」と言う新しい組織も立ち上げたようです。
Google.aiは、基礎研究(Research)、ツール開発(Tool)、アプリケーション(Applied AI)の三つの分野にフォーカスします。Google.aiの基礎研究の一つが、AutoMLです。
AutoMLは、現在大変時間がかかっているニューラルネットのデザインの部分を、「ニューラルネットがニューラルネットをデザインする」と言うアプローチを導入することで、高速化しようと言う取り組みです。
Cloud TPU上で、可能性のありそうなニューラルネットを複数準備をして、そこからニューラルネットによる学習のプロセスを回すことで、ベストなニューラルネットを見つけていくというアプローチです。
Computer Visionなどの分野ではすでに成果も出始めているといい、将来的には、Deep LearningのPh.Dがチームにいなくても、様々な分野で容易にAIの活用が可能になるかもしれないということです。
AIの応用という意味では非常に重要な研究になりそうですが、「AIがAIを作る」と聞くと、Singurarityの足音が聞こえてきそうで恐ろしくもあります。
AIの進化⑤ Proactive Assistant
次は、6か月前に、Amazon Echo対抗として登場したGoogle Homeの新機能、Proactive Assistantです。
現在は、利用者が「OK Google!」と話しかけることで、様々な情報や機能が提供されますが、Google Homeの側が、日々の生活のコンテキストなどを理解して、積極的(Proactive)な形で適切な情報を届けるというのが「Proactive Assistant」です。
Google Homeの側が利用者に伝えたいことがあると、上図のようにLEDが点灯します。それを見て、利用者が
“Hey Google, Whats’s up? “
と話しかけると、Google Homeが、
” 今は道が混んでるから、3:30まで公園に到着するためには、14分後までには家を出た方がいいよ”
みたいなアドバイスをしてくれます。
カレンダーに登録されているスケジュールを見て、道が渋滞しているという情報と合わせて、「Assistantが必要」とGoogle Homeの側が判断するということですね。
まずはシンプルなことからスタートするということで、リマインダー、渋滞、飛行機の遅れなどから始めるということです。Google Nowでやっていることの延長線上にあるものだと思いますが、より生活に割り込む形になるので、邪魔な存在にならないかどうかバランスが難しそうではあります。
このカテゴリーは、多くのAIスタートアップも取り組んでいる分野ですが、多くのアプリケーションと多くのデータを持っているGoogleこそが精度の高いアドバイスができそうです。
Amazon Echoにはこうしたインテリジェントな機能はまだ実装されていないので、対Echoという意味でも面白い機能だと思います。
AIの進化⑥ Suggested Sharing
次は、Google Photoの新機能、Suggested Sharingです。
2015年にリリースされ、アクティブユーザがあっという間に5億人を超えたGoogle Photoですが、Computer Visionを使った新しい機能が導入されます。
友達の写真やグループの集合写真は、あとでシェアすると言っても、実際は忘れてしまうことが多いです。
Suggested Sharingは、Google Photoにアップされた写真から特定の人物が写っている写真のベストショットを自動的にピックアップして、その人へのシェアリングを促す機能です。
新たにGoogle Photoの右端にSharingメニューが追加され、Computer Visionによって自動的にどの写真を誰にシェアするかをレコメンデーションしてくれます。
また、受け取った側も、そのアルバムには入っていない、自分のカメラで撮った写真の追加を自動的に促されるようになります。
こうしてAIが追加されることで、みんなが写っているアルバムが自動的に作成されて、みんなが見ることができるようになるという機能です。
私自身Google Photoのヘビーユーザですが、この機能は間違いなく使うと思います。
前回のポストでAmazonのコミュニケーション/ソーシャル分野への意欲について書きましたが、同じくソーシャルが弱みの一つであるGoogleにとっては、この「写真を軸にしたシェアリング」は今後さらに力が入りそうな分野です。
AIの進化⑦ VPS
最後は、ARでのAIの活用の話です。
昨年ついに搭載端末が発売されたGoogleのARプラットフォーム「Tango」ですが、今回Google Mapsのチームとの連携で新しい機能を発表しました。
GPSならぬVPSは、Visual Positioning Serviceの略で、画像認識を活用した屋内の位置情報サービスです。衛星を使うのではなく、カメラが周辺の画像情報を解析して、位置を把握するというアプローチです。
動画をご覧ください。
デモでは、大手ホームセンターLowe’sの店内でのナビゲーションの様子が紹介されました。
事前に測定された特徴情報が赤や青のドット、実際にスマホのカメラで認識された特徴情報がオレンジ色のドットで表現されています。このマッチングによりナビゲーションを行います。精度は非常に高く、すでに、数cm単位での精度が実現されていると言います。
利用者に見えるインターフェースはこのような形で、カーナビのような画面で、店舗の中を案内してくれます。
店舗内での案内以外にも、地下鉄、ショッピングモールなど様々な場所でおいて力を発揮しそうです。
あくまでTango対応端末が必要なので、一般化には時間はかかりそうですが、ぜひGPSレベルまで普及してほしい技術です。
ここまで、「AIの進化」ということに絞って、以下の7つのポイントをご紹介しました。
- AIの進化①:スマートリプライ
- AIの進化②:Google Lens
- AIの進化③:Cloud TPU
- AIの進化④:AutoML
- AIの進化⑤:Proactive Assistant
- AIの進化⑥:Suggested Sharing
- AIの進化⑦:VPS
その他にも、YouTubeの新しい投げ銭機能「Super Chat」、Android Oなど色々な発表があったので、ご興味がある方はキーノート(約二時間)を見ることをオススメします。
先月のFacebookのf8でもAIに多くの時間が割かれましたが、やはりサービス、データの多様性などから、Googleの方がAIの展開にも広がりがあるという印象です。
さて、昨年のGoogle I/Oの目玉であったGoogle Homeですが、現時点でのAmazon Echoとのシェア争いは下図のようになっています。
Amazon Echo自体の完成度が非常に高いのと、先行者メリットもあり、今の所はEchoに軍配が上がっています。
また先日発表されて、来月出荷が始まる「モニター付きEcho」Echo Showも、事前の調査では利用者からの評判も高く、Echo以上のヒットになるかもしれないとも言われています。
今回、Google Assistantは、iPhoneへの対応、日本も含む海外展開も発表されましたが、今後Amazon Echoとの争い、どうなっていくのか非常に注目したいところです。