「AIファースト」のGoogleと「Peopleファースト」のFacebook
先週はGoogle、Facebookとテック大手の二社が、それぞれのイベントで新製品の発表をしました。
そこでCEOが使ったキーワードは、それぞれ「AIファースト」と「Peopleファースト」。
最近のテック業界の話題の中心であり、人々の仕事を奪うのではないかと恐れられてもいる「AI」を前面に押し出したGoogle。
そしていみじくもそれに対立するかのように「People」を押し出したFacebook。
今回のポストでは、二人のCEOのスピーチから、両社それぞれの立ち位置と今後の狙いについて考えてみたいと思います。
よりユニバーサルな存在を目指すGoogle
まずはGoogleです。
今回のイベント(全体動画:1.5時間)のテーマは「Made by Google」ということで、5月の開発者会議 Google I/Oで発表されていたスマートホーム端末「Home」やVRヘッドセット 「Daydream View」など、5つのハードウェア製品が発表されました。
- Pixel(スマホ)
- Daydream View(VRヘッドセット)
- Google WiFi(WiFiルータ)
- Chromecast Ultra(ストリーミング)
- Home(家庭用アシスタント)
しかしながら、今回の主役は、冒頭ステージにたったCEO ピチャイが説明したとおり、個別のハードウェアではなく、それらのプラットフォームとなる「AI」でした。
ピチャイは冒頭で、まずPC、Web、Mobileと、この20年のコンピューティングの歴史を振り返ります。
その上で、これからは現在の「Mobileファースト」から、「AIファースト」に移っていくと話しました。その背景にあるのは、デバイス環境の変化とAIの進化です。
今後、ユーザは、スマホだけでなく様々なデバイス、様々な文脈でGoogleを使うことになる。その際、Googleはこれまでの「万人向けのGoogle」から、より「パーソナルなGoogle」を目指していく。その核となるのがAI、Google Assistantだということです。
Google Assistantのショートクリップでは、ユーザが、AIと様々な文脈、様々なデバイスでどうやりとりをするのかが紹介されます。上の図にあるように、これからはスマホだけでなく、どんなデバイスからでもGoogleが利用できるようになり、そのベースにAIが存在するというメッセージです。
締めくくりとして、最近のAIの進化の説明がありました。
ナレッジグラフを含め、18年間のGoogleの歴史の中で積み上げてきた技術が、Machine LearningとAIにより急速に進化していると。ピチャイは具体的に三つの技術分野の進化について説明しました。
一つ目が「イメージキャプション」です。
コンピュータが画像の中身を理解して、キャプションを生成するというものです。
初めて製品をリリースした2年前は約90%程度の精度だったものが、この2年で4%向上したそうです。
例えば、こういう画像を入力すると、以前は単に「電車」と言っていたのを「青と黄色の電車」と言えるようになっていたり、
こういう画像に対して、「茶色いクマ」と言っていたのが、「二匹のクマが岩の上にいる」と数や状態を詳しく認識することができるようになったということです。
二つ目が「機械翻訳」です。
上記は中国語でのGoogle翻訳の例ですが、これまでは単語や文節で翻訳(左)をしていたのが、最近リリースされたAIベースの機械翻訳(中)は全体の文章を元に翻訳を行うもので、人が翻訳したもの(右)にかなり近いクオリティを実現しているということです。
数値的に見ても、かなり人による翻訳のクオリティに近づいているということです。
三つ目は「文字読み上げ」です。
検索結果などを音声で読み上げるものですが、これまでは、レコーディング施設に人を集め、たくさんの音声を録音した上で、それを小さなフレーズに分割、統合して自然な音声を作っていたそうです。
ところが最近、DeepMindが新たに発表した、DeepLearningをベースにしてさらに自然な音声を作る WaveNetというモデルで生成される音声は、人間の会話のクオリティに大きく近づきつつあるということです。あのGoogle Mapのぎこちない読み上げもナチュラルになるということですね。
さらに進化していくと、言語、個人によって最適化された音声を合成することができるようになるということです。
今回の発表の中心であったGoogle Assistantは、2週間前にリリースされたメッセージアプリ「Allo」で実際に触ることができます(日本語非対応)。
私が実際に使ってみた印象としては、特にWow!というものはなく、AmazonのAlexaやAppleのSiriと同等のレベルのことはできるものの、まだ精度、インターフェースともこれからといった感じです。ピチャイも言っていましたが、まだ初期バージョンという印象です。ただ、今回発表されたスマホのPixelや新しいバージョンのAndroidには搭載されるということで、今後の進化が楽しみです。
今回発表されたHomeなどもAmazonのEchoの後追いと揶揄され、発表されたハードウェアにはユニークさが感じられないとの声も多かったGoogleですが、特定のハードウェアに依存せず、着々と次のソフトウェアプラットフォームとしてのAIを進化させている様子はさすがに「横綱相撲」という印象を持ちました。
ソーシャルをテコにHWプラットフォームをとりにいくFacebook
一方のFacebookです。
今回開催されたイベントは、VRヘッドセット Oculusの開発者向けイベントOculus Connect3です。なかなかリリースされなかったOculus用のモーションコントローラ Touchの発売がようやく発表されました。先行するViveのコントローラよりも優れているという話もあるので楽しみです。
ハードウェア的に言うと、これまでOculus普及のハードルの一つであった「高性能PCが必要である」という点を解消するスタンドアロンのデバイス「Santa Cruz」のデモも紹介されました。価格や発売時期などはまだ未定のようですが、これがリリースされるともう少し裾野は広がるかもしれません。
一方で、冒頭で登場したザッカーバーグが、開発中の機能に関しての面白いデモを紹介しました。そのキーワードが「People First」というわけです。
まずヘッドセットをかぶると、同じルームにいる二人のアバターが現れました。アバターの上に、ファーストネームとFacebookのプロフィール写真が表示されています。アバターは自分で細かく肌の色や特徴などを指定できます。最大8人までと同時に会話することができるようということです。
実現方法の詳細はよくわからなかったですが、このアバター、表情や感情の表現が可能です。笑う、驚く、とまどうなどをアバターで表現できるそうです。
また、それぞれのユーザが、自分たちのいる環境を、海底、火星など簡単に置き換えることができます。これは学校の授業やスポーツチームのトレーニングなどで使えそうですね。あとは、建築の現場とか。
また、トランプ、チェスなど一緒にゲームを楽しむこともできます。Touchを使うと結構細かく操作ができている印象です。
Facebookが絶賛プッシュ中の動画視聴にも対応しています。自分のタイムラインにアップされた動画をみんなで一緒に見ることができます。
先日行われた大統領選のディベート動画は、かなりFacebook Liveでみられていましたが、こうしたイベントやスポーツ、などは友達と一緒に見るというのは面白いでしょう。
これまた、最近FacebookがプッシュしているMessengerでのビデオ通話にも対応しています。実際にザッカーバーグの家のリビングに行き、奥さんからのビデオコールを受けていました。
さらには、自分はアバターのまま奥さんと一緒にセルフィーを撮るというデモも。
デモの全体の完成度は非常に高く、FacebookがソーシャルをVRにインプリするとこうなるよなという印象です。試してみたい!と思う一方で、これが一般化して、普通のユーザがスマホを机に置き、Oculusでこうして友人たちと会話をする日が来るのかというと疑問です。
ただ、改めてザッカーバーグの「VRにかける思い」を感じました。
2014年にOculusを買収した直後のポストにも書いていありますが、「スマホの次」としてVRを強烈にプッシュするために、自社の強みである「People = Social」を前面に出し、VRをプラットフォームとしてなんとか広めたいという意識を感じます。17億人が毎月使うサービスを持つ強みを最大限使おうとしていますね。
Webでスタートし、スマホの風をうまく掴んでここまで成長したFacebookですが、やはりAppleとGoogleのプラットフォームの上で踊らされていることはまちがいなく、次はハードから握りたいという思いがあるのでしょう。
VR自体は、GoogleもAndroid端末で使えるDaydream、そしてヘッドセットを必要としないTangoを発表しており、来年以降一般ユーザにも徐々に浸透していくと考えています。
とはいえ、Facebookにとっては、自社プラットフォームを握ることと、引き続きAndroidの上の一アプリであり続けるということには大きな違いがあります。
がむしゃらに自社プラットフォームを進化させる「チャレンジャー」のFacebookと、「横綱」Google。それぞれの立ち位置と狙いの違いが見えて面白かったです。