普及が進むスマートスピーカー
─ さて、座談会の前半では近い将来、ビジネス化しそうなものとして「スマートスピーカー」を活用した「音声AI」が挙がりました。その理由は何でしょう
岩井 スマートスピーカーの販売がすでに行われていて、一般家庭に向けた普及が進んでいるというのが一つの理由です。現状、日本国内の普及率はまだ10%未満ですが、アメリカではすでに20%もの家庭にスマートスピーカーがあります※1。ここまでの普及の速さは、iPhoneとほぼ同じなんだそうです。
※1 アクセンチュア「デジタル消費者調査 2018」、米COMSCOR社「Smart Speaker Pene tration Hits 20% of U.S. Wi-Fi Households」
─ 端末が普及すれば、企業も注目するでしょうし、必然的にニーズは高まりますね。
岩井 日本でも同じように普及が進んでいくかはまだわかりませんが、IoT用のデバイスとして使われたり、車の中で使用されるケースが増えてくるだろうと考えると、この数年のうちに状況が大きく変わるだろうと。
─ 代表的な製品としてはAmazonの「Echo」、Googleの「Google Home」、さらには最近発売されたAppleの「HomePod」といったところでしょうか。
岩井 アメリカのシェアを見ると、2014年に発売されたEchoが一歩リードしているんですが、最近はGoogle HomeやHomePod、そして中国系メーカーの製品が猛烈にシェアを伸ばしています※2。
※2 Strategy Analytics「Strategy Analytics: Amazon’s Global Smart Speaker Share Falls Below 50% in Q1 2018 as Competition Heats Up」より
─ ではそのスマートスピーカーを、制作会社はどんなふうに活用すればいいのでしょうか。
岩井 スマートスピーカーには、スマートフォンのようにアプリを追加することができるんです。それを「スキル」と呼ぶ(Echoの場合。Googleは「アプリ」と呼んでいますが、本記事では「スキル」と表記します)のですが、そのスキルを企業の課題解決に活用したり、サービスに活用したりといったことができるんです。
中村 ただ、現状では面白いスキルってほとんどないんですよね。雨音を流すだけとか、銀行口座の残高を教えてくれるだけとか。
大内 何ができるか、とりあえず試しにつくってみたようなスキルが多いんですよね。だから仕組みもシンプルで、語りかけたことに対して、一つ答えを返すようなものにとどまってしまっているんです。
─ 確かに、まだこなれていない印象があります。
大内 そこに一つ、工夫を加えるだけでも、もっといいものができるようになると思うんです。例えば「なんか暑いなあ」と発話したら、その時の温度や湿度によって、冷房か除湿かを自動で決めてくれるとか。
今のスキルは面白くない
岩井 ただ、そういったアイデアを実現できない理由もあるんです。僕らの周りでは「隠し機能」なんて呼んでたりするんですが、スマートスピーカーの今の技術でも十分に実現できるのに、あえて制限しているだろうと思われる機能がたくさんあるようなんです。
大内 例えば、スマートスピーカーの前で会話している内容を聞き取って、その内容に沿ったアドバイスをするといったことはできませんし、連続した会話の中身をデータベースに保存して学習するような機能も使えない。これらは、あえて使えないようにしてあると言われています。
─ そういった機能は将来使えるようになる見込みはあるんでしょうか?
中村 具体的にはわかりませんが、スマートスピーカーが一般化して、ユーザーがより多くの機能を求めるようになったところで、使えるようにしていくつもりなのかもしれませんね。
岩井 EchoのAIアシスタント「Alexa」には、外部のデータベースにデータを見にいく機能があるんですが、この機能、リリース当初は使えなかったんです。それができるようになったので、先程中村さんが話していた、銀行口座の残高を確認するスキルが作れるようになったんです。その他にも、アメリカなどでは、いちいち「Alexa」と呼びかけなくても、連続して会話をする機能が解放されたので自然な会話ができるようになっています。
大内 Google Homeの場合、個人を認識する機能が解放されましたね。例えばお父さんが問いかけた場合と、お母さんが問いかけた場合、子どもの場合で、答えを変えることができるようになった。
岩井 個人に関する情報というと、現状ではアメリカ限定ですが、Alexaに任意の情報を登録できるようになりました。例えば、奥さんの誕生日や結婚記念日をあらかじめ登録しておくと「結婚記念日いつだっけ」といった質問に答えてくれるようになったんです。
─ そう聞くと、機能が解放されるに従ってかなり可能性が広がっていく印象を受けます。将来的にはどんなことができるようになると考えますか?
こんな活用方法が面白い
中村 個人的な願望も含めて言うと「HR(Human Resources:人事関連)」の分野が進化してくれるといいなぁと思っているんです。総務や人事と面と向かってやり合うのが苦手なので、スマートスピーカーを使って質問すると回答が来るといったような仕組みができると嬉しいですね。
大内 その手のものだと、転職情報系のサービスでAIを活用したものが登場してきていますよね。
中村 アメリカではIBMのWatsonを使ったサービスで、学生の進路相談を音声AIで行うものが実現しています。たとえば「雑誌の編集者になりたい」などと話すと、登録情報をもとに、「その仕事にはこういうスキルセットが必要だから君には向いていないよ」などと答えてくれる。
岩井 AIが答えるからこそ、客観性が担保できるというメリットはありそうですよね。例えば人が面接すると、相手の容姿や年齢などで、どうしても特定の印象を持ってしまうけれど、AIならそういうことはない。
中村 引き出すのがうまいとか下手だとか、関係なくなりますからね。人数が多く、コストのかかる一次面接なんかにはいずれ使われそうです。
大内 AIって、そういった高度に属人化した判断の肩代わりができるんですよね。
「ある人にしかない知識や経験」に対するコストが削減される。そう考えると、社内の、社員からの問い合わせに答える音声チャットボットの導入なんていうのはすぐに役に立つ分野だと思いますね。
─ 「年末調整ってどうやればいいの?」みたいな質問にいつでもすぐに答えてくれるわけですね。
岩井 僕は医療の領域が注目なのではないかと思っています。医療に関するやり取りは専門性の高い分野で、しかも領域が広いため一人ですべてをカバーするのは難しい。そういった相談をするのにはAIが最適なんじゃないかと。さらにそれをスマートスピーカー経由で相談できるようにすれば、スマホが苦手なお年寄りにも使ってもらえる。今後、高齢化や人口減少が進んでいく中で、こまめな訪問医療などは難しくなっていくでしょうし、ニーズは大きいかなと。
大内 あとは教育関連ですかね。スマホやタブレットだと、子どもがゲームをやっているのか、勉強しているのかわからないんですが、音声だと親にも勉強しているということがわかる。そういう「音ならでは」の仕組みづくりはありだと思いますね。
音声AIを仕事にするには
─ 今後注目のスマートスピーカーですが、制作会社としては、どう仕事に組み込んでいけばいいのかという話をしていきたいと思います。まずはスマートスピーカーとスキルの関係性を説明してもらいたいのですが。
中村 ちょっとややこしいので図?で説明させてください。まずスマートスピーカーが音声を認識します。きっかけは「Alexa」だったり「OK Google」といった発話ですが、そのうえでユーザーの命令を聞き取ります。そうしたら、聞き取った音声の波形データの状態からテキストを抽出します。このあたりがAIの仕事です。スマートスピーカーのことを「AIスピーカー」と呼んだりするのもこれが理由ですね。
─ スマートスピーカーでテキストを抽出したら、それを解析するんですね。
中村 そこから自然言語処理の領域に入ります。意味の分類をして、いったい何の話をしているのかを検討するんです。「意図分類」と呼ばれる作業ですね。
前川 Alexa用のスキルをつくる場合、このあたりまでが音声スピーカー側の処理で、この先はサーバ側、Amazonだと「AWS Lambda」に置かれたプログラムで処理することになりますね。
─ 図で「スクリプト」と書かれた部分ですね。
岩井 さらにその先に、外部データベースも接続できます。
─ スキルの開発は難しいですか?
前川 ライブラリも用意されていますから、試しにちょっとしたスキルをつくってみる程度であれば、あっという間にできてしまうと思います。ただ、スマホアプリなどとは勝手が違うところも多いので、複雑なものをつくるには腰を据えて取り組まないといけないかなと。
─ 例えばどんな点でしょうか。
前川 やはり音声のUIが視覚的なUIとは異なる点でしょうか。実際にコミュニケーション設計の部分が違うんですよね。
大内 音声を使ったコミュニケーションというのは、通常の画面を使ったUIとは大きく考え方が違うんです。例えば「スマートスピーカーでシャツを売る」という例で考えてみます。
音声でシャツを売る?
大内 WebのECサイトでは、例えば「衣類」のカテゴリから夏服か冬服を選び、さらにワイシャツなのかTシャツなのかを選んでいくような流れになるわけですが、音声の場合だと画面がないからそれはできない。そこで考えないといけないは、ユーザーから「シャツを買いたい」という発話があった場合に、どんな質問で返せばいいのかという点です。
─ うーん、難しいですねえ。
大内 これは、この記事を読んでいる方もぜひ考えてみてほしいんですが、例えばその答えの一つは「今、どんな気分ですか?」だったりするんです。気分を尋ねて、そこからイメージされるシャツを提示しようというわけです。
岩井 こうした答えはUXデザインのアプローチでしか見つけることができないかもしれません。
大内 ILY.ではこれまでに何回もスマートスピーカーのUXを考えるワークショップをやってきました。そうした検討を重ねれば、勘所はつかめると思います。
─ スマートスピーカーのUX的なアプローチについてはあらためて紹介をしたいと思いますが、まずとはこういった試行錯誤を繰り返してみるというのが大事そうですね。
岩井 はい。WebサイトやWebサービスを手がけてきた制作会社にとって、スマートスピーカーを使った音声サービスも、「コミュニケーション」をつくりだす、という点で同じ方向性にあると言えると思います。勝手は違うと思いますが、これまでの経験が活きる分野でもあるんです。
中村 さっきも言いましたけど、まずは一歩踏み出すってことですね。試してみれば、できることできないことは見えてきますから。
─ 今日は長い時間ありがとうございました。