「音声×テクノロジー」をテーマに、Voicy代表の緒方憲太郎がIT業界からさまざまなスペシャリストを招いて語り合う社内勉強会。今回は日本オラクルや日本マイクロソフトを経て、現在はLINEのDeveloper Relationsチームのマネージャー兼プラットフォームエバンジェリストを務める砂金信一郎さんがゲストです。
世界トップのグローバル企業で培った視野から、音声テクノロジーの未来を語り合います。
目次
実はVoicy起業時のメンターだった砂金さん
緒方:砂金さんとは、僕がVoicyを起業する前にベンチャー支援をしていたとき、マイクロソフトでエバンジェリストをなさっていた頃からのお付き合い。Voicyを起業した時にはメンターもしてもらいました。
それが今はLINEのスマートスピーカーClova含むAI領域のご担当で、すごく多彩なキャリアをお持ちなので、簡単に教えてもらってもいいですか。
砂金:新卒でオラクルに入社してERPパッケージを担当していました。2年ほど経ってから新規事業を任せてもらえることになり、当時は非常に高価だった「Oracle Database」の無制限ライセンスを、2年間だけ安価で使えるといった商品を作ってスタートアップ向けに提供したりしていました。
緒方:その頃が「仕事を一番頑張った!」って感じですか。
砂金:寝る間も惜しんで働いたのは、その次のローランド・ベルガーというコンサルティングファームです。勉強のつもりで約2年死ぬほど働いて、その後に誘われたスタートアップで上場も経験しました。
ただ、そこで「ビジョンなき上場はとても辛い」という体験をしたので、僕がもし会社を作ったらIPOしないだろうなと(笑)
緒方:上場によってできることが増えるならした方がいいけれども。
砂金:Voicyみたいに「生活を変えたい」というビジョンがあるなら上場した方がいいですよね。自分がやりたいことをやるだけならプライベートカンパニーがいいかなと。
緒方:スタートアップのあとは、マイクロソフトですか。
砂金:そうです。当時はAzureという名前すらついていなかったタイミングでしたけど、ヘッドハンティングでエバンジェリストとして入社しました。
緒方:すごいタイミングですよね。いまは当たり前ですけど、当時はマイクロソフトがクラウドに参入するなんて考えられなかったから。
砂金:IT業界全体が、クラウドサービスにシフトチェンジしようという頃ですね。マイクロソフトのような重厚な企業がクラウドをやるなんて面白い、と感じたんです。
その後がLINEです。最初はLINEのAPIを公開して、広く展開していくためのビジネス開発と調整をする役割。さまざまな企業と連携できたと思います。
スマホがなくなっても、音声は残る
緒方:現在はスマートスピーカーのClovaも担当されているとのことですが、どうやって始まったプロジェクトだったんですか。
砂金:LINEの取締役の舛田淳さんに「Amazon Alexaみたいなやつを作ろうと思うけど、砂金さんどう思う? 議論しようぜ」って言われたのが始まり。
僕はAzure側としてアマゾンのAWSに勝負を挑んできたから「アマゾンは危険」という立場です(笑) 「AWSはいいサービスだけど、Alexaは『すごく』いいサービスですよ」って言いました。
LINEを立ち上げた開発者に話を聞くと、どうしてもスマホのプラットフォームには、AppleとGoogleに縛られるというモヤモヤがあったんです。自分たちでプラットフォームを持って、もっと自由にやりたい気持ちがずっとあった。
そしてLINEもキャッシュの余力があるときで、プラットフォームを作れるタイミングだった。
緒方:でもプラットフォームはいろいろありますが、音声に関わるテクノロジーを選んだ理由とは。
砂金:理由としては、「スマホがいつまでもポケットに入っていない可能性」を考えました。スマホがなくなっても、LINEが残るようにしたい。
でも人間同士がコミュニケーションするうえで、音声は残るだろうと。LINEは他のメッセージングツールと比べて、情報よりも「気持ち」を送り合うから、テキストやスタンプだけでは送れない感情をやりとりするのに、音声は非常に相性がいい。
緒方:実際つくって販売してみてどうでしたか? 手ごたえがあったのか、「やっちゃったなー」なのか。
砂金:最初は「やっちゃった感」ありましたね(笑) デバイスが使われなくなり、「文鎮化」している率が思っていたより高くて……。LINEらしい解決策として、Clova Friendsという名前で、スピーカーに顔を付けて販売してから、だいぶ方向性が変わってきたと思います。
おばあちゃんが「クローバさん(機械にさん付け)、今日の天気を教えてくださいね」と同じ目線で話しかけたり、限定のドラえもんモデルでは「本当にドラえもんと話せる日が来るなんて」という声があったり。
僕らのやるべきは機能やスペックの追及ではなく、LINEユーザーに愛されることだったんです。
スマートスピーカーの課題は「勝手にしゃべれないこと」
緒方:「気持ち」に寄り添うところはVoicyの考え方に近い。Voicyは、音声に触れる時間が長くても快適でストレスのないように設計しています。
平均で1日40分以上使われているので、エンゲージメントは高いほうだと思う。現在は、見守り系のロボットからVoicyの音声を出したいという話にもなっていて、果たしてどれくらい聞いてもらえるのかなと思っているところです。
砂金:とても共感します。一方でいまスマートスピーカーとしてはプッシュ通知ができないという課題もある。まだ話しかけたことに応えるだけなんですね。
勝手に音声を発するデバイスになるためには、ユーザー側の経験値を上げたり、パーミッションを取る必要がある。
緒方:いらないコンテンツの提案は、いらないですからね。いまもVoicyのプッシュ通知はオフにしている人が多い。僕らは「ありがとう」と思われるところにプッシュできるようにしていきたいと考えています。
例えば、高齢の方がエレベーターの前に来たら「足元お気を付けくださいね。エレベーターに乗っている間、少しお付き合いください」と音声を流せるかもしれない。
砂金:なるほど。音声をずっと流せる状態を作って、その中に挿し込むのであればパーミッションを取る必要はないですね。「常に流れている状態」をいかにつくるかが大事なのかな。
エレベーターやエスカレーター、公共交通などは相性が良さそうですね。アプリをインストールしてもらうのは壁があるので、オープンな空間で体験してもらって「これって実はVoicyなんだ」とわかってもらえればいい。聞く方にとっては、radikoもVoicyも区別がないと思うので。
緒方:移動しているときは常に流れているという状態にするなら、APIの公開も検討していきたいところです。
砂金:Voicyをいろいろな場所で聞けるようにするなら、自分たちだけでは限界があります。他のプレーヤーがやってくれれば一気に広がる可能性があるでしょうね。
他の組み込みデバイスに導入したいときや、外部で開発するときの規約などは取り組んだ方がよさそう。
音声コンテンツの感情分析が強みに
緒方:APIを公開する際にコアバリューが必要だと思うんです。この分野で技術的な強みを持つとしたらどんなところに可能性があると思いますか。
砂金:ディープラーニング的な手法だとは思います。ただ、自然言語解析はやりつくされた感があるので、共感されて、気持ちが届くコンテンツの「感情分析」はいいかもしれませんね。
「こういう声色やペースならすごくウケる」と分析できると、GoogleやFacebookといったグローバル企業からも「すごいことやってるじゃん」と注目されると思う。
コールセンターで「苦情か感謝か」をスコアリングする技術はあるけど、もっとエモーショナルなところを分析するのは可能性がありそう。
緒方:それを僕らが分析して公開すれば、コンテンツがどんどんよくなっていきますね。
砂金:それを動画でうまくやったのがTikTokだと思うんです。多くの人が、つい見てしまうような編集方法を突き詰めたものだから。押しつけじゃなくて、楽しみながら実現されるという意味で、TikTokはすごく学ぶことの多いアプリですね。
好きなサービスを開発できるのはとてもハッピーなこと
緒方:TikTokは本当にうまいですよね。砂金さん、今日いらっしゃってみてVoicyってどんな会社に見えますか。
砂金:社員の方はVoicyのファンだった人が多いんですよね。好きなサービスの開発側に回れるのはとてもハッピーなことです。人に何かを伝えるには、自分が本当に楽しいと思っていなくてはならないから。もし挫折することがあっても楽しそうに仕事をすることは変えないでいってほしいです。
緒方さんは業界の知見が深い方なので、その経験値に間近で触れられるのは時間やお金に換えられない価値だと思います。
緒方:いま全職種で採用もしてるので誰かいい人いたら紹介してください! 今日はありがとうございました。
Voicyでは今後も様々なキーパーソンをお招きして、音声の未来に関する勉強会を開催します。引き続きレポート記事でも公開していきますのでお楽しみに。
ライター:栃尾江美
ERPのエンジニアを経てライターへ。ITライターからスタートし、数年前よりインタビューを中心に活動中。ポッドキャスターとしても5番組に出演。Voicyでは「コルクラボの温度」を配信している。二児の母。