「そのデータサイエンスは、本當にビジネス貢獻できていますか? 」
ー『効果検証入門』著者が語るデータサイエンスのあり方ー

技術?デザイン

「ビジネスに貢獻出來ないデータサイエンス」の需要はいつか無くなる。
そう話すのは、AI技術の研究開発組織「AI Lab」の経済學チームでリサーチサイエンティストとして活躍し、今年1月に出版した著書「効果検証入門」が反響を呼んでいる安井。
経済學を用いてデータサイエンスの理想の形を追求、共同研究でも數々の実績を殘している安井に、データサイエンスをよりビジネスに活かすための方法を聞いてみました。

Profile

  • 安井翔太 サイバーエージェント AI Lab Economic Research Scientist
    2013年Norwegian School of Economics MSc in Economics 修了後、サイバーエージェント入社。 入社後は広告代理事業にて広告効果検証等を行い、2015年にアドテクスタジオ(現AI事業本部)へ異動。以降はDMP?DSP?SSPと各種のアドテク商品においてデータを元にした意思決定のコンサルティング等を擔當。 現在はAI LabのEconグループのリーダを擔當。

事業に貢獻するには。自分なりの「データサイエンスの正解」

──ノルウェーで経済學を學んだ後、どうような経緯で新卒でサイバーエージェントに入社したのですか?

學生の時は環境?資源経済學における実証に興味がありノルウェーの大學院で「養殖サーモンの価格に周期性が存在するのか?」というテーマに取り組んでいました。
就職活動では業務の中でデータを扱う事が出來る會社を探していたのですが、2013年當時、企業の中でどうデータ分析に攜わるのが正解なのかは誰もよく分かっていませんでした。そういった不確実性の高い未來がある場合は、自分で判斷し挑戦できる環境にいることが重要だと思いました。そのため會社がどの程度の裁量や自由度を與えてくれるかに重點を置いて様々な會社を見ていたのですが、僕の知る限りではサイバーエージェントが當時ダントツに自由度が高いと感じ、志望しました。
また、「ビジネスに貢獻出來ないデータサイエンス」の需要はいつか無くなると思っていたので、ビジネス貢獻のイメージを具體的にするためにエンジニアコースではなくビジネス職として入社しました。

──ビジネス職で入社し、そこからどのように現在のAI Labの研究職に辿り著いたのですか?

入社してから2年ほどは、インターネット広告事業本部のディスプレイ戦略局で、基礎的な統計と集計でマーケティングデータを扱うコンサルのようなことをしていたのですが、ある日、役員の內藤から「機械學習をやってほしい」という話をもらい、2015年にアドテクスタジオ (現AI事業本部)に異動しました。

──突然のミッション変更だったのですね!

入社してからはR言語くらいしか使っていなかったので、今考えたら相當なチャレンジだったと思います。 2013年に立ち上がったアドテクスタジオでは、既にデータサイエンティストが複數名いました。機械學習のバックグラウンドとエンジニアリング技術も持っているような方々だったので、自分が出る幕はほぼありませんでした。機械學習という新しい分野に觸れる楽しみもありましたが、自分がその場では何の価値もないかもしれないという不安と焦りは今でも覚えています。そこから、より「エンジニアとしての技術が無い自分が、どうやってプロダクトに貢獻するのか」を考えるようになったと思います。その結果として「機械學習とビジネスの関連」、つまり機械學習が事業の売上などのKPIに対して持つ因果効果や、機械學習の予測値を使った意思決定方法に興味を持つようになりました。

──そして2016年AI Labの立上げと、経済學チームの発足に繋がるのですね。

2016年に初期メンバーの一人としてAI Labを立ち上げました。開発チームと喧嘩したりと、當時は大変なこともありましたが(笑)、協力して研究開発の體制を模索してきました。2017年には、これまでの取組みを「経済學と機械學習の融合」として捉えてR&Dとして認めてもらい、AI Lab経済學チームを結成することができました。今振り返ってみれば、自分がこれだと思う研究テーマに自由に挑戦させてもらう中で、自分なりのデータサイエンスの正解を見つけられたので良かったと思います。

因果推論で評価する、事業に対するデータサイエンスの貢獻度

──データサイエンスの正解とはどのようなイメージですか?

シンプルに、データサイエンスプロジェクトが何によって評価されるのかを明確にし、その評価が改善されるタスクの設計や手法の選定を行うといったものです。データサイエンスが「ビジネスやサービスの質に貢獻する」ことをゴールにするのであれば、その貢獻度合いが當然評価の対象になるべきです。

──では、データサイエンスの貢獻度合いはどのように評価するのでしょうか。

この貢獻度合い評価に関しては、ABテストや因果推論が大きな役割を果たすと考えています。しかし、このような因果効果による評価が行われるときに、どのような手法を利用すれば良いのかはあまり明らかになっていません。
例えば機械學習モデルの評価が最終的にはABテストで行われるにも関わらず、どのモデルをABテストに掛けるかはそれとほぼ関係性がない精度指標で決められる狀況はよく見られます。

──新たな著眼點と実績が認められ、前回のサイバーエージェント全社総會では最優秀ベストエンジニア賞を受賞されていましたね!おめでとうございます。

サイバーエージェント全社総會での受賞の様子
サイバーエージェント全社総會での受賞の様子

ありがとうございます。AI Labの経済學チームでは先ほど説明したデータサイエンスが因果効果で評価されるときに必要となる手法の研究と応用を行っています。既存の機械學習やデータサイエンスの手法の多くは、因果効果による評価が行われる場合を想定していません。よって、これらの手法を因果効果によって事前に評価する方法と、それに基づいてモデルを學習する手法が必要となってくるので、共同研究を行っているイェール大學の成田悠輔先生とは、このテーマの中心的な課題であるモデルの評価に関する研究を行っています。

チームを立ち上げた當初は、社內でも「こいつは何よくわからない事をやってるんだ?」という疑問を持たれることもありましたが、共同研究の取り組みを通してテーマの重要性について理解してもらえる事が増えてきましたし、経済學の重要性を理解してもらえる事はとても嬉しく思っています。

ビジネス貢獻につながる産學連攜の形を作り上げていきたい

──産學連攜を通して、どのような発見があったのでしょうか?

イェール大の成田先生との共同研究は、自分が因果推論と機械學習の組み合わせが重要だと思い始めたタイミング、研究に集中できるAILabの環境、以前のインタビューでも紹介したように「成果の出ないダサい産學連攜はやらない」という成田さんの強烈なモチベーションといった條件が上手く重なった研究プロジェクトでした。その結果AAAIで論文が採択されたり、そのほかにもCCSE2019日本経済學會でパネルディスカッションしたりと楽しい産學連攜ができていると思います。

──日本とアメリカ、遠隔での共同研究は大変ではなかったですか?

特に不都合はありませんでした。帰國なさった際に打ち合わせもしていましたが、普段もSlackで連攜をとっていたので。また、研究組織の成長という観點においては、成田先生と矢田さん(イェール大學の大學院生)の研究の進め方から、色々な學びを勝手に得させてもらいました。ここで得た學びはその後の研究プロジェクトに大きな影響を與えています。

──どのような影響があったのでしょうか。

特に社內メンバーのみで立上げた研究開発プロジェクト、「遅れCVプロジェクト」ではこれを最大限に利用して研究を進め、國際カンファレンスのThe Web Conference 2020 (WWW’ 20)に採択されています。この共同研究で多くのことを學べていなければ、社員で書いた論文が國際會議で採択されるような研究開発の環境は作れなかったと思います。こういった経験を得たことで、國際學會での論文採択を積極的に狙う研究インターンも実施出來るようになりました。研究組織を成長させるという點でも非常に大きな學びがあった産學連攜だと思います。

成田先生と一緒に研究を行っている様子
成田先生と一緒に研究を行っている様子

──民間企業とアカデミアの共同研究のあり方を模索し、実踐していく、と。

「そもそも共同研究なんてやってて意味があるのか?」「もっと地に足のついた事をやったら?」という産學連攜に対するそれっぽい否定的な意見は各所で聞こえてきます。僕としてはむしろ、どうやったらデータサイエンスをビジネスに貢獻できる形に仕上げられるのかがよくわかってないのに、その正解を模索せずに古い教科書をありがたがって輪読し続けたり、役に立つかもよくわからないような機械學習モデルを実裝して悅に浸ってたり、謎のデータサイエンス組織論を振りかざしている事こそリスクなんじゃないかと思います。

もっとビジネスに貢獻できるデータサイエンスをつくり上げるために、今後も色々な産學連攜のテーマや形を模索していきたいと思っています。

著書「効果検証入門」に込めた思い

2020年1月、著書「効果検証入門」を出版。

──このような取り組みの中で執筆された「効果検証入門」が非常に話題になっていますね。 

基本的に自分自身がデータ分析に興味を持ち始めた學部生の時に知りたかった內容についてまとめているので、経済學の先生達にも入門書としてお勧めして頂いたのはかなり嬉しかったです。
効果検証入門は、先ほど述べたような「データサイエンスの正解」の一歩めに當たる、評価の部分で使われる因果推論?計量経済學の入門書です。大まかには「どうやって適正な評価を行うのか?」について書いています。データサイエンスプロジェクトの効果の測り方はあまり意識していない人が多いと思います。しかし、「インパクトの最も正しい測り方が何か?シンプルな測り方の何が問題か?」といった基本的な知識が無い狀態で、ただ機械學習をビジネスに投入すると、その評価がよくわからず、何の効果も無い事をただ続ける狀態にもなりえます。これはデータサイエンティストにしてみれば、長期的には何の経験値も得られない無駄な時間を過ごすことになってしまいます。「効果検証入門」を通じて、自分の分析が何で評価されるかをしっかりと理解した上で、自分の分析を進めるといったデータサイエンスの基本的なスタンスが広まると良いなと思っています。

──AI事業本部ではどのように評価方法が取り入れられていますか?

AI事業本部でのデータサイエンスが面白いのは、データサイエンティストがプロダクトチームに所屬してプロダクトに深く入り込むことで、データサイエンティストが事業の意思決定に対して影響を與える事が可能な點にあると思います。そして、AI事業本部ではこの利點を活かしてデータサイエンスの評価を自ら設計する行う事が出來ます。実際にこの利點を評価の設計に活かしてもらうために、新卒向けのデータサイエンス研修では「効果検証入門」に書かれているような內容の基礎的な部分を紹介しています。

──最後に今後のキャリアやチャレンジしたいことを教えてください。

研究で今後目指していることは、因果効果をビジネスにもたらせる機械學習?データサイエンス技術の開発と応用です。この他にも因果推論と機械學習以外にもインセンティブ設計に関する応用にも何か関われたら良いかなと考えており、これについても何か面白い報告をいつか行えたらと思ってます。また、今回適正な評価を行うための入門書を書いたので、その続編に當たるような適正な評価を改善するためのデータサイエンスについても何か書く機會が得られたらと考えています。

また、データサイエンスという観點では、上で挙げたような技術を円滑に利用できるデータサイエンス組織の形成にとても興味があります。因果効果を代表とする経済學の考え方を導入するためには、中途半端にデータ主導な意思決定が染み込んだ組織の文化を破壊して変えていく必要があります。AI事業本部內に設立した、データサイエンティストの橫斷組織であるデータサイエンスセンターでの活動を通して、そういったスクラップ&ビルドに取り組んでいきたいと思います。

2021年度新卒採用エンジニアコース本選考エントリー受付中

2021年度卒エンジニアコースのエントリー受付中です。職種に沿ったインターンシップやイベントの情報をご案內させていただきます。みなさまからのエントリーをお待ちしています。

この記事をシェア

オフィシャルブログを見る

初の試み!エンジニア?クリエイターのための
表彰式「CA BASE AWARD」をオンライン開催

技術?デザイン

サイバーエージェントでは先月、社內で活躍するエンジニア?クリエイターを表彰するための「CA BASE AWARD」を開催しました。新型コロナウイルス 感染癥拡大の影響をうけて、リアル開催の予定をオンライン開催へと急遽方向転換。オンライン表彰式を盛り上げるために、番組仕立てでライブ配信を行いました。今日はこの「CA BASE AWARD」の様子や開催に至った背景についてご紹介します。

Page Top
 
成年片黄网站色大全免费