2017年09月08日

高校からAIを学び新卒で小売業へ。深層学習の雄が歩んだキャリアとは？

まったく流行っていなかった高校時代からAIに興味をもち、学んだ末新卒で小売業へ。
深層学習で数多くの実績を持ち、『コンピューターで「脳」がつくれるか』の著者でもある五木田さんは、なぜその道を選び、どこを目指すのか？など聞いてきました。

五木田　和也

2011年千葉工業大学卒業。
大学では機械学習、画像認識など人工知能関連技術の研究を行う。
2012年株式会社ウサギィに入社。
自然言語処理、画像認識を中心とした機械学習まわりの開発などを行っている。
現在は株式会社ウサギィの取締役を務める。

著書：コンピューターで「脳」がつくれるか（技術評論社）

AIに人生をかけたいと思ったが、以前は厳しい状況だった

これまでの経歴について教えていただけますか？

大学に入る前から人工知能に興味がありました。
今でこそ騒がれていますが、10年以上前の当時はまったく流行っていませんでした。
ただ、個人的には良い分野だと感じていて、そこからまずは機械学習をやろうと思いました。
そんな思いがあったので、大学では研究室も機械学習をやっているところに入ったという流れですね。

高校から興味をもたれていたのは、何かきっかけがあったのでしょうか？

きっかけは特になかったと思いますね。
やはりプログラミングをやっていれば、人工知能という言葉くらいは触れるので、そこからたまたま興味をもったというくらいです。
当時は、人工知能の中でも機械学習、特に画像認識が一番主流でした。
今でも画像認識や生成が流行っていますが、私も例にもれず画像認識をやっていました。
現職でも画像認識、次いで自然言語処理をやっています。

当時はディープラーニングがありませんでしたし、ニューラルネットワークは冬の時代でした。
そういうのがあるということは知っていましたが、あまり注目されていませんでしたね。

社会人になってからもまず人工知能関係の会社に勤められたのですよね？

実は違います。
ウサギィに出会ったのは、大学生のころに出場した、楽天の人工知能のプログラミングコンテスト本戦の会場です。
そのころは、ウサギィという変な名前の会社もあるんだなと思っていたくらいで、単に名刺交換しただけの関係でしかありませんでした。

大学卒業後に勤めた会社は人工知能とは無縁の小売業の会社です。
なぜ小売業なのかというと、IT系の会社に入ってしまったらあとはプログラミングメインになってしまうのではないかという思いがあったからです。
まずはITとは全然関係ないことを一通りやって、社会人としての基礎を固めておきたいなと思って小売りの会社に入りました。

そこで経理や企画、営業、物流など全部の部門を経験させてもらいました。
そして、大体会社として一通りの流れを経験したところでウサギィに転職しました。

大手の総合職で入られたということですか？

いや、小さい会社で、入社の際にいろんなことをやってみたいですとお願いしました。
その会社では、「そこまで言うのなら全部の部門やらせる」ということで、かなり配慮してもらえましたね。
当然そこでは、インフラ、ネット通販もやっていたので、ＩＴ系のことも経験しました。

自分の中のロードマップとして、ビジネス全般を理解してはじめてＩＴにいくという２段階のステップを考えていたんです。
今流行りの言葉でいうと、いったんジェネラリストになって、プロフェッショナルとして専門性を磨いていきたい、という感じでしょうか。

人工知能関連の仕事は、転職した後いくらでもできるから、あえて関係なくてしんどそうな、例えば電話営業をやるなどしていました。
そこで得たものは大きく、プログラミングだけの経験ではわからないような実務よりのことだったり、クレーム対応だったりということは今でも役に立っています。

裁量の大きさを重視し、当時一人しかいなかったウサギィへ5秒で即決

ウサギィに入社されたきっかけは？

Twitterで「そろそろ転職したいな」とつぶやいたら、「うちくる？」みたいなリプライがあってそれで決めました。
５秒くらいで決まりました（笑）。

当時の弊社は代表一人しかおらず、オフィスすらない状態だったので、実質私が一人目の社員でした。
普通はそんな小さな会社だと、不安に思うかもしれませんが、まあ過去に一通り経験しているし大丈夫だろうという自信もあって入社を決めました。

他に比較はされたのですか？

いえ、まったくしていません。
小さい会社で自分の裁量が大きいところのほうが好きなので、大企業はそんなに考えていませんでした。
当時のウサギィは代表一人しかいないので、小さい会社の究極形態じゃないですか、だからなおさら良いかなと思いました。
なかなかそういう創業期を経験できる機会はないですからね。

現在は人工知能の中でも画像認識と自然言語をメインに幅広い業種で活動

現在はどのようなことをされていますか？

人工知能の中でも画像認識と自然言語処理の２つをメインにやっています。

画像認識だと、例えば写真に写っているものを見るとか、食べ物かどうかを判別するとか、ＳＮＳに流れてくるテキストやアップロードしている写真を分析するとかが多いですね。

最近は、会話系、いわゆるチャットボットが多くなってきています。
ＬＩＮＥとかチャットなどで人と会話するものです。
一例をあげると、エンターテインメントなら雑談が多いですし、小売業なら商品についての質問に答えてくれるものなどがあります。
特に今年はチャットボット系が多いですね。

業種など特化してやられていますか？

絞ってはおらず、全般的にやっていますし、いろんな業種、業態のところからお話をいただきます。
例えば、公式サイトにも掲載していますが、クックパッドさんやドワンゴさん電通さんＮＴＴ系列のいろんな会社さん、それとエイベックスさんのご支援をしています。
どの会社も人工知能のエッセンスを取り入れたいというのはあると思いますし、どこにいっても何かしら役に立つと考えています。

最近の傾向としてどういうオーダーが多いのでしょうか？

人工知能関係だと最近で多いのは、「こういうのって果たしてどれくらいの精度でできるの」というような検証系の話は比較的多いです。
例えば、「人工知能って流行っているけど、それは会社の業務に落とし込んだ際、実用的に使えるのかを実証したい」というような話は結構多いですね。

大手さんでは、研究者として多くの人たちがいますが、今どういう技術が使われているのかを調査する目的で私たちに声がかかったりします。

最近で印象的だった仕事はどんなものがありますか？

とあるベンチャー企業が身体に貼り付ける特殊なセンサーを開発しており、それを使った動きの認識エンジンみたいなものを弊社で担当しています。
そのセンサーで身体の動きを取得できるようになっていて、VRなどと組み合わせることで、VR上でも自分の動きが反映されるようになっています。

精度はかなり高くできて、このベンチャー企業さんは何社かに依頼したそうですが、弊社が一番良い性能だったということで採用いただきました。

具体的にはスポーツのフォームをチェックするといった用途が考えられます。
センサーを付けて体を動かすと、あなたのフォームはこういうタイプなので、よりよいフォームになるように練習していきましょう、といったものですね。
身体に貼り付ける場合、人によって体格や体を動かすスピードは異なります。
そこを上手く吸収して認識することが求められていたので、弊社の技術を使って開発をしました。

今後どこを目指していかれますか？

今市場に求められる人材像ってどんな人だと思いますか？

ウサギィとしては、引き続き機械学習の技術を使ってさらに発展させていきます。
今、機械学習のフレームワークはたくさんでていますが、「そういう便利なフレームワークがあれば誰でもAIを作れてしまうから、ウサギィみたいなプロフェッショナルはいらなくなるのでは？」という話は当然あります。

ただ、やはりそういうフレームワークは広く浅くはカバーしますが、そこから少し外れたことをするととたんにできなくなる、ということがありえます。
誰でもできるようになったがゆえに、むしろ弊社の強みがいかせるようになると思っています。
なので、みんなこれからは機械学習できるようになるよというのが、むしろ弊社にとってはポジティブな影響があるのかなと思っています。

MicrosoftやAmazonなどでデータいれれば分析してくれますというのがいろいろでてきていますが、やはりそこのプラットフォームの中でできることだけの対応なので、みんなができるからこそ、誰もできないところが際立ちます。

最近ではSonyも無償で統合開発環境の提供を開始しましたが、そういうのをみんなでやればやるほど、「ここまではできるけど、これ以上は無理だ」というのが明確になるじゃないですか？
そういうのは弊社が得意とするところなので。

今後は汎用人工知能と物理的にわかりやすいハードウエアをやっていきたい

個人としてのこの先のプランはどのようにお考えですか？

個人的には、会社で機械学習をやっていますが、機械学習だけではやはり足りないところがあるなと常々思っていて、ハードウエアとの連携も大事かなと思っています。
ハードウエアとは、FPGAも当然そうですが、ロボットのことですね。

もうひとつはビジネス的な側面はあまりないのですが、汎用人工知能には昔から興味があります。
生き物みたいな知能を作る以上は、身体性が必要なので、そういう意味でもハードウエアには進出したいと思っています。
実用化するのは難しい部分というのはありつつも、昔から人工知能に携わっている身としては、最終的に汎用人工知能を作りたいという思いはやはりあります。
ハードウエアに関係する話として、CAD(コンピューター利用設計システム)もできるため、最近３Dプリンターを買いました。

会社としても画像認識だけだとインパクトがあまりなくて、物理的に動くものがないとイメージしにくいと思っています。
論文を見て、「精度が5%あがりました！」と言われてもよくわかりませんよね？

一方でたとえば「エアコンのリモコンをとって」と喋ると、ロボット走っていってアームで掴んで取ってくれる、となったら相当イメージしやすくなると思うのです。
そういう意味でもハードウエアをやるのは、とても大事なのかなと。
やはり人間目で見ないとわからないというのは結構あると思うので。

ライブラリと実務ではまだ乖離があり、AIエンジニアの需要はしばらくある

これから市場で求められる人材とはどんな人でしょう？

まさにこの話は、今朝弊社の社員と議論していたのですが、機械学習なんて今時ソフトウエア化していて、ちょっと動かすだけなら誰でもできますし、プロダクトにそのまま組みこめてしまうから、「機械学習エンジニアの価値って今後はどうなの？」という会話のやり取りがあったのです。

ただ、やはり論文では90%の精度はでているけど、実プロダクトでは70%、80%の精度しかでないとか結構あり得ますし、弊社もよく苦しめられます。
そういった理想と現実の乖離が激しい以上は、そこを埋める役割の人が当然必要になってくるので、機械学習エンジニアの需要はまだまだあるのかなと思っています。

実務で考えると、教師あり学習の場合は学習データが必要です。
学習データは、多いほうが精度は高くなるので、大量にあるほうが望ましいのです。
論文として世にでているものは、すでにどこかが学習データとして整えてくれた何十万、何百万のデータがあり、それを利用可能である、というアドバンテージがあります。

実際にはそこまでデータを用意できないのが普通です。
例えば「今は100個しか学習データがありませんよ」というような状況をいかにうまくやるか、というところでノウハウが際立ってきます。
そのような実務のところでは十分まだいろんな仕事はあるかなと思います。

特に深層学習については、研究や学術分野では発展していそうに見えますが、実務まで落とし込むと諸々問題がでてきて、思ったより性能がでないというのもかなりよくある話です。
それと、組み込みがしにくいのも実務上の問題点としてあります。
Azureで学習させたくても、WebAPIでやり取りするので、例えば乾電池で動かしたいというような用途だと到底できません。

9割どこかのクラウドがカバーしてくれるとしても、残り1割の部分が目立ってくるので、そこをカバーできるような感じだと良いですね。

時間など有限のリソースを鑑みて、精度とバランスを調整できることが大事

実務だとやはり精度を求められることが多いですか？

最近だと、「もはや大事なのは精度じゃないよね」とか会社で話をしています。
実感として精度のほかの部分が問題になってくることが多いからです。
例えば精度が99%のモデルと、精度90%のモデルがあれば、99%のほうをとりたいところですが、ここでたとえば動かすことが大変、学習データがたくさん必要、パラメーターチューニングが大変……といった問題が出てくるとします。
90%のほうならこれらの問題がかなり緩和されるとすると、そこでトレードオフが生まれるわけです。

それなら現実的に考えて精度90%のほうが良いのではというのも結構多いのです。
実際、お客さんも先の例でいえば「9割出ていればまったく問題ないですよ」と言ってくれる案件も当然あるので、そこら辺のトレードオフは大事にしています。
そのため、有限のリソースを総合的に加味して最適解を判断できることは非常に重要だと思います。

研究目的であれば、どれだけマシンリソースを使っても、精度が今までの手法よりも高ければ良いというのもあります。
それはそれで価値がありますが、なかなかそういうわけにはいかないということが多いのです。
より早く、より省メモリで、パラメーターチューニングが少なく学習できるなどが実務だととても重要になってきます。

精度と一口にいっても難しくて、例えばOCR(光学式文字読み取り装置)で、精度99%でていても、100の内1つ間違えるということなので、しょっちゅう間違えてしまいます。
また、スパムメールフィルタであれば、「大事なメールをスパムと判定してしまう」のと「スパムを大事なメールと判定してしまう」は同じ「間違い」ではありますけど、実際には前者のほうが困ってしまいますよね。こういった非対称性もあります。

1年足らずで知識や技術が使えなくなるから最新の研究は追い続け、まず試す

今後付加価値を高め続けるためにはどうすればよいとお考えですか？

重要なのは、最先端の研究は追い続ける必要があるということです。
例えば、ディープラーニングでいうと3年前にGANという画像生成する技術がでてきました。
当時は「まあ確かに生成されてるっぽい感じはするね」程度でしたが、去年から今年になって人間が書いたものとほとんど見分けがつかないくらいになっています。

3年でそこまで進歩するものはなかなか他を探してもないので、そういう意味では最先端のアツい研究をずっと追い続けていく必要があると思います。
それと機械学習なら、実装されるのも早いためまず試してみたり、小さなプロジェクトでも良いので自分で実際につくってみたりは大事になると考えています。

他の産業だと1年や2年でコアとなる技術が変わり続けるということはあまりないと思いますが、機械学習分野は本当にそういう状態ですね。
例えば、ディープラーニングでも当初はこれが良くて、この先も進歩し続けるといわれていたものも、次の年になったら実はあれはいらなかったというのが結構あります。
だから、いま主流なものも来年生き残っているかはわからないという世界です。

半教師あり学習は便利で実用的になってくる

歴史が古いベイズが再注目されていたりしますが、普遍的なものってありますか？

機械学習関係を経験していて、数学的なバックグラウンドももっている人は数えるくらいしかおらず、非常に重要です。
とはいうものの、数学的なバックグラウンドを補強するために、どこをどうやって身につけたらよいか難しい部分があります。
大学でしっかり数学を学んでいたら別ですが、独学だと範囲も広く、時間も限られているので相当厳しいと思います。
本当に個人的な意見でいえば情報幾何なども推したいところですが…。

短期的に今何に注目したらよいかでいうと、半教師あり学習あたりですかねぇ。
半教師あり学習も、理論では比較的進んでいるのですが、実務で半教師あり学習を使っていますというのはほとんど見たことがなく、それが今後は実用的になっていくと思います。
おさえておいて損はないかなと。

実際弊社では半教師あり学習をやったことがありますが、結構便利でした。
使っても損はないような技術なので、やってみる価値はあるかと思います。

例えば、画像認識をやりたいけど、教師データは少ししか用意できないなどの場合があったとします。
ただ、教師データがついていないデータは世の中にたくさんありますよね？それをうまいこと利用して精度を高められます。
文字認識の場合、0～9までの数を認識するのに、それぞれの画像に10枚、合計で100枚の学習データだけ用意して、残りは教師データがついていない画像を用意して高い精度をだすという活用の仕方ができます。
そうなると従来の教師データがとにかくたくさん必要というデメリットが相当緩和されるので、今まで使えなかった分野でも機械学習が応用できるかもしれない可能性があります。

会社としても、そこはとても重要で10万枚のデータが必要というよりは、100枚のデータが必要という方が断然やりやすいですし。
最近ではかなり現実的な手法もでてきたのでますます使い勝手がよくなると考えています。

人工知能の影響は大きく、汎用人工知能はいずれ登場する

人工知能が及ぼす未来はどのようになっていくとお考えですか？

汎用人工知能が遅かれ早かれ登場するのではないかと。
いつでてくるのかという話については、汎用人工知能の定義をどう捉えるかにもよりますが、生き物のように柔軟に現実世界に適合できるという意味合いなら、よく言われる2045年より前にでてくると思います。
人間とまったく同じやそれ以上となると何とも言えません。
それは何をもって人間と同じとするかという話もあると思うので。

とはいえ、私が生きているうちには人間と同程度の汎用人工知能は誕生すると思います。

人工知能が及ぼす影響は確実に大きくなっていくと思います。
少子高齢化の日本においては、特に人工知能がやってくれるならやってもらい、そこで富を生み出したら人間が働かなくて済むという世の中になるのが一番良いですよね。

人工知能規制の議論を現時点でするのは時期尚早、それより著作権などが先

人工知能が暴走するという話もありますが、その話はどのように捉えていますか？

人間の制御下で動かす分には問題ないと思います。
人工知能が本当に暴走して人間に危害を加えるならさすがに倫理についても考えなければならないと思うのですが、まだ早いのではという気はします。
少なくとも今の技術はディープラーニングをはじめ将棋や囲碁のAIも含めて汎用人工知能を目指してはいないと思うので。

そこで、人間に反旗を翻すのではないかという議論をされてしまうと、見当違いなのではと。
将棋のAIがどれだけ賢くなっても、人間の世界が脅かされるというのはないですよね。
唐突に人類の将来がとか言われると、よくわからない感じになってしまいます。
将来的に身体のあるロボットで知能をもった人間のようなものがでてきたら、考えなければいけませんが、今あまりにも目標が遠すぎて、今から規制してもしょうがないかなと。

例えば現時点で国が「タイムマシンをできたらどうするか検討します」と言われても、それを検討して実用的なルールができるのかなと思ってしまいますよね。
ですから、いつかは必要かもしれませんが、現段階ではいらないかと思います。
それよりは、もっと著作権をどうするかということや、人格権をどうするかなどの問題があると思うので、そういうところを検討した方が良いかと。

国はそういうところを検討してくれていて、例えば学習データを収集する段階では著作権を気にしなくて良いとかやってくれていますが、そういう部分をもっとフォーカスあててくれたらよいという気はします。

人工知能で省力化の話は受け皿を整えてからだとすっきりする

人工知能が仕事を奪うという話もありますが、そこはどのようにお考えですか？

人間の仕事を奪えるならそうしても良いと思いますが、そこは社会保障をどうするかというところとセットで考える必要があると思います。
受け皿をきちんと整備した上で、人工知能を使って人を減らしましょうというのはまったく問題ないと思うのですけど。

AIによる効率化で仕事が少なくなったからといって別に保証が受けられるわけではないですよね？
相変わらず働かなければならないので。
そこら辺をもう少しすっきりできたら良いと考えています。