「育児中でも、新しい挑戦はできる」データ分析未経験から、Kaggle金メダルをつかんだ女性の物語

「何かに挑戦したいけれど、時間や体力に余裕がない」 「自分のキャリアが停滞している感覚がある」

育児や介護など、家庭の事情によりフルタイムで働けない方の中には、こう感じている人も少なくないかもしれません。ですが、そんな状況の中でも、小さな一歩から勉強を始め、成果を出した人がいます。LINEヤフー株式会社で人事総務として働く高橋今日子さんです。2人の乳幼児を育てつつ、データサイエンス未経験から約5カ月の猛勉強を経て、データを活用して予測モデルの精度を競う世界的なコンペティションKaggleで金メダルを獲得しました。「まとまった時間がなくても、新しい挑戦はできる」と話す高橋さん。その軌跡についてインタビューしました。

きっかけは「自分の力でデータを活用したい」という思いから

――高橋さんは人事総務として働かれています。一見すると、データサイエンスの世界からは遠い場所にいるようにも感じますが、なぜこの領域に取り組まれたのでしょうか?

私は人事総務の仕事を10年以上続けていますが、「社員の入館・退館記録」や「設備の管理データ」など、社内の各種データに触れる機会は意外と多くあります。それに、RPA(ソフトウェアロボットによる業務自動化)やVBA(Microsoft Officeアプリケーションの機能を拡張・自動化するためのプログラミング言語)を扱うこともあり、ある程度はプログラミングへの関心もありました。

ただ、自分自身でデータを分析するスキルはなく、いざデータ活用が必要になった際には、LINEヤフー社内にいるデータサイエンティストの方々とやり取りをしていました。しかし、彼らの工数を確保できない場合は、諦めざるを得ない場面もあります。

「もっとデータ分析に詳しくなれたら」という気持ちが以前からあったんです。さらに、私はこれまでに2回産休を取得していますが、その間に「自分のキャリアが止まっている」という感覚があり、何か勉強したいという思いもありました。

――そこで、データサイエンスの勉強を始めたわけですね。

最初は、AIの基礎知識を学べる塾に通い、AI・ディープラーニングの活用リテラシー習得を目的とした検定試験「G検定」を取得しました。「次はPythonを学ぼう」と思っていたタイミングで、ちょうどLINEヤフーが社員向けにKaggleの学習プロジェクトを開始したと知ったんです。これは、Kaggleへの挑戦を通じてデータ分析や機械学習のスキルを育てる取り組みでした。ちょうどよいタイミングだったので、第一期生として参加することにしました。

Kaggleの学習プロジェクトの様子

毎日コツコツ継続。時には、勉強の“チートデイ”を

――Kaggleの学習プロジェクト参加について、より詳しく教えてください。

当時、私はフルリモートかつ時短勤務で働きながら、育児もしている状況でした。そこにKaggleの勉強を加えるとなると、絶対に夫の協力を仰ぐ必要があると思ったんです。そこで、プロジェクトに参加する前の段階で、夫に対して「なぜこの企画に参加したいのか」を自分なりに情報をまとめてプレゼンしました。

私はもともと勉強が好きなので、夫はとても理解を示してくれました。「興味があるんだね。いいと思う。やってみなよ」という感じで、前向きに応援してもらえたんです。私がなるべく勉強に集中できるように、夫は子どもの寝かしつけを担ってくれました。事前に家族の協力体制を整えたことは、学習を進めるうえでとてもプラスになりました。

――どのような方法で勉強を継続しましたか?

子どもが眠りについた後の20時くらいから勉強を始めていました。私の場合、まとまった時間を確保するのが難しかったので、毎日コンスタントに1〜2時間の勉強時間を確保する方針で進めるしかありませんでした。でも、勉強のリズムが生まれたので、むしろそれが良かったのかもしれません。また、勉強を始める前には必ずコーヒーを飲んで、自分の気持ちを勉強モードに切り替えるためのスイッチにしていました。

とはいえ、どうしてもモチベーションが下がってしまうことはあります。そんな時は、ダイエットのチートデイのように、思い切って「今日は一切勉強をしない日」と決めて、映画やドラマを観るなどして気持ちをリセットしていました。

――勉強を進めるうえで、役立った教材はありますか?

社内のKaggleプロジェクトでは、講師の方々が受講者のスキルを踏まえて提供してくれるテキストがあり、それをとても参考にしました。それから、Kaggleには初心者でも取り組みやすいチュートリアルが豊富に用意されています。タイタニック号生存者予測の「Titanic – Machine Learning from Disaster」などが有名で、そういった問題に取り組みました。他にも、日本発の「SIGNATE」というAI開発コンペティションサイトにはビギナー向けのコンペがあるので、参加して勉強していましたね。

また、Pythonのスキルを鍛えるために「Python初学者のためのPandas100本ノック」などの問題集に取り組んでいました。それに加えて、Kaggleの各種コンペの共有NotebookやDiscussionの内容を追いかけ、技術的なトレンドをキャッチアップしていました。

コンペにて、念願の金メダル獲得!

――金メダルを獲得されたコンペの情報を教えてください。

Parkinson's Freezing of Gait Prediction」というコンペで、パーキンソン病患者における Freezing of Gait(歩行が一時的に止まってしまう現象)の予測を目的としています。入力データとしてモーションキャプチャスーツから得られたセンサーデータが与えられており、その値をもとに予測を行いました。

Kaggleを始めたばかりの頃は、このコンペのようにテーブルデータを扱うもののほうが取り組みやすいです。自然言語を扱うコンペも面白いのですが、使用するモデルの処理が非常に重く、パソコンの性能が高くないと厳しいですし、クラウドを使う場合にはコストがかかります。画像を使うコンペもありますが、分析の仕組みが複雑で、学んでもなかなか理解が追いつかないことがあります。

――このコンペでは、どのような流れで分析を進めましたか?

私がコンペに取り組む際の基本的な流れは、まず探索的データ解析を行ってデータセットの中身を確認するところから始まります。その後、ゼロからコードを書けたら理想なのですが、初心者なのでまずは共有Notebookを参考にし、自分に合いそうなベースラインを選びます。そこから仮説を立てて、少しずつ改善していくという進め方です。ちょうどこのコンペが開催された年にChatGPTが流行し始めたので、コード作成をサポートしてもらいながら進めました。

仮説を立てるためには、ある程度のドメイン知識やデータに対する理解が必要です。そのため、仮説が思いつかないときは業界のことを調べ直したり、改めてデータセットを確認したりしていました。データセットを見るというのは、たとえば「この人はなぜこのような動きをしているのか」「なぜデータに偏りがあるのか」「この外れ値はなぜ生じているのか」など、自分なりに背景を考察しながら分析していくイメージです。

このコンペでは、私は特徴量の設計やクラスタリングに力を入れて取り組みました。他の人の解法ではまったく異なるアプローチが取られていて、「それぞれの個性がよく出ているな」と思いながら、参考にしていました。

それでもスコアが伸び悩むタイミングは必ずあるので、そうしたときには再び共有NotebookやDiscussionを確認して、「これとこれを組み合わせたらどうだろう」と試してみる。そうして試行錯誤を重ねました。

――「今回はメダルが狙えそうだ」と感じた瞬間はありましたか?

明らかにスコアが大きく伸びた瞬間があって、「いけるかも」と思いました。ただ、前のコンペでメダルが取れそうな状況だったにもかかわらず、シェイクダウンで逃してしまったんです。その経験があったので、油断しないように意識していました。

最終的な結果が出たのは平日の朝でしたね。ちょうど会社に向かう途中で、「やったー!」と心の底から嬉しくて、すぐに夫に連絡しました。

――メダルを獲得してから、周囲の反応はいかがでしたか?

総務の人たちにはKaggleの話をしていたのですが、「何だかよくわからないことにチャレンジしている人」と思われていた節がありました。でも「金メダルを取った」と伝えると、「どんなことをやっているの?」と関心を持ってもらえるようになりました。

くすぶっている気持ちは、新しい挑戦の原動力になる

――Kaggleで得た知識やスキルは、仕事においてどのように活かされていますか?

金メダル獲得後、人事総務のチームの中でもデータ活用への興味や理解が高まりました。「私たちが持っているこのデータを、こう活かせるかも」といった話をみんなでできるようになったのは、すごく大きな変化でした。それから現在は、本業とは別にPythonを使って前処理する副業をしています。Kaggleに挑戦したからこそ、こういった副業にも挑戦できるようになりました。

――「データを扱う仕事」に対する考え方は変わりましたか?

データサイエンスは思っていたよりも身近な技術で、普段やっている業務にも応用できるんだなと実感しました。あと、「魔法使いのような仕事」だと思っていたんですけれど、実際はもっと泥臭くて、地道な作業の連続なんだなと痛感しましたね。

――最後に、これからKaggleに挑戦する人たちや、育児をしながら新しいチャレンジをしようとしている人たちに向けて、メッセージをいただけますか?

まずは、Kaggleに挑戦する人たちへ。Kaggleというプラットフォームは、学びのヒントにあふれていて、しかも無料で使える最高の学習環境です。共有NotebookやDiscussionなどの中に、素晴らしい知識が詰まっています。それらを活用して、データサイエンスの勉強に取り組んでみてください。

それから、育児をしながら新しいチャレンジをしようとしている人たちへ。私もそうでしたが、育児だけをしていることに対して、キャリアの焦りを感じてしまう方もいるはずです。でも、焦らなくても大丈夫ですし、そもそも育児をしているだけでも十分すごいことです。無理に、何か新しいことに取り組まなくてもいいと思います。体もきついですから。

それでも、「子どもの人生と向き合いながら、自分自身の人生とも向き合いたい」と考えている方は、きっといらっしゃるはずです。そういう方たちに伝えたいのは、「まとまった時間がなくても、大きなチャレンジはできる」ということです。家族の協力を得たり、自分なりのルーティンを作ったりしながら、無理のない範囲で始めてみてください。

もし、心の中にくすぶっている気持ちがあるならば、それを大事にしてほしいです。私自身、挑戦のきっかけは「キャリアに対するモヤモヤした気持ち」のような、ネガティブな部分から始まっていました。必ずしもポジティブなきっかけである必要はありません。ネガティブな思いもまた、自分を動かす原動力になってくれるはずです。

取材・執筆:中薗昴
撮影:山辺恵美子