限られた車両数で複数の目的地を巡回
ーー機械学習を用いて算出困難な最適解を目指す

総合機械工学専攻 修士1年
山口 洋祐 Yamaguchi Yosuke
大谷研究室
2022年度インタビュー

深層強化学習による配車計画問題に取り組む

Q 現在取り組んでいる研究について教えてください

深層強化学習を用いた配車計画問題に取り組んでいます。配車計画問題は、複数台の車両を使って多数の目的地を巡回する際の、最適な経路を算出する問題です。例えば、1台の車両で5つの目的地を巡る場合には、ある程度単純に求められます。しかし、複数の車両で数千ヶ所の目的地を巡回するには、その解は膨大で、最適解を求めることが困難です。

そこで私の研究では、深層強化学習を活用しています。深層強化学習は機械学習の一種で、深層学習(ディープラーニング)と強化学習の2つを組み合わせた学習手法です。深層学習は、ChatGPTのような自然言語処理や、画像認識などの基盤となっている手法です。ニューラルネットワークを用いてデータの背後にあるパターンを学習していくことで、目的に応じた予測が行えます。

一方、強化学習は機械が与えられた状況に対して行動を選択し、その結果がよければ報酬を受け取るという学習手法です。機械は繰り返し様々な行動を試し、より多くの報酬を得られるように学習していきます。深層強化学習を用いることで、短時間でより高精度な近似解を導くことができるのです。

Q この研究にはどのような背景があるのでしょうか?

この研究は、NTTとJAXAの共同研究の一環として取り組んでいます。通信会社は膨大な基地局を所有しています。例えば災害が発生し通信インフラが断絶すると、通信会社は限られた整備車両で膨大な基地局を巡回して修理することが必要です。基地局の巡回のほかにも、電柱点検の計画立案など、さまざまな活用が期待されています。

新しい分野ゆえに最先端の環境で学べる

Q 研究で特に難しいと感じる点や面白い点について教えてください。

深層強化学習は比較的新しい分野です。近年のAIブームの影響もあり、世界中の研究者が次々に論文を発表しています。そのなかで、自分の研究の新規性や独自性、優位性を出すことは、とても難しいです。一方で、この新しい分野の最前線で活躍している研究者と共同で取り組めることが、この研究の魅力でもあります。

Q 大谷研究室を選んだ経緯を教えてください。

大学に入学した当初は、ヒューマノイドに興味があり、総合機械工学科を選択しました。その後「メカトロニクスラボ」という講義で、機械工学はハードウェアからソフトウェアまでさまざまな技術が組み合わさっていることを知りました。

この講義は前期と後期に分かれていて、どちらもロボットの製作や制御を目的としています。ですがアプローチが違っています。前期ではアナログ回路製作など、ハードウェアに焦点が当てられていて、後期ではプログラミングなどのソフトウェアが主題となっています。この講義を通して、よりソフトウェアに興味があることに気づいたのです。そうしたなかで大谷研究室では、画像処理やVR、機械学習などのソフトウェア寄りの技術を研究しているので、所属を決めました。

卒業研究では、画像解析で土砂災害の発生を検出する研究に取り組みました。災害が発生した山間部の様子をドローンで撮影し、地表面を3次元モデルで表現し、深層学習を用いることで、どこでどのような土砂災害が発生したかを検出するものです。そのなかで、限られた数のドローンで効率的に災害を発見する経路計画に興味を持ち、修士からいまの研究にシフトしています。

開発の成果が価値につながることがこの分野の魅力

Q プログラミングのスキルはどのように習得しましたか?

必修講義で基礎は学ぶものの、実践的なスキルを身に着けることは難しいです。そこで、2年生からアプリ開発のアルバイトを始めました。アプリ開発は、仕事をしながらスキルも身につくので、いいバイトではないかと思います。また、開発の成果が業務の役に立ったり、価値につながったりする点は魅力的です。

Q 今後の展望について教えてください。

深層学習や強化学習は面白い分野なので、そうした技術の社会実装やそれを生かした社会課題の解決に取り組めたらと思います。卒業後は、基礎研究だけでなく応用研究に取り組みたいです。就職活動では研究開発職の道を考えており、いままさに取り組んでいるところです。