AIが「素材・質感」まで見抜く！自動運転や医療を変える京大・西野恒教授のコンピュータービジョン最前線

2019年6月28日に公開された「かがくアゴラ」の記事は、京都大学の西野恒教授が取り組む、人間生活を豊かにするための人工知能（AI）技術、特にコンピュータービジョンの重要性を強く訴えています。西野教授は「AIは人の生活を豊かにするためにあるべき」という信念のもと、カメラに写る人の画像からその意図を理解するなど、「人を知るAI」の実現を目指されています。このようにして開発されたAIが、さらに深く人間を理解しようとする、好循環の社会基盤を構築したいとお考えです。

物体を機械が認識する技術であるコンピュータービジョンは、AI技術の発展と共に進化してきました。既に、カメラ画像から人の顔を抽出する技術などは実用化されており、身近なところでも活用されています。自動運転への応用研究も進んでいますが、実用化にはまだ多くの課題が残されている状況です。例えば、自転車に乗る人がどちらへ進むかを正確に予測し、危険を回避するような、人の行動からその意図を理解して自らの行動に反映させることは、深層学習（ディープラーニング）といったAIの高度な手法を使っても、現状では難しいとされています。

西野研究室では、人に寄り添った社会基盤としてのコンピュータービジョン開発に力を注いでいます。その核となる技術の一つが、物体の「素材」や「質感」を認識する技術です。例えば、表面が「ツルツル」「ピカピカ」「半透明」といった特徴から、それがプラスチックであるとAIが認識できるようになります。コップがプラスチック製なのかガラス製なのかが区別できれば、ロボットがその物体をつかむ際に、力加減やアプローチ方法を変えることが可能になるでしょう。また、路面が濡れていることを正確に把握できれば、自動運転車は早めにブレーキをかけるなどの適切な対応が取れるようになり、安全性の向上に大きく貢献すると期待されます。

また、雑踏など大勢の人の行動を追跡する研究も進められています。従来、多くの人が密集している状況では個々の人を認識するのが困難でしたが、カメラ映像をもとに人全体の流れのモデルを作成し、その上で個人を追跡する新しい手法を開発することで、この難しい課題を解決されました。さらに、物体の表面での光の伝わり方を通常のカメラで可視化する独自の手法も開発しており、この技術を応用すると、表面を見ているだけでも内部構造の一部まで理解できるようになるのです。

この内部構造の可視化技術は、医療分野での応用も期待されています。例えば、内視鏡で胃や腸を観察する際に、壁や管の内部構造が詳細に分かれば、医師が病巣を切除する範囲を決定する上で、非常に重要な手がかりとなり、手術の精度向上につながるでしょう。私は、西野教授の「人を知るAI」という思想が、技術革新を真に人々の幸福に結びつける、最も重要な視点だと感じています。単なる効率化だけでなく、人の意図や安全に深く関わる技術こそが、これからのAIのあり方であるべきです。

こうした研究の成果と重要性を広めるため、西野教授が所属する京都大学大学院情報学研究科知能情報学専攻では、複数の教員が参加する講座を同年9月から東京で開催する予定とのことです。これは「人を知るためのAI」の認知度を高め、大学と企業との連携、すなわち産学連携をさらに推し進めるための活動だと言えます。AI技術が社会の基盤となる未来に向けて、基礎研究と実社会への応用が密接に結びついていくことに、大きな期待が持てるでしょう。

関連投稿:

コメント