株式会社QuantumCoreは、株式会社電通国際情報サービス(以下、ISID)のオープンイノベーションラボ(以下、イノラボ)と動画から人間の動作パターンをリアルタイムに推論(Real-time Motion Detection:以下、RMD)を行う実証実験(Proof of Concept:以下、PoC)を実施した。
詳細はこちら。
■概要
従来、RMDには、モデルの作成に大量の動作パターンデータを与える必要があり、データ作成が課題だった。そこで、同PoCではISIDが提供する人間の動作や姿勢を抽出するソリューション「Act Sense(アクトセンス)」と、同社独自のリザーバコンピューティング技術Qore(コア、国際特許化中)による時系列処理技術を組み合わせることで、少ない学習データでのRMDが90%を超える高い精度で実現できることを確認した。
これにより、同技術が動画から得られた時系列の特徴量に対する解析に有効であり、少ない学習データでも高い精度で人間の動作パターンを推論ができる。予め大量の動作パターンの作成が困難な分野、例えば多種多様な動作パターンが登場するヘルスケア分野などへも導入が可能になる。また、あらかじめ学習したパターン以外の動作をした場合は異常行動として検出も可能なため、作業現場での危険行動検出など建設分野への応用も可能だ。また動作パターン推定だけでなく、次に行う動作パターンも推論することで、歩行者の挙動予測など自動運転の安全システムなどへの適用が期待される。
リザーバコンピューティングとは
リザーバコンピューティングとは、レーザーの波長や波動く水面など、ダイナミクス(ノイズソース)をもつさまざまな物質を利用したコンピューティングのことで、これを活用したリカレントニューラルネットワーク(Recurrent Neural Network:RNN)が、最近新たな機械学習方式として注目されている。入力層、中間層(リザーバ層)、出力層(リードアウトニューロン層)の3層で構成される教師あり学習となる。この方式では、ディープラーニングとちがい、中間層を溜め池(Reservoir:リザーバ)にして計算を回すことで特徴抽出を行う。そのためディープラーニングで必要だった特徴抽出機能を学習により強化する必要がなく、学習時の中間層の重み更新が不要となる特徴を有しており、学習時の計算に必要なデータ量や計算力を著しく節約することができる。なお、溜め池にはダイナミクス(ノイズソース)をもつものであれば様々なものが利用でき、現在はロボットやタコの身体をノイズソースとして計算する仕組みが探求されている。このように狭い意味では人工の神経回路を使って様々なノイズソースを用意し、そこから適宜情報を取り出して加算し計算する新しい人工の脳型コンピュータだ。
QuautumCoreのテクノロジーについて
リザーバコンピューティングの特長は上述の通りだが、ディープラーニングに比べて精度を出しにくいという課題を有していた。その技術的な課題を同社独自の技術(特許進行中)で解消することに成功、ディープラーニング(Long short-term memory:LSTM)の性能を圧倒的に超える精度、コスト、スピードを実現する多変量時系列処理(Recurrent Neural Network:RNN)ソリューションQore(コア)シリーズの開発に成功した。Qoreの特長は「データ波形を効率的に捉えることで、少ないデータ量でLSTMを超える分類ができる」ことにあり、個体差、環境差、時間差等の影響が大きい領域(=ルールベースの推論モデルが通用しにくい領域)において、特に力を発揮する。例えば異常検知などにおいては、推論モデルを構築するためにデータを採取してみたものの、正常データこそ大量に得られるが異常データをほとんど得ることができず、LSTMではそこから有効な異常検知の推論モデルを確立することが難しいといった問題が考えられる。そのようなケースにおいてもQoreを活用することで少ない異常データから有効な推論モデルをリアルタイムに導くことができる。しかも、従来ディープラーニングで問題であった複雑なパラメータチューニングもQoreでは不要だ。そのQoreを誰でもオンライン上で使うことができるようにしたものがWebQore(ウェブコア)という専用APIになる(WebQoreプロダクトURLはこちら)。
さらには、マイクロコンピュータのラズベリーパイ上で稼働するQore、その名もEdgeQore(エッヂコア)の開発にも成功している。このEdgeQoreを用いることで、オンプレミスで、ディープラーニングでも実現不可能な「少量データによるリアルタイム解析」を、誰でも実現することができるようになった。例えば、プライバシー保護が重視される用途や、インターネットに接続できない環境下での利用、高いレイテンシ(応答速度)を求められる用途など、これまで実現することができなかった幅広いケースに役立てることができる。
動作中の動画