ホーム > 会社情報 > STIC×DREAM > Vol.03 > Tech & Quality Report

数理技術による移動体データ分析

  • Tech & Quality Report
  • キヤノンITソリューションズが、これまで数多くのシステム開発によって培ってきた経験と品質向上への取り組みにより、お客さまの業務課題を解決した好事例や研究の成果をご紹介します。

R&D本部 数理技術部では、企業活動におけるオペレーションを数理最適化・シミュレーション・データ分析の3本柱の技術によって支援している。近年IoT技術の発展によりさまざまなデータが安価に取得できるようになってきたが、組織活動の観点での活用についてはまだ発展途上といってよい。本稿では多数の営業車に搭載されたテレマティクスから刻々と取得される膨大な移動体データに対し、DTW(Dynamic Time Warping:動的時間伸縮法)や多次元尺度構成法を駆使して組織的効率化の知見を発掘していく取り組みについて紹介する。

移動体データの特徴

移動体に搭載された位置センサーから取得できるデータはおおむね以下の項目構成となっている。

  • 1.移動体ID
  • 2.時刻、座標値(緯度、経度、高度など)
  • 3.その他属性(所属組織、事業セグメントなど)

このような情報を持つ複数の移動体に対する分析方法として、従来では複数移動体による軌跡を座標に累積し可視化する方法(ヒートマップ、地図ヒストグラムなど)が一般的であった。見方を変えれば、時間軸を説明変数から外すことによって複数の移動体によるマクロ的な傾向を把握することを主眼としていた。しかし時間依存型の特徴を持つ移動体データを対象とした場合、このような累積方法では推移の特徴を捉えることができず、時間依存の改善知見を見落とす可能性がある。そこで移動体個別の時系列の動きを損なうことなく分析し、時間軸を無視すると失われてしまう動き方の類似性から改善知見を得ることを目指す。

DTWによる乖離度の測定

DTWとは、時系列データ分析の一技術であり、系列間の乖離度を測定することができる。この技術の特長は、異なる長さの時系列データ同士であっても順序を崩すことなくサンプリング値を対応付けて、その値の差分値の合算を乖離度として評価できることである。

本技術はもともと音声データや株価データなどの時間軸に対して推移する一次元の指標値の比較評価に用いられてきたが、この考え方を、移動体データに拡張し比較評価を可能にした。

従来DTWが対象としていた時系列データはサンプリング間隔が一定であることを暗黙の前提としていたが、移動体データでは必ずしもサンプリング間隔の一定性が保証されない。むしろバラツキが大きい場合が多い。そこで従来のDTWにはなかった時間的なズレを含め乖離度dに換算する関数を案出した(関数1)。

この関数は類似パターンを定義する上で重要な要素となっており、解析の目的に合った類似パターンが抽出されるよう実データに基づいてチューニングされている。具体的には空間距離に対して時間ズレ(t2-t1)についてはその多寡に応じて距離に換算し乖離評価する。その結果抽出された類似軌跡の例を図1に示す。手順として、まず①移動体データを分析対象として適切な単位に切り出し、次に②切り出されたデータの全一対に対してDTWで乖離度を計算する。その情報をマトリクス状に配置したのが乖離度マトリクスである。そして③ここから値の小さい組み合わせを一対取り出せば、それが類似軌跡となる。

DTWによる類似軌跡の抽出

DTWによる類似軌跡の抽出(図1)

画像を拡大する

ここで、実務観点から前処理の「切り出し」について詳しく述べておきたい。移動体データは前節で述べたように単純な時刻位置情報の羅列である。移動体ID1つを取り出してみても、その移動体IDが有効な間は切れ目なく続くデータとなっている。これを業務の視点から分析するには、「ひと仕事」を単位として切り出してやるのが妥当である。物流や営業用の車両であれば拠点を出発し外回りした後、拠点に戻るのが通常である。この一周を「ひと仕事」と考えれば、拠点から出て戻るまでを分割切り出しすればよい。ここで課題となるのは拠点に戻ったか否かの判定である。GPSは位置誤差を含んでいるし、拠点の停車位置が名義登録されている拠点住所から少しずれた停車場となっている場合もあり、一概に座標値との比較での戻り判定は成功しない。そこで拠点ごとにその付近の所定半径以内で所定時間以上停車している事象を抽出し、その重みづけ重心位置によって拠点座標を補正する。その上で、補正地点を基準とし、停車地点との距離および停車時間の重みづけ値を算出して拠点戻りを判定する。以上のように一見ローテクであるが適切に分析を施すためには地道にデータを観察してその特徴から法則性を見いだし、実用的な時間内で完結する処理を組み立てることも一連の技法を確立する上で極めて重要である。

乖離度の全体把握と知見発掘

前節で述べたように全一対の移動体データ乖離度を乖離度マトリクスとして算出できれば、乖離度の全体分布を把握することが可能となる。全体把握には乖離度マトリクスをカラースケールで俯瞰するなどの方法が考えられるが、要素の並び順に依存して全体の印象が左右されてしまう弱点がある(図2左)。

乖離度マトリクスと多次元尺度構成法

乖離度マトリクスと多次元尺度構成法(図2)

画像を拡大する

この短所を克服する技術として乖離度で表現された情報を低次元座標に配置することができる「多次元尺度構成法」を援用した。この方法で図2左の情報を二次元に配置した(図2右)。乖離度が低い移動体群は固まり、乖離度が相互に高い移動体は離れて配置されている。

乖離度を二次元に配置することで個体間の類似性を可視化でき、クラスタを形成することで「同類項」を抽出することが可能となる。

業務視点でこれを捉えると、移動特性を同じくする個体をひとくくりで抽出しその属性を掘り下げることで、改善の足掛かりとすることができる。例えば対象が営業車両であるケースにおいては、異なる部門の営業担当者が近い場所をルート営業している状況に対し、部門間で連携してルート効率を向上させることが期待できる。また物流倉庫での作業動線のケースでは、標準動線のグループから外れた動線を抽出して例外事象との関連性を調査するなどして、整流化に資することも可能である。

最後に

小西 伸之

キヤノンITソリューションズ株式会社
R&D本部 数理技術部
コンサルティングプロフェッショナル
小西 伸之
Nobuyuki Konishi

位置センサーから取得されたデータは刻々と山のように蓄積されているが、その山に埋もれた知見を活用できた事例はまだ少ない。今回はその発掘技術を紹介したが、緒に就いたばかりで事例を拡大中である。

分析で最も重要なのはデータの山の切り崩し方と知見原石の評価である。仮説を設定し、データの山を試掘・評価し仮説修正するループを反復し洗練させていく。そしてその背景には業務知識が不可欠である。多様な事例を通じて今後も組織知として造詣を深め、最短で知見を掘り当てるよう磨きをかけていく所存である。

※ 記事中のデータ、人物の所属・役職などは、記事掲載当時のものです。

ホーム > 会社情報 > STIC×DREAM > Vol.03 > Tech & Quality Report