1 / 42

移動軌跡データモデルと 領域に基づく問合せ処理

移動軌跡データモデルと 領域に基づく問合せ処理. † 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 ‡ ATR 情報メディア研究所 ○ 柳沢 豊 † ,赤埴 淳一 † ,小暮 潔 ‡. 発表概要. 移動軌跡データのモデリングに関する発表 研究の背景,目的 移動軌跡データとは 図形間の関係記述に基づくアプローチ リンクを用いた検索の効率化 形状の類似度に基づくアプローチ 重心を用いた線分の形状の近似方法 まとめ. 前半の発表. 後半の 発表. 背景 (1). GPS を始めとする,廉価で高精度の一取得デバイスが開発されている.

lavina
Download Presentation

移動軌跡データモデルと 領域に基づく問合せ処理

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 移動軌跡データモデルと領域に基づく問合せ処理移動軌跡データモデルと領域に基づく問合せ処理 †日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 ‡ ATR 情報メディア研究所 ○ 柳沢 豊†,赤埴 淳一†,小暮 潔‡

  2. 発表概要 • 移動軌跡データのモデリングに関する発表 • 研究の背景,目的 • 移動軌跡データとは • 図形間の関係記述に基づくアプローチ • リンクを用いた検索の効率化 • 形状の類似度に基づくアプローチ • 重心を用いた線分の形状の近似方法 • まとめ 前半の発表 後半の発表

  3. 背景(1) • GPSを始めとする,廉価で高精度の一取得デバイスが開発されている. • ナビゲーションシステム,位置依存情報サービスなどへの応用が進んでいる. 位置依存情報 地域情報 ナビゲーション

  4. 背景(2) • デバイスの普及に伴い,膨大な移動軌跡データが日々取得され蓄積されている. • データ分析により,ユーザの行動傾向の取得や状況予測などに応用する動きが広がる. 課題 移動軌跡データをどのように分析するか?

  5. 移動軌跡データ • 測定された位置座標と測定された時刻の組の列として表される. = (t1, x1, y1), (t2, x2, y2) … (tn, xn, yn) Y tn 分析のアプローチ ・ 位相幾何学的なアプローチ ・ 形状に基づくアプローチ t1 t2 X

  6. 図形間の関係記述に基づくアプローチ • 移動軌跡データを連続な有向線分とみなし,空間上の他の図形との関係記述によって,データの特徴付けを行う方法. Z 移動軌跡データ例 Y 空間上にプロットしただけでは 移動軌跡データに意味づけが しにくい. X

  7. 図形間の関係記述に基づくアプローチ • 移動軌跡データを連続な有向線分とみなし,空間上の他の図形との関係記述によって,データの特徴付けを行う方法. Y 移動軌跡データを地図などと 重ね合わせ,地図に含まれる 領域(地形)データなどを使うと 特徴づけが行いやすい. X

  8. 本研究でのアプローチ • 移動軌跡と領域の関係を使って特徴づけを行う. 大岡山駅エリア 正門 大岡山駅エリア 東工大エリア 正門 東工大エリア 本館 本館 どのように記述すればよいか?

  9. 領域と線分の関係 • 閉領域と連続な線分との関係は,2x3行列で表すことができる[Egenhöfer90,94]. 閉領域 境界: ∂R R 内部: R° ∂L L° 外部: R- ∂R R° 両端: ∂L R- 連続な線分 L 関係記述行列 内部: L° Φか¬Φが入る

  10. 領域と線分の関係 • 閉領域と連続な線分との関係は,2x3行列で表すことができる[Egenhöfer90,94]. 関係の例 R ∂L L° ∂R Φ Φ R° ¬Φ ¬Φ L R- ¬Φ ¬Φ 線分の一端が領域内にあり, もう一端は領域外にある. 関係記述行列 T0

  11. 本研究での拡張 • 始点を∂0 L,終点を∂1 L と書いて区別することで,有向線分を扱えるようにする. • 閉領域との関係は 3x3 行列として表せる. 拡張部分 関係の例 R T(R,L) ∂0L ∂1L L° ∂R ∂1L Φ Φ ¬Φ ∂0L R° Φ ¬Φ ¬Φ L R- ¬Φ Φ ¬Φ 線分の始点が領域内にあり, 終点が領域外にある. 関係記述行列 可能な行列式は全26通り存在する.

  12. 26通りの関係

  13. 26通りの関係 いずれかの関係に分類できる.

  14. 線分の分割 • 線分を2つに分割すると,分割されたそれぞれの線分と閉領域について関係を再定義できる. L1 R R 分解 L L2 T = T1● T2 T(R,L) ∂0L ∂1L L° ∂1L1 = ∂0L2 ∂R Φ Φ ¬Φ T1 T2 ∂0L2 ∂1L2 L2° ∂0L1 ∂1L1 L1° R° Φ ¬Φ ¬Φ ∂R ¬ Φ Φ Φ ∂R Φ ¬ Φ Φ R° Φ ¬ Φ ¬ Φ R° Φ Φ Φ R- ¬Φ Φ ¬Φ R- Φ Φ Φ R- ¬Φ Φ ¬Φ

  15. 7つの基本的な関係 • いかなる閉領域 R と有向線分 L の関係も,線分の分割を使えば,必ず次の7つの関係の組み合わせで記述できる. E1 E2 E3 E4 E5 E6 E7

  16. 複数の領域との関係 • 各領域 R1, .., Rnと,分割された各線分 L1, …, Lmとの関係記述の列として表す. R1 R2 R3 L R1から出発し,R2 を通過して R3 に到着する移動軌跡 L L を各 R の境界上および 各境界の中心部分で分割 R1 R2 R3

  17. 複数の領域との関係 • 各領域 R1, .., Rnと,分割された各線分 L1, …, Lmとの関係記述の列として表す. R1 R2 R3 分割した各 Li について, 各 Rj との関係を記述し それらを列挙する. T(R1,R2,R3,L) = [E6●E2, E1●E5●E6●E2, E1●E2] いかなる関係も分割により E1..E7 の組み合わせで記述できる.

  18. Path • 問い合わせに最も頻繁に使われる関係は,領域 R1, .., Rn までを順番に通る関係. R1 R2 これを Epathと記述することにする. T(R1, R2, L) = Epath L R1 R2 R3 領域が増えた場合でも・・・ L T(R1, R2, R3, L) = [T(R1, R2, L1), T(R2, R3, L2)] = [Epath, Epath ] R2 R3 R1 L2 L1

  19. Path を用いた関係記述例 T(大岡山, 正門, 東工大, 本館, 東工大, L ) = [Epath, Epath, Epath, Epath] 大岡山駅エリア 正門 大岡山駅エリア 東工大エリア 正門 東工大エリア 本館 本館

  20. Path 検索 • データベースに含まれる移動軌跡の中から,条件を満たす「部分」だけを取り出す. R1 R2 R3 T(R1, R2, R3, L) = [Epath,Epath]

  21. インデックスとして 使用する. Path 検索のためのインデックス 1 2 3 4 1 2 3 4 I I II II III III IV IV V V • 空間を適当な大きさのグリッドに仕切っておく. 2) 入力された移動軌跡データが通るグリッドの順序を記録しておく. 1,IV 2,IV 3,IV 3,III 3,II 2,II 3,III 4,III

  22. インデックスを使った検索(1) 1 2 3 4 1 2 3 4 I I II II III III R1 R2 R1 R2 IV IV V V 4) 3,III を通る各移動軌跡データについて,リンクをたどり,4,III に直に達するデータだけを見つける. 3) 与えられたクエリ中にある領域が含まれるグリッドを特定する. 1,IV 2,IV 3,IV 3,III 例: T(R1, R2, L) = [Epath ] の場合 3,III と 4,III 3,II 2,II 3,III 4,III

  23. インデックスを使った検索(2) 1 2 3 4 I 条件を満たすものだけが答えとして 取り出される. 注) 答の軌跡は,オリジナルのデータの一部分(条件を満たす部分)が返される. II III IV V • 最後に各 R について,実際に条件を満たしているかどうかを調べる. ` Rが複数のグリッドにまたがる 場合は,またがるグリッド全て についてリンクをたどって調べる. R 条件: T(R1, R2, L) = [Epath ]

  24. 検索実験 [移動軌跡データ] 点1000個 x 1000 本 シミュレーションにて作成 平均長は 50km 程度 [グリッド] 1辺5km で20x20 [ハードウェアなど:] Windows2000 / PenIII800MHz リンク不使用(領域数3) リンク不使用(領域数2) リンク使用(領域数3) リンク使用(領域数2) R1 Distance = 2 R2 距離が近いほど効果が大

  25. まとめ • 移動軌跡データ(有向線分)と閉領域との関係を記述する方法を提案した. • 指定された Path を探すためのインデックス作成方法を提案した. • 今後の予定 • 表現力の拡大,実データへの適用 • Path 以外の関係にも適用できるインデックスの開発

  26. 移動軌跡データに対する類似度検索手法 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 柳沢 豊,赤埴 淳一,佐藤 哲司

  27. 形状の類似性によるアプローチ(1) • 地図などの外部図形データを用いず,各移動軌跡データを分類する. スーパー内の顧客の動き ・ 顧客に共通する動きは? ・ 似た動きをする顧客間の 特徴は? ・ 自分と同じような動きを する他の客は? 入口 出口

  28. 形状の類似性によるアプローチ(2) • 地図などの外部図形データを用いず,各移動軌跡データを分類する. • モーションキャプチャデータの解析 • 都市デザインのための動線分析

  29. v = (x, y) とする. D (vi, v’i) = D ( L,L’ ) = 総当りで距離を計算する必要がある. 計算量大 2次元空間上での移動軌跡データに拡張 • 2つの移動軌跡データ間の距離を元に類似度を定義できる. • 時系列データの類似度の定義[Keogh01]を拡張 L Y v1 L’ v’1 v7 v’7 X

  30. 従来の空間インデックス • 2つの図形間の「最短距離」を探すことに重点が置かれている[chon02他]. • 最小被覆図形(MBR)などを利用する方法. MBR を利用して木を作っておく.

  31. 点Pの近傍εを含む MBRを再帰的に探す. 点Pの近傍εを含むMBRには点Pから距離εにある線分が 必ず含まれる.(近傍検索の高速化が可能) 従来の空間インデックス • 2つの図形間の「最短距離」を探すことに重点が置かれている[chon02他]. • 最小被覆図形(MBR)などを利用する方法. P

  32. 従来の空間インデックス • 2つの図形間の「最短距離」を探すことに重点が置かれている[chon02他]. • 最小被覆図形(MBR)などを利用する方法. P 形状の類似度については考慮されていない.

  33. Y 重心間の距離を 2つの線分の類似度の 近似値として使用 それぞれの 重心を計算 X 本研究でのアプローチ • 形状情報を近似的な数値を使って表し,これに対してインデックスを付与する. • 近似値として重心座標を使用する. • 空間インデックス(R-Treeなど)と組み合わせる. v1 Y L v’1 L’ v7 v’7 X

  34. 重心を用いる理由 • 時系列データ間の形状比較を高速化する手法の応用(PAA: Piecewise Aggregate Approximate)[Keogh01]. • 時系列データN個ずつの平均値(重心)間の距離は,元データ間の距離と等しいか小さくなる. 連続する N 個のデータの 平均値(重心) w C1 C0 t

  35. 重心を用いる理由 • 重心間の距離は,オリジナルデータ間の距離(類似度)の下限値として使える. • 比較するデータの個数を減らす方法として使える. ≦ D( C0, C1) D( C0, C1) w D( C0, C1) D( C0, C1) C1 C0 t7 t t

  36. 2次元データへの適用(1) • PAA (重心)と MBR を使ったインデックスを組み合わせることで,効率を高める. • いくつのデータの重心を取るかは予め決めておく. Y L Y N=4 の場合 v8 L v5 から v8 までの重心 v1 v1 から v4 までの重心 X

  37. 2次元データへの適用(3) • 各重心に対し,MBRを利用して木を作成する. • 形状情報を含む空間インデックスができる. Y インデックス A L A C B B C X

  38. 検索方法 • ある移動軌跡データ QLと類似度が ε 以下の移動軌跡データを検索する場合. • L の長さが N の場合. • L の重心を求める. N=4の場合 4つの値の平均値を求め, プロットする. Y Y QL VQ X X

  39. 検索方法 • 木を使って,重心間の距離がε以下になるような点を探す. • その後,元データ同士を比較して実際に距離がε以下であるかどうかを調べる. Y インデックス A A これらが該当した! C B VQ B C X VQから半径εの円

  40. 実験結果 N=Length の移動軌跡に最も近い軌跡を探すときの所要時間比較 インデックスを使用した場合 インデックスを使用しない場合 比較する移動軌跡の長さが増すと, 本手法の効果がより高くなることが分かった.

  41. まとめ • 移動軌跡データの形状の特徴値として重心を用いる方法について述べた. • 「似ている」形状の移動軌跡を効率よく探せるようになった. • 今後の予定 • 線分の拡大,縮小,回転などが生じた場合にも対応できる類似度の計算方法の検討 • 実データへの適用

  42. 関連研究 • Topological Invariants for Lines [Clementini98] • 複数の有向線分間の関係の記述方法を提案 • A Spatiotemporal Query Processor Based on Simplicial Representation [Horinokuchi98] • 軌跡に対する点ベースの近傍検索方式を提案 • Query Processing for Moving Objects with Space-Time Grid Storage Model [Chon02] • 点ベースの近傍検索のための,グリッドを使ったインデックスを提案

More Related