コンテクスト情報と操作履歴の関連付けによる操作予測システムの提案

コンテクスト情報と操作履歴の関連付けによる操作予測システムの提案コンテクスト情報と操作履歴の関連付けによる操作予測システムの提案遠山緑生　豊田陽一加藤文彦　服部隆志慶應義塾大学政策・メディア研究科

作りたいシステム • コンテクストに応じた操作の自動化 • if-then ルールの組合わせで構成 • if(あるコンテクスト) then (ある操作) • 利用例 • if(駅の近く) then(時刻表を見る) • if(職場を出る) then(帰るメール) • 携帯機器だけで作成 → 履歴に基づく学習 • コンテクストの定義 • ルールの作成

本発表の提案手法 • GPS内蔵携帯電話で位置取得 • 位置情報の測位履歴 + 操作履歴 • 位置情報コンテクストの分析 • 有意位置: ユーザが良く訪れる領域 • 1地点より一般化した位置情報の表現 • ルールのif節として利用可能な形に • 近い将来の位置を予測可能に • 測位履歴からの有意位置の学習と予測

位置表現の一般化・抽象化 • GPSの測位結果: 緯度経度＝特定の一点 • ルールに使う表現: より一般化・抽象化 • 自宅「周辺」 • 駅の「近く」 • 有意位置(Significant Location) • ユーザごとに意味を持つ、一定の広さの領域 • 中心点の座標＋半径の組で領域を表現 • 有意位置の学習 • 履歴中で一定時間・回数滞在した領域を分析

有意位置の例 • 赤い点： • 測位点 • 青い円： • 有意位置

有意位置の学習 • Ashbrookら • “Learning Significant Locations and Predicting User Movement with GPS” • Proceedings of IEEE Sixth International Symposium on Wearable Computing (ISWC02) • 手法 • k-means法の変種で位置履歴をクラスタリング • 一定時間一定回数滞在している領域を取り出す

Ashbrookらの手法応用の問題 • 利用する測位履歴データの性質が違う • 一般のGPS vs GPS携帯電話 • 元の手法 • 専用GPS測位装置(Garmin社)を利用 • 本研究のターゲット環境 • 携帯電話だけで使えるもの • KDDI au W11K 携帯電話 • gpsOne 技術による測位機能を用いた履歴

ターゲットの特長と問題点 • どこでも測位できる • 精度のばらつきが大きい • 測位頻度が低い • 速度が計れない

どこでも測位できるが精度がばらつく • 室内、地下など - 通信できれば測位できる • 誤差がばらつく • 時に誤差数m, 時に誤差 2km • 測位方法に数モード: GPS単体、基地局補助など • 室内では「取れるがずれる」 • 誤差情報: 楕円形の誤差情報？ • majoraxiserr, minoraxiserr, axisangle • 長半径(majoraxiserr) を推定誤差として利用

測位頻度が低い • 高頻度に取るとバッテリが持たない • 10分間隔: 約21時間 • 5分間隔: 約14時間 • 2分間隔: 約9時間 • 10分に一回で実験 • 有意な速度情報が得られない

Ashbrookらの手法を変更 • ターゲット測位履歴の性質 • 測位時の誤差がばらばら • 測位の推定誤差が得られる • 低頻度: 10分に一回 • 速度なし • ターゲットの性質に合わせた形に変更 • 滞在時間の定義 • 有意位置の半径

滞在時間の定義 • 「滞在」の判定手法 • Orig: 室内＝ GPS Lost ＝滞在 • GPS携帯: どこでも測位できる • 「滞在」の判定時間 • Orig: 10分間以上滞在した点のみを考慮 • GPS携帯: 元々測位間隔が10分間隔 • 本システム • 滞在中か移動中かをクラスタリング前に考えない • 単純化：測位回数が多い＝滞在頻度多い

有意位置の半径 • 半径を決める際に考慮すべき事 • 半径過小 : 過剰な分割 • 半径過大 : 過剰な統合 • 測定誤差との関係 • Orig: 基本半径 0.5マイル(約800m) • 本システム: 多段半径による階層化

多段半径階層化の利点 • 包含関係にある有意位置 • キャンパス全体と各建物 • マクロな移動とミクロな移動 • 推定誤差と半径の関係 • 精度高 - 半径小 • 精度低 - 半径大 • 多段半径によりこれらを両立 • 半径50ｍから2000m程度まで数ステップ

クラスタリング時の推定誤差値利用 • GPS携帯の特性 • 状況により誤差値がばらつく • 推定測位誤差値を利用 • ある測位点について • 誤差 > 半径: クラスタリング対象から外す • 精度に応じた有意位置形成 • 高精度で測れる領域: 小半径 • 低精度にしか測れない領域: 大半径

プロトタイプ(クライアント) • クライアント • KDDI au W11K 携帯電話 • J2ME MIDLET による履歴収集アプリ • 測位履歴 • 指定間隔(10分)ごとに測位 • 操作履歴 • 発着信、メール送受信、ブックマーク、写真撮影 • 一定個数の履歴がたまるとサーバに POST

プロトタイプ(サーバ) • Linux, Apache, PostgreSQL • 履歴管理機能 • 履歴分析・学習機能 • 他データビューワなど

実験 • テスト機をテストユーザが持ち歩く • 3130回の測位履歴 • 約21日分に相当 • 考察: • 有意位置の分析に用いるパラメータ • 閾値とクラスタリング半径 • クラスタリング半径: • とりあえず6階層でクラスタリング • 50,100,250,500,1000,2000m

有意位置とする測位点数の閾値 • 測位間隔は通常10分 • 10分以上滞在すれば、一度は測位される • 測位点数多＝長時間または頻繁に滞在 • 閾値: 有意位置が含むべき最低の測位点数 • 閾値×10分程度の滞在可能性 • 閾値、半径、有意位置個数の検討

閾値と有意位置個数(1) • 個数と実際に得られた位置を検討クラスタリング半径

閾値と有意位置個数(2) • 閾値10(最大): 切り落としすぎ

閾値と有意位置個数(3) • 閾値3(最小): 単なる通過点まで含み、多すぎる

閾値と有意位置個数(4) • 実験ケースの場合、閾値5程度が適当

推定誤差値と半径(1) • 推定誤差値に基づくクラスタリング対象外しの影響 • 50mと2000mの場合に特に影響

推定誤差値と半径(2) • 半径50m の場合 - 不必要？ • 有効率4割以下 • 各地点が100mのどれかの地点にほぼ対応 • 半径2000m の場合 - マクロ行動判別に有効 • 誤差が非常に大きい(>1000m)測位分も利用

半径と有意位置個数 • 半径500m と 1000m はほぼ１対１対応 • 統合可能

有意位置のパラメータ: 結論 • 今回の実験結果のデータ • 閾値 • 測位回数5回程度が適当 • 半径 • 100, 250, 750, 2000m の4つが有効 • 今後検討: • 測位履歴が増えた時どうなるか • ユーザごとの違い

DBNによる位置情報の予測 • 近未来の位置情報に基づくルール記述 • if (駅に向かっている) then (時刻表を見る) • DBN(Dynamic Bayesian Network)に基づく位置予測 • 実装中

DBNの構成 • 有意位置半径の階層を生かした構成 • ノード間の影響 • 同時刻の大きい半径 • 1ステップ前の同半径 • CPT(条件付き確率分布)は履歴から生成

今後の課題 • 有意位置分析時のパラメータ • データ、ユーザのサンプルを増やして検討 • 位置予測 • 観測誤差の取り扱い方法の改善 • 滞在時間、時間帯のモデル化 • 位置-操作ルールのDBNによるモデル化 • 測位履歴と操作履歴間の分析 • 位置から操作の予測

まとめ • 有意位置の学習手法 • 位置 - 操作関係のルール化を目的 • GPS携帯電話の測位履歴の特性 • 多段階の半径を利用 • 測位誤差のばらつきに対応 • 位置予測への応用 • 実験 • 適当な分析パラメータについて考察 • 位置のDBNによる予測 • 有意位置を単位とした予測

関連研究 • Bayesian Network による位置予測 • “Learning and Inferring Transportation Routines” • Ｌｉｎ　Liao他 • Nineteenth National Conference on Artificial Intelligence • “Inferring High-level Behavior from Low-Level Sensors” • Donald Patterson他 • Fifth Annual Conference on Ubiquitous Computing (UBICOMP 2003)

誤差が大きい時、半径を過小にすると • 本当はいない場所に半径小の有意位置 • 測位誤差は本来の位置から均等に分布しない • 基地局との関係などで偏って分布する

コンテクスト情報と 操作履歴の関連付けによる 操作予測システムの提案