330 likes | 515 Views
東日本大震災に おける Twitter の利用傾向の分析. 宮部 真衣 † , 荒牧 英治 † , 三浦 麻子 ‡ † 東京大学知の構造化センター ‡ 関西学院大学文学部. 発表順序. 研究背景 検証仮説 対象データセット ツイートの種類 ツイートの発信地 引用関係の定義 分析 結果 分析 1 :各地域 において, Twitter はどのように利用 されたのか? 分析 2 :被災地 から発信された情報は ,他の 地域で拡散されたのか ? まとめ. 研究背景.
E N D
東日本大震災におけるTwitter の利用傾向の分析 宮部 真衣†,荒牧 英治† ,三浦 麻子‡ †東京大学知の構造化センター ‡関西学院大学文学部
発表順序 • 研究背景 • 検証仮説 • 対象データセット • ツイートの種類 • ツイートの発信地 • 引用関係の定義 • 分析結果 分析1:各地域において,Twitterはどのように利用されたのか? 分析2:被災地から発信された情報は,他の地域で拡散されたのか? • まとめ
研究背景 今回の震災において活用されたTwitterの利用傾向を分析し,今後のシステム開発などのための知見を抽出 • マイクロブログの普及 • Twitter利用者数:1491万人(2011年7月) • 東日本大震災(2011年3月11日) • Twitterなどのマイクロブログが重要な情報インフラの1つとして活用された
関連研究(1/2) • 人々の感情変化の分析 • Cohnら(2004),Back(2010) • 災害・事件:アメリカ同時多発テロ事件(2001年) • 分析対象:ブログ • デマの発信・拡散についての分類 • Mendozaら(2010) • 災害・事件:チリ地震(2010年) • 分析対象:Twitter
関連研究(2/2) • ツイート発信者の分類や,ツイートで引用されたURLの参照内容に関する分析 • Longuevilleら(2009) • 災害・事件:フランスにおける森林火災(2009年) • 分析対象:Twitter • 伝搬していった情報に関する分析 • Viewegら(2010) • 災害・事件:オクラホマの火事,レッドリバーでの洪水(2009年) • 分析対象:Twitter • Quら(2010) • 災害・事件:青海地震(2010年) • 分析対象:オンラインフォーラム(BBS)
目的 震災発生時のTwitter利用傾向などを 明らかにする • 東日本大震災発生後にTwitterへと投稿されたツイートを分析 • 本研究のポイント • 比較的長期間(20日間)のデータを用いる • 地域性を考慮した分析を行う
発表順序 • 研究背景 • 検証仮説 • 対象データセット • ツイートの種類 • ツイートの発信地 • 引用関係の定義 • 分析結果 分析1:各地域において,Twitterはどのように利用されたのか? 分析2:被災地から発信された情報は,他の地域で拡散されたのか? • まとめ
メディアと情報伝達 一方通行 • ソーシャルメディア • 情報発信者:各個人 双方向 • マスメディア • 情報発信者:メディア運営者
検証仮説(1/2) [1]小林啓倫:災害とソーシャルメディア~混乱、そして再生へと導く人々の「つながり」~,毎日コミュニケーションズ(2011). • 東日本大震災 • 被害の範囲が広く,マスメディアでも全体を報じきれない • 被害が深刻でないものの,支援が必要な地域を対応しきれない[1] • マスメディアで対応しきれない被災地の状況を,ソーシャルメディアにより各個人が発信できる可能性
検証仮説(2/2) 各地域において,Twitterはどのように利用されたのか? RQ1 RQ2 被災地から発信された情報は,他の地域で拡散されたのか? 情報発信者の状況によって利用方法に違いがあるのではないか? 被災地から発信された情報は,全国的に広まるのではないか?
発表順序 • 研究背景 • 検証仮説 • 対象データセット • ツイートの種類 • ツイートの発信地 • 引用関係の定義 • 分析結果 分析1:各地域において,Twitterはどのように利用されたのか? 分析2:被災地から発信された情報は,他の地域で拡散されたのか? • まとめ
対象データセット(1/2) • 本研究では,以下の5種類のデータを利用 • 震災時 • 2011年3月11日から30日までのツイート • 「地震」というキーワードを含むツイートを収集 • 平常時A • 震災以前(2010年3月)のツイート • 平常時B • 震災発生から約4か月後(2011年7月)の,地震以外のトピックに関して収集したツイート • 「風邪」および関連キーワードを含むツイートを収集 • 平常時C • 震災発生から約4か月後(2011年7月)の,地震以外のトピックに関して収集したツイート • 「見える」および「聞こえる」を含むツイートを収集 • 平常時D • 震災発生から約4か月後(2011年7月)の,地震以外のトピックに関して収集したツイート • 症例キーワード(「頭痛」など)を含むツイートを収集
ツイートの種類 情報拡散行動 対話行動 • 本研究では,以下のツイートを扱う • リツイート(RT) • 他ユーザのツイートを自分のフォロワーに転送する行為 • “RT @ユーザ名”が含まれる(非公式RT) ※公式RTは全体の2.6%であったため,今回は非公式RTのみを用いる • リプライ • 特定のユーザ宛のツイート • “@ユーザ名”から始まる
ツイートの発信地(1/2) • 以下の4つの地域に分類 • AREA1:大災害地域 • 宮城県,岩手県,福島県 • AREA2:災害地域 • AREA1に隣接した都道府県 • 青森県,秋田県,山形県,新潟県,栃木県,茨城県,群馬県 • AREA3:間接的災害地域 • AREA2を除いた東京電力管内の都道府県 • 東京都,千葉県,埼玉県,山梨県,神奈川県,静岡県 • AREA4:非災害地域 • AREA1~3以外の都道府県 大 被害 小
ツイートの発信地(2/2) • 発信地の特定手順 • 位置情報が付与されている場合 • 逆ジオエンコーディングにより都道府県を特定 • 位置情報が付与されていない場合 • ユーザのプロフィールから文字列マッチングにより都道府県を抽出
引用関係の定義 時間 A A ○○らしい B RT @ユーザA○○らしい B RT @ユーザB RT @ユーザA ○○らしい C C RT @ユーザC RT @ユーザB RT @ユーザA ○○らしい D D E E RT @ユーザA ○○らしい 本研究では,ツイート内容から取得可能な 最古のツイート投稿者を被RT者とする AのRTと見なす RT投稿者とRTされたツイートの投稿者(被RT者)の扱い
発表順序 • 研究背景 • 検証仮説 • 対象データセット • ツイートの種類 • ツイートの発信地 • 引用関係の定義 • 分析結果 分析1:各地域において,Twitterはどのように利用されたのか? 分析2:被災地から発信された情報は,他の地域で拡散されたのか? • まとめ
分析結果の概要 分析1 分析2 各地域において,Twitterは どのように利用されたのか?(RQ1) 被災地から発信された情報は, 他の地域で拡散されたのか?(RQ2) 本発表では,以下の2つの調査結果について報告
分析1:各地域において,Twitterはどのように利用されたのか?分析1:各地域において,Twitterはどのように利用されたのか? • 震災時の各地域における利用傾向をRT率(情報拡散行動)とリプライ率(対話行動)から分析 • 災害時の特徴の確認 • 平常時との違いはあるか? • 時間経過に伴い,どのような変化をしているか? • 被害の大きさによる違いの確認 • 各地域での違いはあるか?
RT率とリプライ率 震災時は,情報拡散行動が活発化し, 対話行動が抑制される
RT率・リプライ率の時系列変化 地震発生直後は,情報拡散行動(RT)が最も 活性化し,対話行動(リプライ)が最も抑制
都道府県別のRT率・リプライ率 (a)RT率(情報拡散行動) (b)リプライ率(対話行動)
RQ1について RQ1 各地域において,Twitterは どのように利用されたのか? 被害 大 小 被害の大きかった地域では対話行動が, 被害の小さかった地域では情報拡散行動がなされた 平常時と比較して,震災時は情報拡散行動(RT)が活発化 RT率とリプライ率には負の相関あり(相関係数:-0.822)
分析2:被災地から発信された情報は,他の地域で拡散されたのか?分析2:被災地から発信された情報は,他の地域で拡散されたのか? • 被災地から発信された情報の拡散傾向を,RT・被RTの位置関係から分析 • RTにおける位置関係の確認 • 各地域のツイートは,各地域でどれだけRTされたか? • 他地域でRTされた割合の確認 • 各地域の情報は,どれだけ他地域でRTされたか?
RTにおける位置関係(1/2) AREA1 この場合, 被RT者の地域: AREA1(ユーザA) RT投稿者の地域: AREA3(ユーザB) A ○○らしい B RT @ユーザA○○らしい AREA3 被RT者とRT投稿者の位置関係から, 各地域のツイートがどの地域で RTされたかを調査
RTにおける位置関係(2/2) 例:AREA1の場合 = 0.7809… • AREA1の被RT数 • 56918 • 他地域でのRT数 • 3136+26323+14989 = 44448 • 本研究では,ツイート移動率(TTR)を定義 • 各地域の発言が,他地域でどれだけRTされたか?
TTR変化率 地域ごとに,平常時のTTRとの違い (TTR変化率)を検証 ※比較対象として,平常時Dのデータを用いた AREA1(大災害地域)は, 他地域と比較してTTR変化率が高い TTRは地域の大きさの影響を受ける
TTR変化率の時系列変化 震災発生から数日間は,AREA1,AREA2,AREA3におけるTTR変化率が高い
RQ2について RQ2 被災地から発信された情報は, 他の地域で拡散されたのか? 特に被害の大きい地域のツイートについては, 他地域で拡散される割合が多い • 大災害地域(AREA1)は,平常時と比較してツイート移動率が高い • 震災発生後数日間は,非災害地域(AREA4)を除いた地域におけるツイート移動率が高い
発表順序 • 研究背景 • 検証仮説 • 対象データセット • ツイートの種類 • ツイートの発信地 • 引用関係の定義 • 分析結果 分析1:各地域において,Twitterはどのように利用されたのか? 分析2:被災地から発信された情報は,他の地域で拡散されたのか? • まとめ
まとめ • 概要 • 東日本大震災後のツイート(2011年3月11日~30日)の傾向について調査 • 分析結果 • 地域によって,Twitterでの行動傾向が異なる • 特に被害の大きい地域で発信された情報は,他地域へと移動し,拡散される傾向がある • 今後の課題 • 災害時の利用における問題点への対応の検討 • 3月以降の傾向の分析 • 現在,継続してツイートを収集中 • ツイート内容を含めた分析 • 重要な情報が拡散されていたか?
ご清聴ありがとうございました 連絡先:mai.miyabe@gmail.com 本研究で用いた地震に関するツイートデータは,以下のURLから取得・利用できます. http://mednlp.jp/resource.html