410 likes | 692 Views
社会 統計 第1回:社会調査の過程. 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp. 第1章:社会調査の過程. 理論とは何か 理論命題と操作仮説 独立変数と従属変数 仮説の否定 操作化 測定 統計的検定 研究サイクルの完成. 社会調査での問題意識. 社会調査の過程は,しばしば,世界に対して問いを発することから始まる. どのような人 たちが民主党に投票するのか? 所得の低い人たち は,中程度の人たちに比べて,子どもの数が多いのか? いろいろな職業の人たちはどれくらいの所得があるのか?
E N D
社会統計第1回:社会調査の過程 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp
第1章:社会調査の過程 • 理論とは何か • 理論命題と操作仮説 • 独立変数と従属変数 • 仮説の否定 • 操作化 • 測定 • 統計的検定 • 研究サイクルの完成
社会調査での問題意識 • 社会調査の過程は,しばしば,世界に対して問いを発することから始まる. • どのような人たちが民主党に投票するのか? • 所得の低い人たちは,中程度の人たちに比べて,子どもの数が多いのか? • いろいろな職業の人たちはどれくらいの所得があるのか? • カトリック信者やユダヤ教徒に比べてプロテスタント信者の方が自殺率が高いのはなぜか?
こうした問いは,職業と収入のように,人々や集団が持つ特性間の関係に言及している.こうした問いは,職業と収入のように,人々や集団が持つ特性間の関係に言及している. • 変動(variation)の説明が社会科学の中心的課題である. • How do people, groups, communities, or nations differ from one another, and what are the consequences of such variation? (原著第4版,p.3)
統計学は,特性間の関係を解き明かすためのツールである.統計学は,特性間の関係を解き明かすためのツールである. • Our approach to statistics stems from directly from a conviction that adequately explaining any human behavior is equivalent to showing how variations in that behavior are related to multiple, measured causes. (原著第4版,p.4)
問いはどこから生まれるのか? • 個人的体験 • これまでの研究成果の蓄積.社会現象に関する多くの理論や経験的知見.
1.1. 理論とは何か • 命題(proposition):抽象的な概念間の関係についての言明.暗黙的な If-Then 形式(If 原因,then 結果)をとるものが多い. • 例1:経済的不安定によって,国家の政治体制に対する不満が生じる. • 例2:国家の政治体制に対する不満によって,反体制の政治的勢力が強くなる.
命題は概念(concept)とそれらの間の関係(relationship)から構成される.命題は概念(concept)とそれらの間の関係(relationship)から構成される. • 概念:明確に定義された物,行動,(自己あるいは他者の)知覚,現象. 経済的 不安定 政治体制への不満 生じる (因果)
社会的理論(social theory):社会現象に関するいくつかの概念が因果的に関係し合っていることを仮定した,複数の命題の集合. • 政治経済上のミニ理論の例: • P1:経済的不安定によって,国家の政治体制に対する不満が生じる. • P2:国家の政治体制に対する不満によって,反体制の政治的勢力が強くなる.
理論に含まれるどの命題も,少なくとも1つの他の命題と結びついていなければならない.理論に含まれるどの命題も,少なくとも1つの他の命題と結びついていなければならない. 経済的 不安定 政治体制への不満 政治体制への不満 反体制勢力の強さ
命題が相互に結びつくことにより,演繹(deduction)が可能となる.命題が相互に結びつくことにより,演繹(deduction)が可能となる. • P1:経済的不安定によって,国家の政治体制に対する不満が生じる. • P2:国家の政治体制に対する不満によって,反体制の政治的勢力が強くなる. • P3:経済的不安定によって,反体制の政治的勢力が強くなる.
理論とは何か • 理論は複雑な現実の世界からの抽象化である. • 説明されるべき現象の中から少数の側面を選ぶ. • 残りの部分については無視している. • 言及していない要因に関しては,働いていない,あるいは,一定であることを仮定する.
理論は一般に,ある一定の条件ないし対象にだけ適用することを意図している.理論は一般に,ある一定の条件ないし対象にだけ適用することを意図している. • 境界条件(boundary condition):社会的理論を構成する命題が妥当であると期待される時間,場所,活動. • 例:マルクスの階級闘争説は,産業資本主義社会にもっともよく当てはまる.
理論,パラダイム,モデル • パラダイム:包括性の高い理論.現実に対する独自の観点を提供する. • 例:進化パラダイムの登場,ニュートン力学から相対論へ. • モデル:理論を特定の現象に適用したもの.具体的な対象に対して,具体的な予測を行う.
1.2. 理論命題と操作仮説 • 操作仮説(operational hypothesis):抽象的な概念の代わりに観察可能な具体的な対応物(あるいは用語)を用いて言いかえられた命題. • 理論を構成する命題を検証するには,操作仮説を生成する必要がある. • 命題P1:経済的不安定によって,国家の政治体制に対する不満が生じる. • 「経済的不安定」「国家の政治体制に対する不満」を具体的にしないと,命題の検証ができない
理論命題から操作仮説へ • 政治経済上のミニ理論 • 命題P1:経済的不安定によって,国家の政治体制に対する不満が生じる. • 命題P2:国家の政治体制に対する不満によって,反体制の政治的勢力が強くなる. • ミニ理論からの操作仮説: • H1:物価上昇率が高いと,大統領の経済政策に対して否定的な態度が生まれる. • H2:大統領の経済政策に対する不満が高いと,選挙において野党への支持が増大する.
ひとつの命題は,いくつかの異なった操作仮説へと言い換え可能.ひとつの命題は,いくつかの異なった操作仮説へと言い換え可能. • あるひとつの概念に対して複数の指標が存在し,それらが互いに同じぐらいよい指標であると考えられるならば,ある指標によって検証された仮説は,別の指標によっても検証されるはずである.
仮説に含まれる指標は,しばしば変数(variable)と呼ばれる.変数とは,様々な数値をとりうる,人,物,事象の特性である.仮説に含まれる指標は,しばしば変数(variable)と呼ばれる.変数とは,様々な数値をとりうる,人,物,事象の特性である. • 値が変化しないものは定数(constant) • 概念を潜在変数(latent variable),測定される変数を顕在変数(manifest variable)と呼ぶこともある.
1.3. 独立変数と従属変数 • 独立変数(independent variable):因果関係に言及あるいはそれを含意している仮説において,原因の役割を持つ変数. • 例:「年収は学歴によって異なる」という命題での,学歴. • 実験では,実験者が操作する変数 • 操作できない変数を地位変数(status variable)と呼ぶことがある.
従属変数(dependent variable):独立変数に対して,結果の役割を持つ変数. • 例:「年収は学歴によって異なる」という命題での,年収.
練習問題 • 章末問題9:以下の仮説に含まれる独立変数と従属変数を指摘せよ.またどれが地位変数であるかを述べよ. • テレビをよく見る子どもほど学業成績は低い. • 南部に住む人は他の地域の住人よりも,対人的暴力に対する寛容度が高い. • 黒人男性よりも黒人女性の方が年収は著しく低い.
1.4. 仮説の否定 • 経験科学において,理論あるいは命題は,真実であると証明できない. • Karl Popper の反証主義(falsificationism).反証可能性によって,科学とエセ科学を区別した. • 命題は次の2種類しかない • すでに反証され,誤りであることがわかっている命題. • これまでのところ,まだ反証されていない命題.
数多くの研究によって反証されなかった命題は,真実である可能性が高い.しかし,真実であると証明することはできない.いつかは反証される可能性がある.数多くの研究によって反証されなかった命題は,真実である可能性が高い.しかし,真実であると証明することはできない.いつかは反証される可能性がある. • 自然科学では,競合する理論やモデルから,両立しない仮説を導き,データによって一方を否定するということが行われてきた.
反証アプローチが社会科学にも適用可能なのかについては,疑問の余地がある.反証アプローチが社会科学にも適用可能なのかについては,疑問の余地がある. • 概念,境界条件,操作仮説のあいまいさ • それでも,社会科学における知識の蓄積は,(少なくとも部分的には)仮説の反駁によってもたらされている.
1.5. 操作化 • 理論から操作仮説を導くときには,抽象的な概念を観察可能な変数へと操作化(operationalization)しなければならない. • 妥当性(validity):ある操作によって得られた測度が,測定しようとしている概念を表している程度. • 操作(operation):人,物,事象について,仮説の検証と関わる側面を観察し記録する方法.
非常に簡単にいえば,妥当性は,意図している概念を測定できているかどうかを問題にしている.非常に簡単にいえば,妥当性は,意図している概念を測定できているかどうかを問題にしている. • 経済的不安定性を物価上昇率によって測定しようとする.物価上昇率という測度は,経済安定性という概念を,どれぐらい正確に表しているだろうか? • 妥当性という考え方は複雑である.近年は構成概念妥当性という考え方に収束している.
信頼性(reliability):観察結果が再現可能な程度.同一対象の測定を繰り返したとき,測定値が安定していること(再テスト信頼性).信頼性(reliability):観察結果が再現可能な程度.同一対象の測定を繰り返したとき,測定値が安定していること(再テスト信頼性). • 測定のたびに数値が異なることはないか. • テキストでは,「同一概念について別個の操作をしたときに同じ結果が得られる程度」という定義がされている.これは収束的妥当性と呼ばれる妥当性の定義に読めるので,あまりよくない.
1.6. 測定 • 測定(measurement):観察結果に対してある一定の規則を用いて数を付与すること. • 測定を行うことで,変数間に仮定された関係(命題)を検証するための,数学的操作が可能になる. • どのような数を付与するか? • 質的変数(qualitative variable):測定対象を,それらが持つ特性の種類(質)によって分類したもの. • 量的変数(quantitative variable):特性の大きさ(量)によって分類したもの.
測定対象を,それらが持つ特性(たとえば,性別)の種類(質)によって分類するとき(つまり,対象をカテゴリに分類するとき),その特性ラベル(たとえば,性別)を質的変数(qualitative variable)と呼ぶ.カテゴリには数値を割り当てることもある(たとえば,男が0,女が1). • 測定対象が持つ特性の大きさ(量)を測定した数値を量的変数(quantitative variable)と呼ぶ.
連続型変数と離散型変数 • 連続型変数(continuous variable):潜在的に,ある範囲の実数すべてをとりうる. • 測定限界のため,整数値しか現れないこともある.(例:学力テストの得点) • 離散型変数(discrete variable):整数値のみをとる. • 多くの場合に,計数によって得られた値(例:各世帯における子どもの数).
テキストでは離散変数と連続変数という区分を行っているが,これは質的変数と量的変数という区分の方が適切だろう.テキストでは離散変数と連続変数という区分を行っているが,これは質的変数と量的変数という区分の方が適切だろう. • 質的変数はすべて離散変数と考えられる(離散か連続かを決めなければならないのならば). • 量的変数には,離散変数と連続変数がある. • 離散・連続の区別は,量的変数についてのみ意味がある.
測定水準(質的変数) • 名義尺度(nominal scale):男女,出身地,信仰する宗教など,順序関係のない質的変数の尺度. • 順序尺度(ordinal scale):学歴や社会的地位など,順序づけ可能な質的変数の尺度(カテゴリに順序がある).測定値間の差は無意味.平均値は無意味だが,中央値を求めることはできる.
測定水準(量的変数) • 間隔尺度(interval scale):テストの得点のように,測定単位(例:1点)いくつ分かという測定を行う,量的変数の尺度.測定値間の差に意味があるが,絶対原点を持たないため,比率(何倍)は無意味.平均値が意味を持つのは,この尺度と比率尺度. • 比率尺度(ratio scale):絶対原点を持つ,量的変数の尺度.年齢や収入など.
練習問題 • 章末問題12(改変):以下の変数はどの尺度水準(名義尺度,順序尺度,間隔尺度,比率尺度)で測定されるかを答えよ. • 大学の学部の大きさ:専任教員の数 • 国の地方:北部,南部,東部,西部 • 犯罪発生率:住人10万人ごとの各年の殺人発生件数 • テレビ視聴:1週間のテレビ視聴時間
4Hクラブのコンテストの成績:青リボン(一等賞),赤リボン(二等賞),黄リボン(三等賞)4Hクラブのコンテストの成績:青リボン(一等賞),赤リボン(二等賞),黄リボン(三等賞) • 出身地:インディアナポリス,ブルーミントン,ゲーリー,等々 • 党派性:選挙区ごとの社会主義政党への投票率 • 自尊感情:「とても好き」から「とても嫌い」まで7段階尺度
連続変数は,ある範囲の実数値すべてを取りうる.ただし,測定の精度には限界がある.連続変数は,ある範囲の実数値すべてを取りうる.ただし,測定の精度には限界がある. • 例:テストが測定している学力(概念)はどのような実数値もとりうると考えられるが,テストの得点(測度)は特定範囲の整数値である.
観察結果は,相互に排他的で,かつ,包括的なカテゴリに割り当てなければならない.観察結果は,相互に排他的で,かつ,包括的なカテゴリに割り当てなければならない. • 相互排他性(mutual exclusiveness):個々の観察結果が変数の中の唯一のカテゴリに位置づけられること. • 包括性(exhaustiveness):すべての観察結果を位置づけるのに,十分なカテゴリが存在すること. • 離散変数での「その他」というカテゴリは便利だが,まったく異なった結果がこうしたカテゴリに混在することは,できる限り避けるべき.
1.8. 研究サイクルの完成 • 統計的手法によって,操作仮説を検討し,経験的知見を得る. • 操作仮説が支持されれば,そのもととなった命題および社会理論が妥当であることの確信が増す. • 支持されなければ,命題および社会理論の妥当性は疑われる.
理 論 (理論的命題) 経験的知見 操作仮説 統計的検定 観察と測定 図1.1研究のサイクル(テキスト p.6)