620 likes | 899 Views
神田外語大 2009 年度 集中講義 社会言語学. 国会会議録検索システムと プロジェクト概要説明. 松田謙次郎 kenjiro@shoin.ac.jp. はじめに. 国会会議録 公表頒布が両院の義務(憲法第57条) 速記による逐語的記録(衆議院規定台 15 章、参議院規定第 10 章) 議院保存版と、一般公表用と2種類作成 「議事録」は俗称. 第 41 条 国会は、国権の最高機関であつて、国の唯一の立法機関である。 第 42 条 国会は、衆議院及び参議院の両議院でこれを構成する。 第 43 条 両議院は、全国民を代表する選挙された議員でこれを組織する。.
E N D
神田外語大 2009年度集中講義 社会言語学 国会会議録検索システムとプロジェクト概要説明 松田謙次郎 kenjiro@shoin.ac.jp
はじめに • 国会会議録 • 公表頒布が両院の義務(憲法第57条) • 速記による逐語的記録(衆議院規定台15章、参議院規定第10章) • 議院保存版と、一般公表用と2種類作成 • 「議事録」は俗称
第41条 国会は、国権の最高機関であつて、国の唯一の立法機関である。 第41条 国会は、国権の最高機関であつて、国の唯一の立法機関である。 第42条 国会は、衆議院及び参議院の両議院でこれを構成する。 第43条 両議院は、全国民を代表する選挙された議員でこれを組織する。 速記で書いた日本国憲法http://www.shugiin.go.jp/itdb_annai.nsf/html/statics/osirase/sokki17.htm
国会会議録検索システムトップページhttp://kokkai.ndl.go.jp国会会議録検索システムトップページhttp://kokkai.ndl.go.jp
左ウィンドウに発言者一覧、中央に検索語を含む発言のすべてが表示左ウィンドウに発言者一覧、中央に検索語を含む発言のすべてが表示
発言者にチェックをいれるとDL可能 154-衆-予算委員会-22号 平成14年03月11日 ○辻元委員 ケニア議連の会長に就任、その直前になさっているわけです。大使会っていますよ、行く前も。そして、そのときソンドゥ・ミリウの話が出ていますよ。特に債務削減について出ています。 このとき、ちょうど、第二期分への百五億円の借款供与をするかでちょうどもめていた最中だったわけです。そして、これまでの借金をまけてくれ、債務削減してくれとケニアが言い出したら二期工事ができないという瀬戸際だったわけです。そのときにあなたは訪問しているわけですよ。ケニアと日本の当時の最大の懸案だったんですよ、これが。 あなたは、大使館で事前に債務削減を求めないようにという話をしてから行っているじゃないですか。どうしてうそつくんですか。こんな、十年前から三回も四回も行っていて、大統領にも会っていて、二年半前に行くまで、それも現地で現地の大使館員やそれから外務省の人から話を聞くまで、ソンドゥ・ミリウがどこにあったか、そんなダムの名前も聞いたことない。そんなこと、だれが信じられるんですか。 あなたは疑惑のデパートと言われているけれども、疑惑の総合商社ですよ。 * download[1].txtというテキストファイルで、会議録情報が1行目に付与されてPCに落とされる。とても簡単!
ここで注意! • 「検索件数」=「出現数」ではない。 • 「検索件数」は、その単語が使われた会議(号)の数 • しかし一回の会議で何度同じ単語が使われても、それは一回としか数えられない!! • では出現数のトータルはどうやって数える? • 手作業で各会議に出てきた数を一つ一つ数える(T_T)
国会会議録検索システムの特徴 • 話し言葉(を元にした筆記記録)の膨大な記録 • 戦後60年近く国会開始以来のすべての会議の記録 • 世界的にもまれ • オンラインで検索・ダウンロード可能 • 将来はCD-ROM化(「参議院50年のあゆみ」)
国会会議録検索システムの概略 • http://kokkai.ndl.go.jp/ (国会図書館サイト) • 2001年から本格運用開始 • 第一回国会(1947年5月開会)以降の本会議、全ての委員会の議事録 • 会議後2,3週間でオンラインに出る • もちろん、紙の会議録にないものはここにはでてこない…
これまでの会議録 • 会議後、議員用に速報(「速記録」) • その後両院本会議が官報の号外として一般に頒布(はんぷ)(「会議録」) • 委員会記録は、各議員への配布が主目的 • 一般国民も(困難だが)一応入手可能 • このシステムで、本会議会議録と委員会記録の両方が誰にでも手軽に入手可能に
関係なさそうだが、トリビア • 「会議録」と「議事録」 • 正式名称は「会議録」 • イギリス、カナダではhansard • アメリカではJournal とCongressional Record • 前者は議事手続きを納める。後者は発言そのまま。 • 参議院と衆議院 • 実は速記者養成は別々にやっている • 行政改革で一体化される?
言語資料としての問題点 • 会議録に含まれない発言 • OCRによる誤字・脱字(144回国会=2000年まで) • 外字処理 • JIS第1.2水準に変換 • 速記反訳作業における整文化(字句の整理) • ケバ取り • 繰り返しの消去 • 明らかな助詞の誤りの訂正 • 一時はら抜き言葉も「訂正」 ⇒「速記は逐音で、反訳は逐語で」がスローガン(らしい)
会議録に含まれないもの • 国会の秘密会記録 • 議員により訂正された発言 • 会議録配布前なら痕跡は残らない • 不穏当な発言 • プレス・コード • 議長の許可を得ない発言(「不規則発言」) • やじ
秘密会 • 前田英昭「国会の不穏当な発言と会議録の削除」(「議会政治研究」, No. 43 (1987)). • 憲法57条第2項 • 特に秘密を要すると議決された部分は公表の必要なし • 本会議ではまだ秘密会はなし • 委員会では、1987年現在で92回開催 • 秘密会の例: ロッキード問題に関する調査特別委員会(ただしすべて公表) • 秘密会の記録の公開を巡っては議論が多い
不穏当な発言 • 議長が取り消し権を行使して取り消す • 無礼な発言 • 吉田茂の「バカヤロウ発言」 • 青島幸男の「男めかけ」も元の発言は削除 • 他人の私生活に関する発言 • 事実に背馳(はいち)する発言 • 委員長の不穏当な発言 • ハマコーの共産党スパイ査問事件関連の発言
取消の(有名な)例:吉田茂の「バカヤロウ発言」取消の(有名な)例:吉田茂の「バカヤロウ発言」 第15回国会 衆議院 予算委員会 - 31号 昭和28年2月28日 ○西村(榮)委員 総理大臣は興奮しない方がよろしい。別に興奮する必要はないじやないか。(吉田国務大臣――なことを言うな」と呼ぶ)何が――だ。(吉田国務大臣「――じやないか」と呼ぶ)質問しているのに何が――だ。君の言うことが――だ。国際情勢の見通しについて、イギリス、チャーチルの言説を引用しないで、翻訳した言葉を述べずに、日本の総理大臣として答弁しなさいということが何が――だ。答弁できないのか、君は……。(吉田国務大臣「―――――」と呼ぶ)何が―――――だ。―――――とは何事だ。これを取消さない限りは、私はお聞きしない。議員をつかまえて、国民の代表をつかまえて、―――――とは何事だ。取消しなさい。私はきようは静かに言説を聞いている。何を私の言うことに興奮する必要がある。 ※ ――=無礼、 ―――――=バカヤロウ
最近の例: 柏村武昭議員の「反日的」 • 第159 回国会 参議院 決算委員会 10号 平成16年4月26日 • さらに、聞くところによれば、人質の中には自衛隊イラク派遣に公然と反対していた人もいるらしいと。もし仮にそうだとしたら、同じ日本国民ではあってもそんな反政府━ ━分子のために数十億円もの血税を用いることは強烈な違和感、不快感を持たざるを得ないと私は思います。 • 在ペルーの日本大使館人質事件以後、在外邦人の救出体制についてはいろいろ議論されまして、対策も講じられてきましたが、今回の人質事件の教訓を踏まえて、改めて在外邦人保護について抜本的な対策を練る必要があるんではないかと思います。憲法の精神に抵触しない程度での危険地域への渡航禁止措置や━ ━活動家の一時出国制限など、いろいろあり得ると思いますが、そうした点については外務当局はどのような見解をお持ちなんでしょうか。
プレス・コード • 連合軍による検閲 • 昭和27年失効(サンフランシスコ平和条約) • 「日本におけるあらゆる刊行物」に適用 • 国会会議録も含まれる • 削除された発言は、現在でもこのまま
昭和26年1月27日衆議院本会議における川上貫一(共産)の発言昭和26年1月27日衆議院本会議における川上貫一(共産)の発言 そもそもこの飛行基地は、すべて国民の税金でつくつたものです。終戰処理費によつてつくられた飛行場であります。―――――――――――――――――。政府がいかように強弁されようとも、国民は――――――――――――――――という事実をおおい隠すことはできません。(拍手)しかもこの終戰処理費は、二十六年度において一千二十七億が計上されております。この莫大な金が、次から次へと飛行基地や軍事道路や潜水艦基地のために使われたらどうなるか。国民の税金はますます高くなり、至るところで田畑は取上げられ、農民は立ちのきを命ぜられ、 ―――――――――――――――――――――ことは明白である。
不規則発言 • 議長の許可を得ない発言 • 野次の類 • 例外 • 議事進行に特に関係がある場合 • 議長または委員長が特に取り上げた場合 • 議場の状況で発言者確認、聴取不可能な場合 • (発言する者あり)(議場騒然、聴取不能)
整文化(字句の整理)の基準 • 記録部整文委員会の決定(1972年) • 言い誤り、脱落などで発言趣旨が文字化しにくい時は、軽微なものは社会通念上認められる範囲で整理 • 字句の整理は改竄に繋がるので必要最小限に • 発言そのものが問題になる時は、整理をしない • 発言訂正請求を受けた場合、軽微な場合は会議録主任が処理、内容が問題になる時は、委員長の許可を必要とする
ケバ取り • フィラー、聞き返し、接続詞などを、不自然にならない範囲で、また内容に影響のない範囲で取り去る作業 • 結果的に、「読み物」として読みやすくなる • テープリライト(文字起こし)の世界では、ほぼ常識的知識
情報公開の壁 「…字句の整理後のものが記録部の「話したとおり」であるが、その原稿を見た外部の人に、こんなにナオスのかという印象を持たれ、なぜ発言を直すのか改ざんではないかと言われたら会議録作成業務に携わるものにとって致命的であるので、外部に対しては、字句の整理ということは誤解を招く説明不可能のこととして、今日まで公表を避けてきたのが実情である」(青山 1989: 44) • 「速記反訳処理について」という内部文書は、公開・複写などができない • 「情報公開法」(2001年4月1日施行)は司法・行政・政府特殊法人が対象; 国会(立法)は、情報公開の埒外
旧会議録機械読取による誤字・脱字 • それは私炉防止いたします ⇒それは私が防止いたします • ついらちょうてんになりまして ⇒ついうちょうてんになりまして • これだけが水害の原因であつたとは考えれないのでありまして ⇒これだけが水害の原因であつたとは考えられないのでありまして
議会資料の言語研究への使用例 • 平沢啓(2000)「明治期の県議会の言語—県議会議事録速記録を資料として— 」 「きのくに国文」 No. 6(2000) • 井上史雄(2003)『日本語は年速一キロで動く 』 (講談社新書) • Hansard Corpus
平沢啓(2000) • 大分、和歌山、山形3県の議事録速記に見られる方言使用の地域差を見る • 助動詞、助詞 • 結論 • 3県での地域差は見られない。特に方言の使用が認められない • これは共通語としての文語の使用によるもの
井上史雄(2003) • 『日本語は年速一キロで動く 』 • 「サ入れ言葉」に関する卒論調査 • サ入れ言葉 • 五段動詞の使役に「サセル」をつけるもの • 終わらさせてくださ い、しゃべらさせてください • 「戦後まもなくの使用例が見つかった」(p. 53)。以下詳細不明 • 現在上智の院生が修論執筆中。
会議録の言語データとしての使用 • 資料の豊富さの割に研究例はまだ少ない? • 知られていない? 結構ジミか。 • 「フォーマルな会議」の記録であることへの不信? • 近代語の研究で、(議会を含めた)演説の分析は山ほどある • 国会会議録はまだまだこれから • さらに、地方議会記録となるとさらにまだまだ
言語資料としての可能性 • 完全な口語資料ではない • しかしそれでも過去60年近くの日本語(の変化)を何らかの形で反映しているはず • 使えるものと使えないもの • 談話標識、助詞の脱落、言い誤り等は無理 • 気づきにくい現象なら大丈夫? • 助詞の使い分け • サ入れ言葉 • 語彙の増加(新語、外来語)
さらに… • 少なくとも都道府県議会レベルでは、会議録はオンラインで公開されている • 速記や反訳を外注している場合、品質に問題 • 国会は専門速記者を養成 • 基本的には標準語に準じた話し言葉 • 「気づかない方言」調査の可能性
都道府県議会レベルでの会議録公開 • 栃木(準備中)・福井両県議会以外は、すべてHPに会議録検索機能がある • さらに百万都市レベル(札幌、仙台、さいたま、千葉、川崎、横浜、名古屋、京都、大阪、神戸、広島、北九州、福岡)でも会議録検索機能付き市議会HPがある • つまり全国に膨大なデータがある!
さらに… • 国会審議の録画中継 • ビデオ・オン・デマンドシステムで、一部視聴可能 • 衆議院: http://www.shugiintv.go.jp/top_frame.cfm • 参議院: http://online.sangiin.go.jp/cgi-bin/online.cgi • これらを使って、一部については実際の発話と会議録上の記録との照合は可能
海外における議会会議録? • 先進諸国のHP公開は常識、歴史的には浅い • 米連邦議会議事録 http://thomas.loc.gov/ ⇒1989~ • イギリス上院・下院議事録http://www.parliament.uk/about_commons/about_commons.cfm ⇒それぞれ1996~ , 1989~ • 実際の言語研究例も僅少 • イギリスにおける談話分析(Slembrouck 1992, etc) • カナダの議会コーパスの自然言語処理への応用
海外における議会会議録?2 • これは一つには英米では少なくとも会議録はほぼ完全な書き言葉になっているからか? • ただしそれでも、たとえば関係代名詞の使用のようなバリエーションがあるはず • that/which-who-whom/φ • こうした研究は一種のコーパス研究であり、なされても良いはず • 但しその前に、英米における議会会議録の性質を見極める必要がある。
研究例1: 「が・の」交替の変化 • 「が・の」交替規則(GA/NO-conversion) • 埋め込み文内での主格助詞のゆれ • 松田(が・の)やった発表 • 松田(が・の)話すのを聞いた • 原田(1971)以来、日本語生成文法で最も扱われてきた現象の1つ • 言語変化の途上という予想(の⇒が) • 気づかれにくい(⇒修正を逃れる)
南部智史(2003)の結果 • 南部智史「『が』と『の』の交替の史的変化について」(2003年度神戸松蔭女子大大学院英語学研究XIIレポート) • 吉田茂(1878-1967)、鳩山由紀夫(1947-:いずれも東京出身、またほぼ原田と同年齢)の発言それぞれ約16万字分のデータから分析 • カイ自乗による検定: p< 0.001
研究例2: ら抜き言葉 • 「見られる」~「見れる」、「食べられる」~「食べれる」、「考えられる」~「考えれる」 • 長い単語(考える、信じるなど)ほどら抜きがしにくい傾向 • 関西では「ら抜き」が一般的 • 「非標準的」という位置づけが未だ一般的 • 日本語における進行中の変化 • 国会の発言ではどうなっている?
国会と国語研調査を比べると… • 国語研調査では「ら抜き」はずっと増えている • 国会では突然ここ数年来増加している • これはいかにも不自然! • 国会記録部の方針変更