「パス解析大流行に思う」へのコメント

平直樹@大学入試センター


                             1996年5月8日

信州大学 教育学部
  守 一雄 先生

                      大学入試センター 研究開発部
                                平 直樹
                         (イリノイ大学滞在中)
拝啓、

 新緑の候、益々ご清祥のこととお慶び申し上げます。

 いつも「KR」をお送りいただき、ありがとうございます。ことに、私自身の論文への コメントは励みにもなり、どのようなことをお書きいただけるのか楽しみにしています。

 さて、以前お送りいただきました「創刊第4号」に「パス解析大流行に思う」と題した コラムについては、大切な問題を取り上げられ、傾聴に値するものだと感じました。特に 私の論文を引用してご批判いただいていますので、これは私に「何らかの意見を申し述べ よ」とのメッセージだと常々感じておりました。慣れない土地への引っ越しで、しばらく ごたごたしておりまして、中々取りかかることができなかったので遅くなりましたが、よ うやく身辺も落ち着き、こうして筆を取らせていただいた次第です。これは、あくまでも 私個人の私見であり、パス解析や共分散構造分析など因果モデルを用いて分析しておられ る他の研究者の方々と共通の意見ではありませんので、予めお断りしておきます。

 まず、この問題に関しての私自身のスタンスを明らかにしておきたいと思います。私は 統計的手法を用いて心理学的分野の研究を行っている者です。したがって、統計は何らか のテーマを研究する際の道具であり、私の研究スタイルの上で欠かせない大切な手段です。 その上で、研究の上での統計の役割をどのように考えているかを申します。

 私は、統計とは基本的に「データの持つ情報の集約の方法」と考えております。現実に まさに起こっている現象は非常に豊富な情報を備えていますが、それをそのまま保つこと は不可能です。また、特に学問的な問題を考えるためには、意味のあることでも必要なこ とでもないでしょう。現実の現象の中から、自分が学問的関心を持つ現象(ただし、これ は「その時一回限り」のものとしてしか解釈できないものではない、いう制約がつきます が)を如何にして精錬して集約的に取り出し、意味のある形(=他人と理解を共有できる 形)に整理してまとめあげるか、これが研究を行うという行為であると考えることができ ると思います。そのためには、必要度の低い情報は思い切って落としていかなければなり ません。なお、ここでいう「情報」ということばは、非常に広い意味に解釈してください。 例えば、「引っ越しは大変だった」と「ことば」にして伝えるときには、体験された現象 そのものからほとんどの「情報」は落ちていますよね?そういった意味でのことばの使い 方です。

 さて、大雑把な話ですが、研究を行う時、実は大きく別けて2つの段階での情報の集約 が考えられると思います。一つは「データを取る」段階、もう一つは「データをまとめる」段階です。例えば、私自身の研究を例にとって挙げれば、私は「作文能力の評価」に 関心が有るわけですから、エッソの絵を用いたまさにあの課題そのもののみに関心が有る わけではない。「作文能力測定」のための一つの代表(サンプル)としてあの課題を選ん だ訳です。したがって、あそこで得られる知見が極めて限定的なものでしかないと考える ならば、私はこの研究に着手しなかったでしょう。つまり、この研究の結果が「あの課 題」、「あの被験者」、「あの採点者」のみにで限定的に通用するものであると考えれば、 やらなかったということです。そこでは、暗黙のうちに何らかの一般的な意義を期待して いる訳です。ここで、必然的に第一段階の集約が起こっています。そして、この「データ を取る」段階でのデータの取り方は、当然、次の段階の集約、統計的手法を用いた集約の 方法を見据えている訳です。つまり、用いる統計的方法に合わせたデータの取り方をして いるということです。

 次の段階、統計的方法を用いる段階で気をつけるべきことは、「素直で分かりやすい」 結果を得るということ、すなわち、所与のデータの情報を理解しやすいように十分にスリ ムに削ぎ落としながらデータそのものの持つ元々の性質を失わないことだと考えています。 例えば、この段階では、どの答案が誰が書いたものであり、それをある形で評価したのは 誰先生であるというような、個人情報は基本的に意味を持たなくなります。もちろん、あ る段階で匿名的な被験者Siの各変数の値がどれとどれであるかという対応関係は大切で すが、それが山田君のものか鈴木さんのものかということはどうでもよくなるということ です。(ちょっと話は横道にそれますが、これが研究上の関心と日常生活の関心とが大き く違う点ではないでしょうか?つまり、林さんが好きなのは佐藤君か自分かということは 大きな問題だったりするわけですよね?)このとき、妙な統計の使い方をすると必要なも のを落としてしまったり、データにはないはずのものが出てしまったりします。個人的に は、特に問題なのは後者の方だと思っています。データの限界を超えてびっくりするよう な結果が出るような分析方法はちょっと眉唾です。

 さて、ここまで述べてきたことを集約すると「よい研究を行うための統計そのものの役 割というのは限定されたものである」ということが言いたいわけです。つまり、データが しっかりしていないと統計の方法がどれだけ洗練されたものであっても意味がないという ことです。また、私にとっては「統計は表現の方法である」ということです。データの持 つ大切な情報を自分自身にも他人にも分かりやすくまとめることが統計の役割だと考えて いる訳です。逆に言えば、私は個々の研究における統計のロジックをそのまま信用しては いません。その意味は、例えば、ある特定の研究で用いられている統計的有意性検定の結 果を「まさしく統計的有意性検定の論理の通り」には理解していないということです。ま た、因果関係分析の結果についてもそのままリジットには理解していません。もっと定性 的な意味に落としてふんわり理解しています。例えば、私の研究について、先生もそうさ れていましたよね(「作文能力の育成には、...」)。これは、特に珍しい態度ではな いし、このこと自体は特に問題ではないと思います。統計のロジックとの乖離をどのよう に意識しているかどうかは別にして、心理学の研究者に一般的な態度です。(ただし、そ の際、実際に個々のケースでどのような態度が取られているかということは問題でしょう が、元々の統計の論理に対する無理解が横行しすぎている気もします。)

 私自身、統計の論理をそのまま通用させることにはあまり意味がないどころか、かえっ て大きな弊害があるように思います。それは二つの理由があります。一つは、統計的方法 の前提を厳密に守ろうとすると、実際には何もできなくなると言うことです。例えば、厳 密なランダムサンプリングの方法には大変な労力と費用がかかります。はたして、一般的 な心理学の研究にそれが可能でしょうか?また、それを敢えて強いることが学問的活動の 促進になるでしょうか?二つ目は、ただでさえ、恰好よい統計方法で誤魔化しておけばそ の前の問題設定やデータが杜撰でも通用してしまうような風潮があるような気がしますが、 統計の論理を強調することは、その風潮を押し進めてしまうように思えるのです。私自身 は、多くの人が分かるシンプルな方法で必要な解析ができるのであれば、本当はそれが一 番よいのではないかと思っています。

 いよいよパス解析の問題に戻ります。守先生は3点の議論を挙げておられましたが、 「いろんな方法が取り入れられることはよいことだ」という2点目には賛成です。「検定 力分析が流行してほしい」という3点目には賛成しかねます。所詮、統計手法は統計手法 でしかないと思うからです。1点目が最も大切な議論だと思います。「パス解析は偏回帰 係数であり、基本的には相関関係の強さを表しているだけ」ということは全く正しいと思 います。それを因果関係的に捕らえるのは解釈の問題であり、統計の論理の外側です。し かし、だから「『因果関係を記述できる』かのように記述するのは間違いなのではない か?」という部分にはそれだけでは(原文では下線)一般的には賛成しかねます。この部分の論理は「統計 のロジックを超えた解釈を行ってはならない」と一般化することができ、その論理でいく と、因果関係分析だけには止まらず統計的手法を用いたほとんど全ての研究が壊滅的な打 撃を受けるからです。しかし、先生が仰ったように「まず、因果関係が想定できることを いろいろな根拠に基づいてしっかりと示した上で、想定された因果関係を量的に記述して みるというのがパス解析の使い方だ」ということは大切な指摘であり、この限定条件がつ いたために結論として、この部分は大賛成です。

 実は、私の研究はある点で批判されても仕方がないな、と感じています。しかし、私自 身は、自分の研究の欠点を先生の指摘された点とは少し違った所で考えています。という のは、因果関係のパスの向きについては、時間的な前後で保証されているからです。すな わち、「幼児期の経験」は「学齢期」の前であり、それらはこの実験が行われる以前に起 こっていることだからです。また、モデルの最後の部分(分析的な能力と総合評価)につ いては因果関係の向きを議論することに大きなメリットはないでしょう。また、どのよう な要因をモデルに取り入れるべきか、という話は、モデル構成が結果的にある程度うまく いっている限り、まさに研究者の裁量の問題です。専門的見地からのアドバイスはお受け したとしても、基本的に批判の対象になる話ではないと考えています。では、どこがいけ なかったのでしょうか?

 それは、「データが余りにも安易に取られている」ということです。実は、この研究の 前半部分のデータは凝りに凝っています。課題の選び方、条件の設定、被験者の人数(多 すぎると採点が大変)、採点者の選び方、分析の統計方法等、どれをとっても自分として は一生懸命考え、努力しました。それこそ研究の再現性を求めて同じような研究をしよう と考えられたら、その方は相当苦労なさると思います。ところが、最後のパス解析の変数 に使われたアンケートの項目は寂しい限りです。

 ちょっとだけ舞台裏をお話ししましょう。実は、最初の時点での構想では、「課題や採 点の工夫の仕方で、小論文形式の試験は妥当性も信頼性もある程度は確保できるのだ」と いう実例を示そうと思ったのがこの研究の動機です。論文の中にも書いた通り、特に日本 の心理学的測定論の中での小論文形式の測定に対する扱いは冷たいものがあります。結論 的に言って、信頼性・妥当性がないので実用に耐えないという論調です。しかし、教育現 場ではどうでしょうか。正解の定まった選択式問題形式のみに向かって勉強することの教 育上の弊害は議論されて久しいものです。だからこそ、多大な労苦がかかるにも関わらず、 入学試験で記述式、論述式、小論文形式の問題が導入されているのです。私は「大学入試 センター」という特殊な機関にいますので、この辺の事情は多少分かります。入試という のは本当に労力がかかるものです。実行部隊は大学の教官・教員です。業績評価のポイン トにはなりませんから、ほとんどの人は進んでやりたがりません。ミスがあると泥を被ら なければなりません。うまくやって当たり前、へたなことがあると痛烈な避難があびせら れます。それでも、一部の先生方が献身的な努力をして、少しでも良い方に変えていこう と努力なさっている実情があるのです。これは、実際に入試に携わった経験者以外にはな かなか伝わらないことでしょう。

 こういった事情を考えると、現実的には、この問題に対して「信頼性の問題があるから もうやめろ」という議論は何の価値もありません。それでは、どのようにすれば、少しで も信頼性・妥当性の議論を回避できるでしょうか?これは真正面から取り組むには余りに 大きすぎる課題です。そこで、とりあえずの取っかかりとして、良い実例をだしていくし かない、そう考えたわけです。そこで、一般的には最も信頼性の確保が難しいと考えられ るような性質の課題を選びながら、多肢選択式テストや漢字書き取りテストでは測定でき ないような能力を測定し、そこそこの結論を得ようと試みたわけです。私の研究では、そ の目的にはある程度の成功を収めたと思っています。

 ここで、私は調子に乗りました。付け足しでつけておいたアンケートの分析をやってみ たのです。そうすると、意外にも、非常に面白い結果が得られたではないですか。喜び勇 んでそれを書き加えたという訳です。作文教育という非常に大きな問題に対し、余りにも 簡単なデータで物を申し述べるという無謀な試みに突入してしまったのです。

 ただ、あんな程度のデータであっても、実際には、ある程度の意味はあると思っていま す。例えば、信頼性の観点から言えば、アルファ信頼性係数の文脈では一般的には項目が 多い方が信頼性が高くなりますので、あの項目数では個々の変数の信頼性は心もとない。 しかし、ランダムな誤差は相関関係を低くする方に作用するわけですから、あそこででて いるパスについては、誤差のせいで出現するものではない、ということがモデルの妥当性 の最低限の根拠として心の中にあります。ちょっと話は飛びますが、「○○心理学」と言 った場合、「○○」と「心理学」の関係は様々でしょう。例えば、「基礎心理学」の場合、 「心理(学)の基礎」の研究と解釈ができると思います。「社会心理学」は「社会(=人 間が複数存在する場面)について研究する心理学」でしょうか。では、「教育心理学」は どうでしょうか?私は必ずしも教育心理学の分野で仕事を行って「教育心理学とは何か」 というようなことに関してずっと考えて来た訳ではないので一般論を申し述べるのは大変 おこがましいかもしれません。しかし、少なくとも、私の行う研究は「教育のための心理 学」でありたいと思っています。私の研究の全部が必ずしも実際にそうなってはいないか もしれませんが、様々な教育関連の現場に何らかの形で係わっておられる方に何らかのフ ィードバックできるようなことを研究したい。と常々思ってはいます。ただし、そのフィ ードバックは必ずしも直接的な形でなくともよいとも思っています。

 そういった意味で、自分のデータを用いたパス解析の結果は面白いと思ったのです。ま ず、自分自身が結果にとても納得しました。そこで、これを見て作文教育に関係私手尾ら れる方が何らかのことを思ってくださればよいな、と考えてのです。今のところ「こんな 安易な研究で何がいえるか!」という反発でも仕方がないかな、と思います。できれば 「そうか、書けることが大切だと思っていたが、まず先に子どもを作文好きにすることも 大事なんだ。じゃどうすればいいのだろう?」と考えてくだされば本当にありがたいので す。また、私の方法が安易だから「もう少しキチンとした方法で研究を行ってみよう。」 と考えて下さる研究者がいらっしゃれば、こんなに嬉しいことはありません。実際、今ま でいただいたご意見の中で一番嬉しかったのは、採点者の先生の一人が、「やっぱり課題 の絵の選び方ですね。子どもたちが楽しんで書いていたので採点していて楽しかったです よ。」といった感想をもらしてくれたことです。論文には書けない話ですが。

 パス解析の話と大分外れたところで議論が進んでしまいましたが、流行というのは必然 的に起こってくるものだと思います。たとえ、統計の方法といったようなものでも。私と 私手派、それほど重大に考えなくてもいいのではないかという気がしています。流行はい つか廃れます。逆に言えば、現在流行っている方法はそれだけ共通のものですから、他人 に理解していただくにはメリットがあります。ただし、本当に大切なことは、先生が仰っ ているように、それぞれの方法を使う前にきちんとテーマを考え、データをしっかりと取 り、統計的方法の限界を意識した上で適切な方法を選ぶことではないでしょうか。因果関 係分析の流行は、利用できる統計手法の選択肢が一つ増えただけだと思います。もちろん 「共分散構造分析を使わなければ論文として認められない」といった風潮が出てくれば問 題ですが、現在のところ、そこまでは言っていないように思えるのですが。むしろ、私が 懸念するのは、統計的な方法そのものに対する議論が白熱していくと、もっと大切な部分、 すなわち、研究の意義やデータの収集の構想、データの性質とそれに相応しい分析方法、 といった研究に本質的なことが、ますますおざなりにされていくのではないかということ です。どんな研究でも、その意義の保証は研究全体のテーマ、構成に関わるもので、統計 手法のみに依存するものではないと思います。もっとも、統計の明らかなご用は論外です よね。

 以上がこの問題について私がお話したかったことです。

 最後に、私の研究のスタンスについて、先生の御立場との違いを明らかにしておきたい と思います。先生は、「KR」にも書かれている通り、オーソドックスな実証主義の考え 方に立って、研究の再現性を重要視されているようですね。私もそれは大切なことだと思 いますが、私自身の研究にはその基準を適用していません。それは、できるだけユニーク なデータを取ろうと思っているからです。もちろん、研究形式の上での実証可能性(ある いは、「反証可能性」ということばの方がお好きでしょうか?)は大切にしています。し かし、私自身は、一見凡庸だけれどもなかなか取れないようなデータ、もしかしたら自分 でも二度と取ることができないようなデータを取って、工夫して分析することを楽しみに 感じています。先生ご自身はこのような考え方はどう思われますか?私のスタンスについ て、論文を通じて感じていただければ幸いです。

 思いのほか、つれづれにいろいろなことを書き連ねてしまいました。もし、失礼に当た る段がありましたら、お許しください。個人的な話ですが、「KRベスト論文賞」は励み になります。いつか先生から賞を頂けるような研究をしたいと思います。

 それでは、お忙しいでしょうが、ご自愛ください。それでは、今後とも、よろしくお願 いいたします。

敬具。

(署名)
平 直樹

    


KR第1巻第6号へ戻る
KRホームページ