(立ち読み)3.2 一次データ


第3章 検索、入力、処理、出力
3.2 インプット
3.2.2 一次データ   (p. 182)


一次データ(Primary data)については、いろいろな思いがある。もっとも、その思いのほとんどは、「一次データでなければ、データとは認めない」というようなことを口にする一次データ至上主義の人への思い。一次データにはなんの恨みもない。

もうずいぶん前、ひとりの統計の専門家(statistician)と仕事をした。一次データ至上主義の人だった。頑固で、自分のことしか信じない。その人が私のところにデータを持ってきて、報告書のなかに入れるテーブルやグラフを作ってくれと言ったのだ。

データはライン川の水質。私はその人のデータを見てぶっとんだ。調査地点が毎回違うのだ。理由を聞くと、行くたびに川の様子が変わっていて、同じ場所で調査をすることができなかったのだという。護岸工事がされていたり、道路ができたりで、川辺に行きたくても行けないなどということもあったという。

調査のタイミングもばらばら。「その年はモロッコにバカンスに行ったのでドイツには行けなかった」、「その年は確か離婚調停中で水質どころではなかった」、「その年は新しい恋人と新居を探すので忙しくて」。その結果、2年続けて調査が行われたかと思うと、3年ものあいだ調査がなかったりする。

それではテーブルもグラフもできないと思った私は、あちらこちらに連絡し、知り合いのおかげもあって、とてもいいデータを手に入れた。

その人に私が手に入れたデータを見せたところ、なんと激怒。喜んでもらえると思った私はその反応を見てびっくりし、馬鹿馬鹿しいことだが反射的に謝ってしまった。

そのあとすぐ、私はその仕事から手を引いたのだが、出来上がった報告書を見て、もう一度びっくり。テーブルもグラフもなかったけれど、その代わりに地図があり、調査地点にはマークが、マークの脇にはデータがちゃんと記されていたのだ。

あまり良い思い出ではない。が、その後も、いろいろなタイプの一次データ至上主義の人に出会い、その度にあまり良くない思い出を重ねた。

一次データ至上主義の人は皆、自分で歩き回って得たデータでなければダメだとか、自分で実験して得たデータでなければ使ってはいけないとか、いろいろとうるさいことを言う。

自分で設定した目的、自分で編み出した方法、自分自身で得たデータ。まるで小学校の宿題のようで、少しも楽しくない。おまけに、自分、自分、自分。誰かのデータを使おうものなら、「けしからん」と言う。できれば避けて通りたい。

歴史の分野も似たようなものらしい。一次史料至上主義の人がいるらしく、金子拓は「一次史料至上主義は良くない」とはっきり書いている。そういうことが言える人は珍しいし、素晴らしい。

史料が出来上がるとき、人間の記憶がどのように作用したかを考えると、疑う必要がないとされた一次史料もあやういことがある。そんなことも書く。また、二次史料には二次史料の機能があり、偽文書にさえ機能があるとも書いている。

金子拓の一次史料についての考えを、そのまま情報の分野に当てはめ、一次データもあやういことがあると書いてみて、ひとり笑った。二次データには二次テータの機能があり、偽データにも機能があるのだ。一次データなら良くて、二次データはだめ。そんなことを言う人に限って、本質は見ていない。