今日,我々は書籍,メディア,インターネットを通じて多くの情報を得ることができるが, 同時に世の中には信頼性が保証されていない情報も蔓延している.そのような状況にも関わらず,信頼性を確認する有効なシステムは存在しない.そこで本プロジェクトでは,不確かな知識の信頼性の判断支援を行うシステムを提案した.提案システムでは自然言語形式で入力された知識の信頼性を判断するための情報を Web 情報の集約によって提示する.提示する信頼性判断情報は Web における知識の認知度に基づくものであり,「肯定/否定の印象分布」「情報ソースの分布」から分析によって生成される.さらにこれらの分析結果は時間と共に変化すると考えられるため,時間的要素を考慮して Web 情報を集約し信頼性判断情報を提示する仕組みに開発した.
不確かな知識の信頼性判断の支援を行う「ほんと?サーチ」
―「ほんと?」かどうかの材料を拾ってきます―
by 山本祐輔
https://www.ipa.go.jp/files/000006891.pdf
**
ほんと?サーチ:
http://hontolab.org/product/honto/
目的
ある知識の真偽について調べたいとき,Web を用いてそれを調べることは広く行われている.例えば,最近社会問題にもなった「あるある大辞典の番組捏造騒動」における「納豆はダイエットに効果的」という知識の真偽をWeb を使って調べるとき,ユーザは次のような手順を踏むと考えられる.
1. Yahoo!,Google といった Web 検索エンジンに「納豆 and ダイエット and 効果的」といったキーワードを入力する.
2.検索エンジンが返す検索結果ページを適当に閲覧し,ページ間で比較し同じことが言われているかを確認する.
3. ほとんどのページで「納豆はダイエットに効果的である」ということが言われていればおそらく正しいだろうと判断する,そうでなければ正しくないだろうと判断する
ユーザの多くはその知識に関するキーワードを Web 検索エンジンに入力し,その知識に関するページの数を調べたり,その知識に関して信頼のおける Web ページを探そうと試みる.これは個々のページの信頼性が低いという Web の欠点を補うためである.以上のような作業はページを何度も比較しなければならず非常に労力がかかる.さらにはこの方法で判断を行うためには Web 上の多数のページを比較することが求められるにも関わらず,ユーザはその負担の大きさからおそらく検索結果の上位数件を見るにとどまるだろう. そもそも「納豆はダイエットに効果的」かどうかを知りたいだけにも関わらず、多数のページの内容を他のページと比較するというのは,無駄の多い作業である.既存の Web 検索エンジンはあくまで詳しい情報を調べるためのものであり,このような真偽を確かめるためには適していない.さらに現状では信頼性を確かめるためのサービス/システムは実用に耐えられるものは存在しない
(sk)
「ほとんどのページで「納豆はダイエットに効果的である」ということが言われていればおそらく正しいだろうと判断する,そうでなければ正しくないだろうと判断する」というのが、とても気になる。
「赤信号、みんなで渡れば怖くない」と同じ。
みんなが原発は安全だと言えば原発は安全だと言い、みんなが危険だと言えば危険だと言う。
みんなが敵国はけしからんと言えば戦争に賛成で、みんなが平和を守ろうと言えば戦争反対。
そんなこと、つまりみんなに同調することが「知識の真偽について調べる」ことなのだとしたら、知識ってなんて悲しいものだろう。
知識というものは、同調するものではない。むしろ、逆でなければならない。
**
そもそもこの文章を書いた人は、情報とか知識について明確な認識を持っているのだろうか。文章の中に情報という言葉と知識という言葉がたくさん出てくるけれど、情報がなにを意味し、知識がなにを意味するのかは明確ではない。少なくとも読み手には、それぞれの意味は明確には伝わってこない。
情報技術はいろいろなことをもたらすけれど、目的のおかしいもの、カネさえ儲けられればそれでいいじゃんみたいなものがたくさんあって、「えっ」と思うものは意外と多い。それでもそんなものの多くがそこそこ認められ、「えっ」と思うものを作った人が大金持ちになったりする。
それでいいのだけれど、なにか釈然としない。