<目次>
  • はじめに
  • 1 かい人21面相の脅迫状と文体分析
  • 2 筆跡鑑定にかわる「文章の指紋」
  • 3 文学作品と哲学書の著書を推定する
    • Ⅰ シェークスピアは誰か?
    • Ⅱ プラトンの『第七書簡』は贋作か?
    • Ⅲ マーク・トウェインの戦争経験談?
    • Ⅳ 『静かなるドン』をめぐる疑惑
    • Ⅴ 『紅楼夢』は一人の作家が書いたものか
  • 4 聖書と宗教書の著者を推定する
    • Ⅰ 『キリストにならいて』は誰が書いたか
    • Ⅱ 『旧約聖書』の中の「イザヤ書」の著者
    • Ⅲ 『新約聖書』の「パウロの書簡」
  • 5 政治は犯罪の文献をめぐって
    • Ⅰ 英国内閣を攻撃した投書『ジュニアス・レター』
    • Ⅱ 『連邦主義者』の著者の推定
    • Ⅲ パトリシア・ハースト誘拐事件
    • Ⅳ 東京の保険金殺人事件
  • 6 日本古典の謎をめぐって
    • Ⅰ 『源氏物語』の計量分析
    • Ⅱ 日蓮遺文の著者の推定
  • 7 文体の変化とこころの変化
    • Ⅰ 川端康成の文体の変化
    • Ⅱ 日蓮の文体の変化
  • 8 日本語の計量分析の課題と限界
  • おわりに
  • 参考文献


読書日記人気ランキング


文系と理系、文学と科学を二項対立ではなく、文系・文学もまた「人文科学」という「科学」の一種なら、文学に計量分析(テキストマイニング)という統計学的手法を持ち込んだ本書は「人文科学」の書と言えます。


本書で取り上げられている著者や著作物は目次にある通りで、副題にあるシェイクスピアに限った話ではなく、これらの著作物が一体誰の手によるものなのかを計量分析で解き明かそうという試みです。


一般的には筆跡により筆者を推定する筆跡鑑定を用いるのですが、それは直筆の原稿が残っている場合のみ。古い著作物では残されているものの多くは写本です。筆跡鑑定による著者推定ができません。そこで計量分析です。


使っている品詞、使っている単語、単語の長さ、一文の長さ、句読点の位置を統計的に処理し、同時代の別の人物との比較、同一著作物内での比較から、本当の著作者、著作者複数人説を割り出していきます。


ただし、本書で取り上げられている多くのケースでは、著作者が厳密に誰かを特定するまでには至っていません。たとえばシェイクスピアの場合、フランシス・ベーコン、クリストファー・マーロウなどの説がありますが、特定までは至っていません。中国の五大奇書(本書では『金瓶梅』を省き四大奇書としている)の一つ『紅楼夢』では、1回~80回と81~120回では著者が違うのではないかと言われていますが、二つを分析すると、虚詞(助詞、前置詞、感嘆詞のように単独では意味をなさない品詞)の傾向が全く異なることが分かっています。



また、我が日本の『源氏物語』も、全54巻中45巻以降の10巻(通称『宇治十帖』)は古くより文体が違う、作者が違うのではないかという指摘があります。実際、助詞・助動詞の使い方に異なる傾向があります。『宇治十帖』は、紫式部の娘の大弐三位の作品という説もあるようですが、同一人物ながら途中で文体が変わる可能性も否定できません。『源氏物語』を現代語に訳した瀬戸内寂静は、自身が出家した経験から、紫式部も途中で出家し心の有り様が変わり文体にも影響が出たのではないかと推察します。


著作者を特定できずになかなか煮え切らない部分も多いのですが、本書には計量分析が有効利用できた例が1つありました。2001年に発生した保険金目当てのひき逃げ事件です。共済金(保険金)の手続きをした被害者兄が捜査線上に浮かびます。


  1. ワープロ打ちされた匿名の目撃情報
  2. ワープロ打ちされた犯人からの匿名の告白兼遺書
  3. 兄が警察に提出した上申書
  4. 兄が共済金請求に対する生協からの質問に対する回答書
  5. 兄と同年齢10人の文章


助詞の頻度、助詞と助詞の組合せパターン、読点の位置について、この5つを比較してクラスター分析をしたところ、目撃情報・遺書・上申書・回答書の4つが同一クラスターを形成し、他の10人の文章とは明らかに異なる結果が得られ、犯人逮捕へと繋がりました。目撃情報と犯人の遺書を捏造することで、事件の迷宮入りを狙ったわけです。


さて、私もブログにて駄文を書き連ねています。私自身の文体の傾向とやらもぜひ調べたいのですが・・・・ここまで書き残してしまうと、匿名の犯行声明を出すことがもはやできなくなりました。


なお、日本語の文献の計量分析には注意点が必要です。ヨーロッパ言語と異なり日本語では、分かち書きがされておらず、単語の区切りが明示的ではありません。また、漢字仮名交じり文で表記するため、写本の間に漢字から仮名に変換されたり、送り仮名を変更されたりというケースもあります。この揺らぎを吸収するデータクレンジング作業が必要になります。


読書日記人気ランキング



↓↓参考になったらクリック願います↓↓
ブログランキング・にほんブログ村へ
にほんブログ村