読書日記人気ランキング


今年出版された話題の図書です。著者の新井紀子さんは国立情報学研究所の教授で人工知能の専門家。2016年まで「ロボットは東大に入れるか。Todai Robot Project」の指揮をされていました。そのお題となった本も読んでいます。



結論から言うと、東大はロボットには入れません。暗記科目の日本史や世界史などは得意ですが、もちろん国語は苦手です。また、コンピュータなんだから、数学や物理が得意と思いきや、計算式なら問題ないのですが、図形認識や指示代名詞が認識できないため、トータルでは人間に勝てません。



では、どのあたりの大学なら人工知能が合格できるかというと、『AI vs. 教科書が読めない子どもたち』の帯にあるとおり、MARCH、明治・青山学院・立教・中央・法政クラスです。


さて、通勤中の電車内広告で、この問題を見ました。


中高生は文章を読めているのか?


「メジャーリーグの選手のうち28%はアメリカ合衆国以外の出身の選手であるが、その出身国を見ると、ドミニカ共和国が最も多くおよそ35%である」


人工知能は読めるのに人間が誤読する、という例で挙げているのだと思うのですが、はて、人工知能は読めるんだっけ?というのが引っ掛かりました。問題箇所は「その」の指示代名詞の部分です。


仕事上、現在、私は自然言語処理に携わっています。自然言語処理が苦手とする問題の一つが指示代名詞です。指示代名詞が何を指しているか、実は明示的なようで曖昧なケースが多い。この「メジャーリーグ~」の問題も、「その出身国」が何にかかっているのかが直感的に分かりづらいです。「読めば分かるだろう」というのは確かにそのとおりなのですが、日本語としては美しくない。人工知能が理解できるようにチューニングをすることができたとしても、別のパターンの指示代名詞を誤読する可能性が大いにあります。曖昧な係り受け構造の別の例を見てみます。


「おバカな私の妹」


これは私の長女が四女に向けて放った言葉です。バカなのは私なのか妹なのかが曖昧です。


言葉というのは、思ったよりも曖昧なまま使っているわけです。人間同士でも誤読・誤解しながら、それでもその時々の状況に応じて判断して使い分けています。その判断基準も、相対する人間が誰なのか、どういう背景の持ち主なのかによっても変わってきます。


人工知能は、杓子定規に応対できたとしても、相手の人間の曖昧な表現をうまく咀嚼しながら誰に対してもスマートに美しく応答するというのは、まだまだ至難の業です。これは、テクノロジーの問題というよりもむしろ、言語学の問題です。


読書日記人気ランキング



↓↓参考になったらクリック願います↓↓
ブログランキング・にほんブログ村へ
にほんブログ村