生成AIを使いこなすには読解力の土台が必要である理由 【シン読解力①】

生成AIの台頭によってさらに人間の読解力が重要になってくるのではないかという主張をされている方の本。

生成AI時代に必要な読解力を説く本『シン読解力』の表紙

よく話が通じない人や仕事ができない人などと関わった際にある違和感が、読解力がないとこうなるのかと腑に落ちた。
読めばわかることを読めないというのは、なかなか周りもどうしたらいいか分からないし本人も大変だよなぁとか思ったりしましたね。
この本を読めば自分が読解力があるのか、生成AIを使いこなせるのかがわかるのではないかと思います。

というわけで面白かったポイントをまとめていこうぞ!

文章を正確に読むということ

  • 読解力は読書するだけでは上がらない
    • おそらくフィードバックやアウトプットがないと読んだだけで終わってしまうから
  • 文章を正しく読むためには型を正しく認識できねばならない
  • 教科書を正確に読むことができずに成績を落としてしまう子が多い
    • それぞれの教科の読み方の型を知らないがゆえに我流になってしまっている
読んだかどうかではなくどれだけ理解できたかを確認しないとそら読んだだけで終わっちまうわな。

生成AIについて

  • 生成AIの欠点、ハルシネーション
    • 生成AIは流暢で自然な文章を作り出せるが、嘘をつくこともある
    • 既存のAIは機械的な文章だが嘘は書かない
      • データにあるものだけを出力する
  • 生成AIの元々の主眼は自然な言語生成であり、正確な情報を提供することではないので仕方ない部分ではある
  • 生成AIが人間を超えるにはまだまだデータ不足
    • 政治、経済、子育て、介護などなど何が正解なのかまだまだ不明確
    • AIは外れ値を扱うのが不得意
      • ありきたりなことには対応できるが、たまにしか起きないまれなことには対応できない
  • 教師データが少ない、または外れ値によって大きな影響を受ける分野ではまだ生成AIも活躍できない

文章の正しさを機械に教えるのは難しい

  • 私はおがです。
    • この分が正しいかどうかは書いた人、いった人、つまり文脈に依存する
  • 本当に正しいと言えるのは事実関係に関するもののみ
    • 日本の首都は東京である。
    • これは文脈に依存せず正しいこと
  • 正しい文章だけを教師データに用いると、自然な日本語は作り出されないがゆえに、正しさは一旦無視して文章の自然な流れを学習させている
    • これであればネット上にある無数の文章を教師データとして使うことができる

生成AIの学習の仕方

入力の次の語彙が出てくる確率を計算することで流暢な言語を生成する。
 

入力

正解

私は

映画

私は映画

私は映画を

観に

私は映画を観に

行き

私は映画を観に行き

ました


生成AIの欠点をカバーするRAG

  • RAG(Retrieval-Augmented Generation)
    • 検索フェーズと文書生成フェーズに分けて事実に即した文章を作る
  • これで既存の文書化されているものに関しては嘘をつく確率は減る
  • 逆に言えば明文化されていないようなことはまだまだ人間が勝る
  • ハルシネーションは根本的に無くならない

生成AIを用いるには読解力が不可欠

  • ハルシネーションの問題がある限り、生成AIの出力をファクトチェックする必要がある
  • プログラムを生成させようと、エラーが出たり細かい修正をしたければ、その内容を理解し伝えることができなければ使いこなせない
  • 自分が理解できる作業でない限りは質を担保できない

チャットGPTをはじめ、あらゆる生成AIは、使い手の真の能力を超えることはできません。呼吸するようにウソをつきますし、著作権侵害も起こします。それをチェックし、生成AIと対話しながら、より適切な出力になるようにコントロールするスキルが求められます。

まとめ

  • 大人でも読めばわかる文章を読めない人が案外いる
  • 生成AIは自然な文章を作り出すのが主目的であり、正しさは二の次にされているので人が正しさを判断しなければいけない
  • 生成AIでできることは本人の能力を超えない

続きはまた次回!


コメント