過去ログ一覧前回


2025年05月25日(日) 書いたのはあなたですか、それともAIですか

高校には「総合的な探究の時間」という必修科目がある。
自分で選んだ課題について調査研究を行い、まとめたものを発表する探究学習である。三月に論文の最終提出があったのだが、それが昨日返ってきたらしい。
「すごくよくできてたって言われたよ」
と娘が言う。
仮説を証明するための方法を一緒に考えたり、実験がうまくいかずやり直したりしたのを思い出した。娘が目指している職業に関連する内容だから、それは熱心に取り組んでいた。これほど長い文章を書くのは初めてだから、論文の執筆には四苦八苦していたっけ。
よかったね、あれだけ一生懸命やったもんねえ。
……が、先生がその褒め言葉の後、「ほんとに自分でやったの?」と言ったと聞いて引っかかった。
どういう意味だろう。この子にしては出来がよすぎる、宿題代行サービスを利用したんじゃないかと思われたのかしら。

この話を同僚にしたところ、「それを言うなら、AIが書いたと思われたんじゃないの」と彼女。
あ、なるほど、生成AIか。そういえば、AI検出ツールを使って卒論や就活のエントリーシートをチェックする大学や企業があるという話を聞いたことがある。それを生成AIに丸投げする学生が増えているそうだ。
看護学生時代、web上の文章を丸写ししたレポートがバレて留年した同級生がいる。娘にはその話をし、「コピペはぜったいだめ。それはパクリだよ」と口酸っぱく言ったが、生成AIのことはまったく頭になかった。大丈夫でしょうねえ……?
と言ったら、怒られてしまった。冗談だってば。

ところで、そのAI検出ツールとやらは本当に信頼できるものなんだろうか。
人間が書いたのか、AIが書いたのかを見分ける目的で使われているのに、誤判定があるとしたら問題である。そのせいで単位をもらえなかったり面接に進めなかったりしたら、たまったものではない。
そこで、その精度を検証してみた。七つのAI検出ツールに前回のテキスト「女子高生のスカート丈についての一考察」を判定してもらったら、こんな結果になった。

パーセンテージは、テキスト中にAIによって書かれた部分がどのくらいあるとみられるかではなく、そのテキスト自体がAI生成文である可能性の大きさを示している。
五つのツールは正しく判定してくれたが、Smodinは47%、GPTZeroは93%の確率でAIによって書かれたとみているらしい。どちらのツールも精度99%と謳っているのに。
公式サイトを見るとSmodinは三万、GPTZeroは三千五百の大学や学校で活用されているとあり、怖いことだと思った。
「AI判定結果だけで処罰しないでください。口頭試問やヒアリングなどと併用し、総合的に判断することを推奨します」
「検出精度は完璧ではありません。結果はあくまで参考情報として扱いましょう」
と注意書きされてはいるが、中には精度99%を真に受けて「不正を行った」とみなす教員もいるかもしれない。
実際、苦労して書いたレポートや論文が誤判定されることを恐れて事前にツールでチェックする学生もいるという。「AIっぽい」と指摘された箇所があると、文章を“人間化”する機能を使って修正するのだそうだ。
バカバカしい。自分で書いたのなら堂々と提出すればいいに決まっている。
とはいえ、もし受け取ってもらえなかったら落単……と不安になる気持ちはわからないではない。

いまの時代、「このテキストは自分が作成した」という証拠を残しておかなくてはならないのだな。あらぬ疑いをかけられたとき、潔白を証明できるように。
プロットをしっかり立てる。参考文献はページ番号も書く。積極的に教員の指導を受け、執筆途中の文章を見てもらう……とか。
娘の論文、もちろんAI判定なんてしていない。プレゼンもがんばれと伝えよう。
(なお、GPTZeroは今日のテキストも「80%の確率でAI生成」と判定しました)

【あとがき】
以前、AIでどの程度リアルな人間の顔が作れるものかなとAI画像生成アプリを試したことがあるけれど、文章を作成したことはありませんでした。
今回、自分の書いたテキストと比べてみようと思い、「女子高生のスカート丈の変遷について書いてください」と指示したところ、ほんの数秒で1050字の文章が出力されました。ぱっと見、おかしなところはない文章。個人的なエピソードは一切ない情報の羅列だから、娯楽で読む文章(ブログの記事)としては使えませんが、とりあえず出せばいいというレポート課題だったらこのまま使おうとする人もいるでしょう。
けどなあ。こんなラクを覚えてしまったら、自分で調べて考えて文章を組み立てて……なんて面倒なこと、できなくなるね。