SVX日記
2005-02-15(Tue) 小論文を機械採点してみる
深夜までヤボ文書を作成していたため、今日はお休み……のつもりだったが、明日(?)スラッシュドットジャパンで面白い記事を見つけたので、サカノボリ更新である。その記事とは小論文自動採点システムの開発というモノ。なんでも、入試問題の小論文なんかを自動採点するシステムだそうだ。
バラしてしまうが、上記のヤボ文書とはいわゆる中途入社の自己PRの文書だったりする。そんなに肩にリキ入れまくりというわけではないのだが、ちょっと面白そうな仕事が見つかったんで、職務内容を聞いてホントに面白そうなら行ってみようかなぁ、というライト感覚で受けてみているのだ。採用担当者がコレ読んだら怒るかもしれんが……それ以前にオイラの歳でこんなフラフラした認識でいいだろうか……ま、いいや。
ちなみに設問は2問。一昨日から今日にかけチマチマ文章をまとめ、明日(2月16日)の朝に印刷、昼には封書で送ってしまっており、上記記事を発見したのは午前中のため、自動採点システムを通して修正を繰り返したりはできなかった。まぁ、自動採点システムに気に入られるように文章を直すつもりもサラサラないのだが。
残念なコトに、書いた文書をココで公開することはできないが(落ちたのが確定したら出すか!?)、評価結果を出すコトは問題ないだろう。以下は、設問1に対して自動採点システムを適用した結果、得られた評価である。
■修辞 2.7 ( 5 ) 文が総じて(平均的に)少し長いです。 長すぎる文があります。 句(読点と読点の間、あるいは読点と句点の間)の長すぎる文があります。 句の中の文節の数が多すぎる文があります。 漢字がやや必要以上に使われているように見受けられます。 埋め込み文が全体の分量に比べて多いように見受けられます。 連用形や接続助詞の句の並びの多い文が、ややあるように見受けられます。 受動態の文が全体の分量に比べて多いように見受けられます。 ■論理 2.0 ( 2 ) ■内容 1.7 ( 3 ) 質問文との関係がやや希薄であるように見受けられます。 ■最終得点 6.4 ( 10 )
むぅ、要約すると「文が長くて複雑」しかも「質問に答えとらん」という評価か。うぐぐぅ。長くて複雑な文を書きがちなのは自覚しているが、漢字も多いですか。がっくり。設問1に関しては結構うまく書けたと思ったのだがなぁ。とはいえ、論理には問題がないんですね。そうですか。んじゃ、設問2はどうかな。
■修辞 4.2 ( 5 ) 文が総じて(平均的に)少し長いです。 長すぎる文があります。 連用形や接続助詞の句の並びの多い文が、幾つかあるように見受けられます。 ■論理 2.0 ( 2 ) ■内容 1.1 ( 3 ) 質問文との関係が希薄であるように見受けられます。 ■最終得点 7.3 ( 10 )
修辞については同じ傾向の指摘を受けつつも、かなり点数アップ。逆に内容については点数ダウンである。確かに書いていてチト内容が薄いなぁ、と思ってたんだよな。実際、オイラにとって書きづらいテーマだったんだよね。書きづらいほうが内容が薄くなって、その分だけ修辞の評価が上がるというコトはあるんかなぁ。
んじゃ、いつものオイラのお調子フルパワーで書きなぐったこのブログの文章はどうだろうか? 小論文っぽい文章は、と……お!? 11日の「死蔵されるメディアは老後の愉しみとなりうるか」なんて小論文っぽいじゃん。タイトルをそのまま質問文に設定し、解答文に本文の前半部分「……その筋は永遠に不滅なのである。」までをコピペして、いざ採点!!
■修辞 3.8 ( 5 ) 漢字の使用が少ないように見受けられます。 埋め込み文が全体の分量に比べてやや多いように見受けられます。 連用形や接続助詞の句の並びの多い文が、ややあるように見受けられます。 長くて難しい語がやや少ないように見受けられます。 ■論理 2.0 ( 2 ) ■内容 0.9 ( 3 ) 質問文との関係が希薄であるように見受けられます。 ■最終得点 6.7 ( 10 )
あれ!? 修辞の指摘傾向が変わったぞ!? 相変わらず文の複雑さは指摘されるものの、長さには問題がないときた。しかし「漢字も長くて難しい語も少ない」って……それは平易な文章になっているってコトじゃん、減点すんなよな。しかし、内容は最低点……ま、質問文が「死蔵されるメディアは老後の愉しみとなりうるか」なんて、そもそも設問としてワケわかんないからな。あははは。
……と、いうこと。いま思い出しても、あのゲームの着眼点の良さには敬服する。もともと女の子との会話は、適当に話題を振り撒いて、興味がありそうならその話題にガーッと乗り、興味がなさそうならサッと引く、というのが基本だ(よな?)。当時のPCでもそれなりに雰囲気を再現できていたが、現在の技術を使ってナンパ会話を評価するシステムを取り入れたらもっと面白くなるはずである(TOKYOナンパストリートについてはココが詳しい)。
■ノリ 2.8 ( 4 ) 長くて難しい語が多いように見受けられます。 長くヒッパリすぎの話題があります。 理屈っぽい話題がやや多いように見受けられます。 話題間のつながりがやや悪いように見受けられます。 ■ウケ 2.3 ( 3 ) ボケが総じて(平均的に)少しシツコいです。 単位時間当たりのギャグが少ないように見受けられます。 ノリツッコミを多用しすぎるように見受けられます。 自虐の使用が少ないように見受けられます。 ■キキ 1.8 ( 3 ) ツッコミが厳しすぎるように見受けられます。 話を聞く時間が全体の会話時間に比べてやや少ないように見受けられます。 ■最終得点 6.9 ( 10 )