報酬と評価の軸
10年くらい前に、インターネット上のテキストで読んだ話に「コンピュータゲームと子どもの教育について」の話題がありました。
教育をするにあたって「いったい何回言ったらわかるの!」としばしば口にしたくなりますが、教育研究者の見解では200回から300回くらい、なのだそうです。
ヒトは、その回数繰り返す前に「飽きる」わけです。
一方、コンピュータは飽きません。場合によっては、回数を繰り返した場合、別の挙動をとる、というようなプログラムが仕込まれていることもあるのかもしれませんが、それはもともとの設定であって、同じ入力に対して同じ出力をかえす、ということを指定されていれば、そこから勝手に変動することがない、というのがコンピュータの特徴です。
ゲームの設定になると、「適切な形で難易度が上がっていく」というデザインが有効です。よいゲームは、たいてい、こうした難易度設定が上手になっているのだ、という話でした。
このあたりの難易度設定は、いつも難しい話になります。
行動心理学という領域の方々は、ハトにエサを与える、という報酬を使って、計算をさせたり、あるいは絵を選ばせたり、ということをやっています。
最初から計算ができるわけではなくて、まず第一歩は、「スクリーンをつついたら報酬」というところなのだそうです。
このように、小さな成果を積み重ねつつ、いずれは絵を呈示しては、その絵のどちらかを選んでもらう、というような難しい行動まで誘導していくわけです。
ただし、この「小さいステップを積み重ねる」という方法なのですが、状況によって、小さいステップに分割できないもの、もあったりします。
このあたりが難しい。
また、どんな報酬をどんな形で与えるのか、という部分にもいろいろと問題が隠れています。
完全に飼育しているネズミやハト、あるいはチンパンジーなどであれば、そりゃ、エサを報酬として呈示することは有効でしょうが、ヒトは、かならずしも単一の教育プログラム以外は無刺激な世界に生きている、ということはありません。
むしろ様々な刺激と誘惑に日々巻き込まれつつ生活しているわけです。
そうすると、「報酬を与えてくれる存在」も複雑な社会の中で、多様になります。
あちらの報酬をこちらに持っていくと、別の形の報酬を与えてくれる、なんてことだってしばしばあります。
報酬を与えるシステムの全てが、対象の教育をめざしているわけでもありません。
また、報酬をデザインした人たちが、報酬を与えるシステムで用いているパラメータが、適切なものであるかどうか、ということも考える必要があります。
スマホのゲームで、Pokemon GOというものがあります。これはスマホを持って、しっかり歩いて移動することを目的としたデザインになっていますが、一部の方が「家の中のプラレールに載せて、移動したように見せかける」などという「ハッキング」をしたという話があります。
最低限の労力で、最大限、報酬を得ようとすると、ヒトは最適化しますが、この最適化が、本来の意図とは違った形になることだってあります。
企業の中で、成果をあげたひとを評価する、という制度が作られたこともしばしばあります。ある程度はこうした成果を給与などに反映させるシステムも有効なところがありそうですが、これを全面に押し出すと、評価される成果ばかりを行うようになり、評価されない地味な仕事を馬鹿にしたり、見向きもしなくなったりします。
転医してきた患者さんの話をじっくり聞く、ということを信条にされていたある先生が、あまりに一生懸命にその患者さんの「前医の悪口」を聞いた結果、患者さんが、来院するたびに、他所の医院の悪口を言うようになった、という話もありました。
これも「話を聞いてもらえる」という「報酬」が、たまたま「他の医院の悪口」を言っていた時に発動した結果、発生した「誤った学習」です。
報酬をどのようにデザインするのか、という話に、ひとつ、師匠から聞いたエピソードがあります。
とある知的障害の子どもたちの指導をしているその施設で、適切な行動ができたら、「おにぎりせんべい」を与える、という形の報酬をだしているケースがありました。
https://www.masuya.co.jp/sp-onisen-syoyu より画像をお借りしました いっけん、この報酬システムで、その子は行動を学習した…かのように見えましたが、しばらくしてから、問題が発生しました。
指導員が観察していて、おにぎりせんべいを供給できる、という状況では学習した行動が発揮されるのですが、指導員が居ない、あるいは見ていない場所では、せっかく学習した行動をとらないようになったのです。
これを見て、指導員のスーパーバイザーは、報酬の制度を変更するように、と提案しました。おにぎりせんべいを1枚…ではなくて、半分に減らそう、というのです。
単純に報酬を減らす、ということではありません。指導員がおにぎりせんべいを半分に割り、半分はその子どもが食べるように、残りの半分は指導員自身が食べるようにしたのです。そして、一緒に食べて、美味しいね!というのを共有するように、というのが骨子でした。
…この「報酬の変更」によって、行動が他人の喜びに繋がっている、ということを、なんらかの形で受け取ることができたその子は、徐々に、指導員が見ていないところでも学習した行動を取るようになった、ということです。
評価の軸を、自らの裡に取り込むことができたなら、自分自身で「よし」と出来る。最初は他人からの評価だけであっても、いずれは、こうして自分の軸で自分を認めることが出来るようになっていく、というところが、とても示唆的だと思ったのでした。
他人の評価は、教育的な効果を考えていないものも多いですから、これに引っ張られてばかりだと迷走します。
できるだけ、自分自身の中に、自分の評価軸を作っていただきたいところです。