【学習と条件づけ】道具的条件づけ（オペラント条件づけ）

古典的条件づけは、刺激により誘発される反応、事象間の関係についての学習からなっているのに対し、道具的条件づけ（オペラント条件づけ）は自発的な行動（反応）とそれらの結果との関係についての学習からなっている。

つまり、古典的条件づけの「環境の刺激が行動に影響を及ぼし学習する」というものではなく「行動はそれらが環境に影響を及ぼすから学習される」と捉えるものになる。例えば、動物に芸を仕込んだりする場合などにも道具的条件づけが用いられることが多い。

この道具的条件づけの研究は、１９世紀末E.L.ソーンダイク（Thorndike,1898）がネコを対象に初めて実験を行った。その後２０世紀半ば、バラス・フレデリック・スキナー（B.F.Skinner）により、ラットやハトを対象とする実験的研究が行われ発展していった。

E.L.ソーンダイク（Thorndike)の実験

ソーン・ダイクの古典的実験では、空腹状態にあるネコが対象に行われた。実験では、簡単な掛け金でしっかりと閉じられた檻の箱にネコを入れ、エサがその檻箱の外側に置かれた。最初ネコは、檻の隙間から前脚を伸ばすなどし餌を獲ろうとするが失敗をする。するとネコは箱の中を動き回るなど様々な行動をするようになった。

その中のある行動が、偶然掛け金にあたり扉が開きネコは解放されエサにありつけた。その後ネコ檻の中に戻し、同様にエサを外側に置いた。ネコは、以前のように様々な行動を試みて、掛け金にあたるまでの一連の行動を大まかに繰り返した。

このような手順で何度か繰り返されると、次第にネコは無関係な行動をしないようになり、すぐに掛け金を外して檻から出られるようになり、エサを得るために掛け金を外すことを学習したのである。

ソーンダイクによれば、これらは一見ネコが知的であるように、また洞察力をもっているように見えるが、動物は洞察（insight:状況の理解や問題解決に導くこと)の発達によって学習するのではなく、むしろ試行錯誤によって学習すると考えた。

そして、その試行錯誤学習（trial-and-error learning）の過程でのある行動の直後に報酬が伴うと、その行動は強められる。その行動を強める作用を称して効果の法則（law of wffect）と呼んだ。

また、ソーンダイクは道具的条件づけにおける効果の法則とは、任意の一群の行動の中から肯定的な後続結果を伴うような反応だけを選択することであると主張した。

スキナーの実験では、空腹状態のラットやハトが主に対象でオペラント箱（スキナー箱）と呼ばれる箱を用いて実験がなされた。箱内にはレバーがあり、その下には食物の受け皿が取り付けられ、レバーの上には実験者の判断で点灯できる小さなライトが付けられている。

中に入れられたラットは、うろうろと動き回り探索をはじめ、レバーを偶然押したりする。このラットが最初にレバーを押す度合いをベースラインの水準にし、それが確定したら給餌装置を作動させ、その後、今度はラットがレバーを押すごとに食物片が受け皿に与えられた。

するとラットは食物片を食べると、すぐまたレバーを押し始めた。すなわちその食物片は、レバー押しを強化（reinforce-ment）させるものなので、その後はレバー押しの生起率は劇的に増加する。これは古典的条件づけでの獲得段階と同じである。

その後、給餌装置を止めレバーを押しても食物が供給されないとレバー押しの生起率が減少する。これもまた古典的条件づけでの反応がそうであるように、消去(extinction)を経験する。

このように道具的条件づけは、行動に強化子（食物や水などのような物）が後続することによって、反応の生起確率を増加させ、また一定の時間間隔の間に生じる反応が頻繁であればあるほど学習は増大する。