ここまで「ABA自閉症療育の基礎」の章では偏食指導について扱ってきました。
偏食指導の前は言葉、話すことをどう教えて行くか?ということをテーマに扱い、
何ページにも分けた長編を2編お届けしてきたのですが、今回は本章の単編です。
今回はABAの基本、オペラント条件付けについてのブログページをご紹介します。
今回特に伝えたいのは本ブログページで最後の項で書いている強化子の強さ、強化について私自身の考えです
おさらいも含め、前置きが長くなってしまいますが、強化子についての理解を深めるために大切だなと思うことも詰め込みましたので是非最後までお付き合いください
まずは最初に「強化子」の定義から!
強化子の定義
強化子とは行動に伴う結果であり、その結果が伴ったときに行動がそののち、増加すればその結果は強化子と呼ばれる
ーーーーーー
上の内容が教科書的な強化子の定義になるかと思います。
行動が生じるとき、基本的には行動が生じるきっかけがあることが普通です。
このことを先行状況と呼ぶのですが、
例えば、
お腹が空いたとき、家の戸棚にお菓子がしまってある(先行状況) → 戸棚を開ける(行動) → お菓子をGETしてお腹が少し満たされる(結果)
という関係性が成り立ち、
こののち、「お腹が空いたとき、家の戸棚にお菓子がしまってある(先行状況)」で「戸棚を開ける(行動)」が増加したとき、「お菓子をGETしてお腹が少し満たされる(結果)」という結果は行動を強化する(強める)結果となります。
そしてこのような先行状況ー行動ー結果の3つの関係を示したものをABAでは「三項随伴性(さんこいうずいはんせい)」と呼びぶのですが、
「先行状況」は「弁別刺激」と「確立操作」に分けて考えることができるため、
実際には「弁別刺激」、「確立操作」に続く「行動」、そして「結果」によってオペラント行動を説明、分析、制御しようとする理論がオペラント条件付けの理論です。
下のイラストをご覧ください。
このとき「結果」によってそののち、行動が著しく減少・消失すればそれは強化ではなく「罰(ばつ)」と呼ばれますし、
「結果」が与えられないことよにって、行動が比較的緩やかに減少する(一時的には増加することもしばしばある)ことが観察されればそれは「消去(しょうきょ)」と呼ばれる現象になります。
他にも「強化子」には「無条件性強化子(1次性強化子)」や「条件性強化子(二次性強化子)」などのタイプがあったり、
強化子を与えるタイミングによって行動が変わることを観察した「強化スケジュール」の研究があったりなど、オペラント条件付けの理論は結構幅広くいろいろな行動のパターンの予測を教えてくれます。
オペラント条件付けの「オペラント」は「操作」という意味の「operat」からSkinnerが名付けた造語のようです(参考 小野 浩一, 2005)。
『「オペラント行動」とは?』については「生態が自発できる行動」と思ってもらって構いません。
「生態が自発できる行動」の内容で少し特殊なことは、
このとき「行動」と言われるものは「手をあげる」、「走る」、「相手を見る」、「話す」といった相手から確認できる行動だけでなく、
「考える」、「想像する」、「思う」と言った相手から見えない生態の皮膚の中で生じる活動も「生態が自発できる行動」とオペラント理論では捉えて扱います。
このことは少し一般的な常識とは違う部分かもしれません。
ここまでの内容で「(1)強化子は行動を強めるらしい」ということが一番大切なことです。
そしてどうやらその強化子は「(2)その結果を与えたことで、そののち、行動が強まったとき、それは強化子と呼ばれる」ということも覚えておいてください。
しかし実は上の段、赤文字で書いた(1)(2)の2つのことは理論的には成立していません。
以前にもブログ、本章の中で書きましたが本ブログページでは強化子のおさらいとしてそのことも説明させてください。
そして次に、本章のブログタイトルにある「強化子の強さとはどういったことだろう」という私が持っている考えについて書いていければと思います。
ここまでの説明では強化子が持つ理論的に成立しない理由
強化子についての「(1)強化子は行動を強めるらしい」、そして「(2)その結果を与えたことで、そののち、行動が強まったとき、それは強化子と呼ばれる」という2つの内容がここまでで書いてきたことの中でこれから扱いたいテーマです。
ここまでの内容だけではオペラント条件付けは行動を予測する理論として成立しないかもしれません。
その理由はなぜでしょうか?
以下のやりとりを見てください
質問者「どうしてラットのレバー押しが増加したの?」
学 者「ビールを与えることによって強化されたからだよ」
質問者「ビールが強化子であることをどのように知るの?」
学 者「レバー押しを増加させたからだよ」
質問者「どうしてラットのレバー押しが増加したの?」
学 者「ビールを与えることによって強化されたからだよ」
質問者「ビールが強化子であることをどのように知るの?」
学 者「レバー押しを増加させたからだよ」
質問者「どうしてラットのレバー押しが増加したの?」
学 者「ビールを与えることによって強化されたからだよ」
質問者「ビールが強化子であることをどのように知るの?」
学 者「レバー押しを増加させたからだよ」
・・・・・・・・・・・・
と、このように延々に答えが出ない議論は「循環論の罠」と呼ばれます。
行動のあとに伴わせることで、その後行動を増加させる結果という強化子の捉え方ではこのような循環論に陥ってしまうのです。
「(1)強化子は行動を強めるらしい」、そして「(2)その結果を与えたことで、そののち、行動が強まったとき、それは強化子と呼ばれる」という2つの内容だけではこの循環論は打破できないでしょう。
オペラント条件付けの理論を利用して支援をするときそれが有用なのは、さまざまな実験から明らかになっている事実から、
この先、過去の実験から鑑みるとこの行動はきっとこのように変化して行くだろうと予測できること、
そして、
今、こう行動しているのはきっとこのような環境側からの影響を受けているからだろうと理解できること、
そして、
だからこのように環境側を変化させれば今後、行動はこう変化して行くだろうと制御(コントロール)できること
だと思います。
特にまだ言葉の拙いお子様の場合にはその効果を発揮しやすいでしょう。
このとき「予測」、「理解」、「制御」のための核は強化、強化子です。
そのため「強化子」が循環論に陥ってしまうことは当時ABAの専門家を悩ませました(参考 James E. Mazur ,2006)。
現代、この循環論に対してはどのような回答を得ているでしょうか?
このことを知っていることも大切なことだと思います。
次の項で見ていきましょう。
強化子の循環論問題を解決した「プレマックの原理」「反応遮断化理論」「不均衡理論」
強化子の循環論問題を解決するとき使える理論があります。
それは「プレマックの原理」、「反応遮断化理論(はんのうしゃだんかりろん)」、「不均衡理論(ふきんこうりろん)」です。
3つは左から右へ、古いものから新しいものとなります。
実際には「プレマックの原理」の時点でここまでご紹介してきた強化子の循環論問題は解決はされているのですが、
今回はおさらいですので他のものも見ていきましょう
この3つは「自由反応場面」という場面から切り込み、強化子の循環論問題を解決に導いた理論です。
その点で言えば最初に「自由反応場面」に着目した「プレマックの原理」は偉大だったと思います。
「プレマックの原理」の「プレマック」は人名です。
過去のブログページでも3つは詳しく紹介しているので、本ブログページでは簡単にご紹介していきましょう。
もっと詳しいことが知りたい人はブログの検索窓から「プレマックの原理」「反応遮断化理論」「不均衡理論」を入れて検索をしてみてください。
ブログタイトルにもなっているトピックです。
プレマックの原理について
「プレマックの原理」・・・低頻度の直後に高頻度の行動が続くならば、低頻度の行動の生起確率を高める作用を示す(Paul A. Albert & Anne C. Troutman ,1999)
以上がプレマックの原理です。
例えば、音楽が(仕事よりも)好きな人の場合、「仕事が終わったら、音楽を聴く」のようにプレマックの原理にあてはまることは私たちの日常に多数あります(参考 小野 浩一, 2005)。
お子様で分かりやすい例としてはJon・Baily ・ Mary・Burch (2006) が紹介した「プレマックの原理」を使用した支援方法の例、「雑用が終わるまでテレビを観るのはダメですよ」と伝える方法などがあてはまるでしょう。
「雑用が終わるまでテレビを観るのはダメですよ(雑用の行動ののち、テレビを見るという結果が伴う)」はそのとき、雑用を行う行動を増加させそうです。
「プレマックの原理」については例えば、
高頻度の行動のあとに伴う反応は、低頻度の行動を強化できますがその逆はできない
とKevin P Klatt・Edward K. Morris (2001) は述べています。
また磯 博行 (2005) は「プレマックの原理」について、ベースラインにおいて観察された高い出現確率の行動はそれに伴う低行動確率の行動に対して強化子として働き、低い出現確率の行動は高い出現確率の行動の罰子として働くというものであったと述べ、
磯 博行 (2005) は「プレマックの原理」は不十分であることもわかっており、この原理をさらに発展させたものが「反応遮断化理論」であるとも述べました。
反応遮断化理論について
次は「反応遮断化理論」です。
「反応遮断化理論」・・・自由反応場面で強化子を取りに行けたのに、それが制限され強化子を取りに行けない状況が出現した場合、反応遮断(Response Deprivation)の状態が発生し、強化子の価値が上がる(参考 William Timberlake・James Allison,1974)
少し難しい文章かもしれません。
解説する前に知っておいてほしいこととしてKevin P Klatt他 (2001) は反応遮断化理論は確立操作であると述べました。
このことも含めて解説を行っていきましょう。
ブログの検索窓で「確立操作」と検索していただいても、「確立操作」についての詳しい内容が出てきます。
詳しく知りたい人は是非、検索をしてみてください。
「確立操作」はABA自閉症療育でもかなり使える理論だと思います。
確立操作は実は本ブログページ内で出てきていました。
そのとき「先行状況」に「弁別刺激」と「確立操作」が含まれることを冒頭ご紹介したのですが、先行状況に含まれる一つの要素です。
Raymond .G .Miltenberger (2001)は「確立操作」について特定の時点や状況で強化子の効力を確立する操作と述べています。
簡単な例を出しましょう。
例えばあなたの目の前にラーメン屋さんがあったとします。
「ラーメン屋さんの存在」はあなたが「ラーメン屋さんに入る」行動の直接のきっかけです。
「ラーメン屋さんに入る」ためには「ラーメン屋さんの存在」が必ず必要なため、「ラーメン屋さんの存在」は「ラーメン屋さんに入る」ための直接のきっかけと成り得ます。
このような直接的なきっかけをABAでは「弁別刺激」と呼ぶのですが、
あなたは目の前に「ラーメン屋さんの存在」があったとしても、「ラーメン屋さんに入るとき/ラーメン屋さんに入らないとき」がありますね?
いつも「ラーメン屋さんの存在」があったとき、ラーメン屋さんに入るという行動を生じさせていては毎日どれくらいの量のラーメンを食べることになるでしょう?
「ラーメン屋さんの存在」は直接的なきっかけではあるものの、ラーメン屋さんに入るか入らないかは例えば「空腹度合い」にも依存するでしょう。
このときの「空腹度合い」が「確立操作」です。
このときの「空腹度合い」とはRaymond .G .Miltenberger (2001)が「確立操作」について述べた、
特定の時点や状況で強化子の効力を確立する、つまりそのときのあなたにとってのラーメンの魅力度合いです。
このとき、空腹度合い以外にも例えばお腹が減っていたとしても、昨日も一昨日もラーメンを食べていた場合は、ラーメン屋に入ることは少し抵抗があるでしょう?
空腹以外のこのようなこと(直近で何度もラーメンを食べたため飽きが生じている)も「確立操作」と言えます。
話を「反応遮断化理論」に戻しましょう。
例えば毎日、朝の8時に自分の意思で自由に朝食を取っていたのに、その日イレギュラーが起きて(制限され強化子を取りに行けない状況が出現)、11時まで朝食が取れない日があるとすれば、
その日の朝食は反応遮断がかかり、朝の8時に自分の意思で自由に朝食を取っていた場合と比べて強化価値が上昇する
ということが理論的に説明できる、というのが反応遮断化理論の日常例となります。
これは反応遮断化理論の「遮断化」というものなのですが療育でこれを応用するとすれば、強化子を一定時間遮断し、強化子の価値を上げるテクニックとして応用可能です。
有名なものには他に「飽和化」があります。
飽和化は強化子を一定時間遮断することとは逆に、一定時間に強化子を多く与えることで逆に強化価値を下げることを狙うテクニックです。
飽和化を使ったABA自閉症療育技法で言えば例えば「Non Contingent Reinforcement:NCR(非随伴性強化法)」という方法があります。
「NCR」は『(ABA自閉症療育の基礎63)オペラント条件付けー速攻で問題行動を減らす「NCR:非随伴性強化法」(https://en-tomo.com/2020/12/02/non-contingent-reinforcement/)』で方法をご紹介しました。
これはABA自閉症療育の問題行動対応などに使用できるテクニックです。
少し長かったですが、ここまでが「反応遮断化理論」の説明でした。
不均衡理論(Disequilibrium theory)について
最後に「不均衡理論」です。
Kenneth W.Jacobs ・ Zachary H.Morford・James E.King (2019) は不均衡理論が反応遮断化理論の最先端であると述べました。
不均衡理論は上でご紹介した反応遮断化理論のアップデート版といったところでしょうか
不均衡理論については日本語の本で見たことが無いため「Disequilibrium theory」を「不均衡理論」と訳したのは私訳です。
もしかしたらこれから発売される(もしくは既に発売されている)書籍では別の日本語名でご紹介されているかもしれませんがその点、ご了承ください。
「不均衡理論」・・・特定の結果を満たす機能を持つ行動(Contingent Activity:随伴的活動)を1つのクラスにまとめて考え、その行動が遮断されたとき、その機能を持つ行動の強化価値が上がる(参考 Kenneth W. Jacobs・Zachary H. Morford・James E. King・Linda J. Hayes, 2017)
以上が不均衡理論です。
「反応遮断化理論」では1つの行動が遮断された(時間的に制限された)とき、その行動の強化価値が上昇すると考えてきました。
「不均衡理論」ではもう一歩進め、行動を1つの機能クラスと捉え、その機能クラスの行動が遮断されたとき、その機能クラスの行動の強化価値が上がる、というように考えます。
機能クラスとはどういった意味でしょう?
William .O’ Donohue・Kyle E. Forguson (2001) は電灯のスイッチを自分で押しても、誰かに依頼しても同一機能クラスになると述べているのですが、
簡単に言えば、同じ結果を持たらす行動の結果のことです。
以下、不均衡理論の日常例を考えてみましょう。
例えば好きな人から注目を得る方法としてメールを送るという行動を想像してみてください。
この行動の強化子はメールの返信(相手からのリアクション)ですね。
毎日、あなたは制限のない状態(自由反応場面)で10通のメールを送っていたとしましょう。
メールを送るときの基本的な弁別刺激は相手からの返信であり、返信に対してあなたもリアクションし、結果的に10通のメールを送るということがベースラインとなっていました。
このとき10通メールを送るという行動の機能(目的)は相手からのリアクションを得ることでした。
ただ、相手からのリアクションを得る手段はメールだけではありません。
例えば「電話」です。
電話でもメールと同じように相手からのリアクションを得るという行動の機能(目的)は達成できる可能性があります。
ある日、あなたは相手と電話をしたとしましょう。
するとメールではない「電話」であってもあなたは相手からのリアクションを得るという機能(目的)は達成できるため、相手からのリアクションは充足され、その日は送るメールの数が2件になるかもしれません。
但しこのとき、送るメールの数が少なくなった(相手からのメールの返信というリアクションの数も減った)からといって、あなたは特に相手からのリアクションを渇望している(遮断がかかっている)わけではありません。
メールに代替された電話によって充分に満足をして、行動は満たされているのです。
反応遮断化理論のように「メールを送る」という1つの行動だけに着目していては、このことは説明できない事例となります。
これが反応遮断化理論を発展させた「不均衡理論」です。
行動を機能(目的)でまとめて考え、その機能が充足しているかどうかという点で「遮断化」と「飽和化」を捉えていきます。
もとのテーマに戻り、これら「プレマックの原理」「反応遮断化理論」「不均衡理論」は強化子の循環論問題に対してどのように回答をするでしょう?
答えは、
質問者「どうしてラットのレバー押しが増加したの?」
学 者「ビールを与えることによって強化されたからだよ」
質問者「ビールが強化子であることをどのように知るの?」
学 者「自由反応場面のときと比較して、行動が少なかった(遮断されていた)場合、ビールは強化子となるよ」
と以上の形で循環論を打開できます。
自由反応場面のときと比較して、行動が少なかった(遮断されていた)場合、その行動(または行動から得られる結果)は強化子として機能するのです。
さて、ここまでかなり長くなってしまいましたが、最後の項で本ブログページで一番伝えたかったこと、強化子の強さとはどういったことだろうかという私の考えについて書いていきましょう。
強化子の強さとはどういったことだろうか
さて、ここまでで、
自由反応場面と比較して、行動が少なかった(遮断されていた)場合、遮断された行動は強化子となる
ことがわかりました。
ここから、今回タイトルにもある「強化子の強さとはどういったことだろうか」を考えていきます
例えばあなたは毎日、朝にトーストを食べていたとしましょう。
あなたはトーストが好きで、毎朝8時にトーストを食べていました。
誰からも制限されていない場面(自由反応場面)で毎朝8時にトーストを食べているとすれば、この状態が自由反応場面でのあなたの自然な行動(ベースライン)です。
この生活に何かしらの制限がかかり、毎朝8時にトーストが食べれないことが続いたとしましょう。
例えば(こんなことはないと思いますが)あなたが利用しているスーパーで連日、食パンが売り切れになっていて物理的に買えなかった、ということが続いたとします。
物理的に食パンが手に入らないことが例えば3日間続くとトーストを食べることに対する遮断がかかるでしょう(人によっては1日でかかるかも)。
このとき、普段は行わない「コストのかかる」面倒臭い行動を起こします。
例えばそれは、
・ 例えば仕事帰りに普段は降りない隣駅で降りて違うスーパーに行く
・ 車で15分ほどかけ少し遠いパン屋さんへに行く
・ 「今日こそは手に入れるぞ」と意気込んでスーパーに行くとき走る
・ 1日の中で何度かスーパーに行きパンがないか確かめる
などの面倒臭い行動です。
どうしてそんな面倒臭い行動をするか?
それはトーストを食べることが遮断されていて、強化子の力が強くなっているからです。
またこのとき手に入ったとき、強化子の価値は遮断され跳ね上がっているため、普段トーストを食べるときより満足を感じる可能性が高いでしょう。
私は、
「強化子の強さとは」とはこのようにコストをかけてでも強化子(目的)を手に入れたいと、行動が引き起こる強さのこと(目的達成のためにかけられるコストの量)
と考えています。
強化子(目的)を手に入れるときにかけれる手段や回数に対するコストが多ければ多いほど、強化子の力としては強い
というイメージです。
私はこのように考えているのですが、このように捉えることで強化子についての理解が少し進み、普段のABA自閉症療育を行うときのヒントになるのではないか、と考えています。
もし必要であれば「自由反応場面」という考え方や「遮断化」や「飽和化」という強化子の価値をコントロールする操作(確立操作)もABA自閉症療育に取り入れてみてください。
お子様の療育に対するモチベーションについて悩んでいるとき、特に役に立つでしょう。
さいごに
私のTwitterを見てくれている人は私が「食べることが好き」なことは知ってくれていると思います(笑)
私にとって「食べること」は強化的な結果、つまり「強化子」です。
「反応遮断化理論」を日常例として使用するとあなたの人生が少し豊かになるかもしれません。
例えば私は朝、昼を抜いて生活することが最近多いです。
忙しくて結果的にそうなることもあるのですが、そうでない日「朝、昼を抜いて生活すること」ができたときの晩御飯が美味しいこと美味しいこと!
しかし「忙しくて結果的にそうなった場合」は体力的に疲弊もしています。
この場合、体力的な疲弊は「食べること」の遮断化に影響を与えるでしょうか?
私は例えば疲れで全体的に行動が抑制されてしまうこともあります。
このとき、疲れで全体的に行動が抑制されてしまうため当然「食べる」行動も抑制されるのです。
そのような日、食への「遮断化」は生じてはいるものの、並行して疲れているため例えば「寝たい」という行動への遮断化も同時に生じているのでしょう。
このように並列して別機能の行動が遮断化と飽和化をを受けることもある、ということも知っておいても良いと思います
オペラント条件付けの理論から導く、私のQOLを上げる方法は?
例えば先ほどの食をテーマにすれば私の場合は一例として、
食に対して遮断化がかかるよう朝、昼を抜いて生活する方法を取り、夜に食べるという行動に対しても充分に注目ができるよう、1日の中でも体力を残しておく
ということが言えそうです。
このように行動が予測でき、そしてその方法を考えることができる、そしてそれはやろうと思えば実践可能な具体的な方法に落とし込むことができて制御(コントロール)可能である、
これがオペラント条件付け理論の魅力でしょう。
またABAはオペラント条件付け以外の学習理論も扱います。
ABAはオペラント条件付け以外にレスポンデント条件付けという学習理論もベースとしています(参考 Niklas Törneke,2009)。
オペラント条件付け、レスポンデント条件付けによっていろいろな行動についての理解が深まること。
本ブログが日頃のABA自閉症療育の一役を買えていれば幸いです。
これからもブログ続けていきますので、今後ともどうぞよろしくお願いいたします!
【参考文献】
・ 磯 博行 (2005)【中島 義明・繁桝 算男・箱田 裕司 (2005) 新・心理学の基礎知識 Psychology:Basic Facts and Concepts 有斐閣ブックス】
・ James E. Mazur (2006) LEARNING AND BEHAVIOR:6Th ed. 【邦訳 磯 博行・坂上貴之・川合伸幸,訳 (2008) メイザーの学習と行動 日本語版 第3版 二瓶社】
・ Jon・Baily & Mary・Burch (2006) How to Think Like a behavior Analyst : Understanding the Science That Can Change Your Life 【邦訳: 澤 幸祐・松見純子 (2016) 行動分析的 ”思考法” 入門ー生活に変化をもたらす科学のススメー】 岩崎学術出版社
・ Kevin P Klatt and Edward K. Morris (2001) The Premack principle, response deprivation, and establishing operations. The Behavior Analyst. 24, 173-180 No. 2 (Fall)
・ Kenneth W.Jacobs ・ Zachary H.Morford・James E.King (2019)Disequilibrium in behavior analysis: A disequilibrium theory redux. Behavioural Processes Volume 162, May p197-204
・ Kenneth W. Jacobs・Zachary H. Morford・James E. King・Linda J. Hayes (2017) Predicting the Effects of Interventions: A Tutorial on the Disequilibrium Model. Behav Analysis Practice. 10:195–208.
・ Niklas Törneke (2009) Learning RFT An Introduction to Relational Frame Theory and Its Clinical Application 【邦訳 監修:山本 淳一 監訳:武藤 崇・熊野 宏昭 (2013) 関係フレーム理論(RFT)をまなぶ 言語行動理論・ACT入門 星和書店
・ 小野 浩一 (2005) 行動の基礎 豊かな人間理解のために 培風館
・ Paul A. Albert & Anne C. Troutman (1999) Applied Behavior Analysis for Teachers:Fifth Edition【邦訳 佐久間 徹・谷 晋二・大野 裕史 (2004) はじめての応用行動分析 二瓶社
・ Raymond .G .Miltenberger (2001)Behavior Modification : Principles and Procedures / 2nd edition 【邦訳: 園山 繁樹・野呂 文行・渡部 匡隆・大石 幸二 (2006) 行動変容方入門 二瓶社】
・ William .O’ Donohue・Kyle E. Forguson (2001) The Psychology of B.F.Skinner 【邦訳: 佐久間 徹 (2005) スキナーの心理学 応用行動分析(ABA)の誕生 二瓶社】
・ William Timberlake・James Allison (1974) RESPONSE DEPRIVATION: AN EMPIRICAL APPROACH TO INSTRUMENTAL PERFORMANCE. Psychological Review Vol. 81 No. 2 p146-164