(ABA自閉症療育の基礎52)オペラント条件付けー強化子「反応遮断化理論」と「不均衡理論」

このページはイラストで言えば、


「ココ」と書かれた強化子や罰のところ

「ココ」と書かれている強化子や罰にあたるところの内容です。


「(ABA自閉症療育の基礎19)オペラント条件付け-強化とは?(https://en-tomo.com/2020/08/13/operant-conditioning-basic-reinforcement/)」

のブログページで私は強化について、

特定の状況の下(A)で、特定の行動(B)が生起したとき、特定の結果(C)が伴う。

その後、特定の状況の下(A)で特定の行動(B)が増加した場合、それは強化と呼ぶ

このとき、行動を増加させた結果を「強化子(Reinforcer)」と呼ぶと

私は後輩育成をするときに教えています。

と記載してきました。


このように強化子について捉えるだけでも、ABA自閉症療育に生かすことは充分可能です。

しかしこのように紹介してきた強化子の定義では

「(ABA自閉症療育の基礎49)オペラント条件付けー強化子の循環論と「要求/動因低減説」(https://en-tomo.com/2020/10/25/reinforcer-circular-theory/)」

のページで紹介したように、

循環論に陥ってしまい永遠に結論が出ない(未来を予測できない)のです。

ーーーーーーーーーー

質問者「どうしてラットのレバー押しが増加したの?」 

学 者「ビールを与えることによって強化されたからだよ」 

質問者「ビールが強化子であることをどのように知るの?」 

学 者「レバー押しを増加させたからだよ」 

質問者「どうしてラットのレバー押しが増加したの?」 

学 者「ビールを与えることによって強化されたからだよ」 

質問者「ビールが強化子であることをどのように知るの?」 

学 者「レバー押しを増加させたからだよ」

(参考 James E. Mazur, 2006)

ーーーーーーーーーー


Enせんせい

上のような議論を循環論と言います

循環論では答えが出ません


この循環論を避けるため、強化子についてもっと強固な定義が必要であった歴史がありました。

循環論を避けるための強化子の定義として

「(ABA自閉症療育の基礎51)オペラント条件付けー強化子「プレマックの原理」(https://en-tomo.com/2020/10/29/reinforcement-premack-principle/)」

のページでは「プレマックの原理」を紹介しました。

「プレマックの原理」は強化子の循環論を避けるための定義としては1つの成功例です。

このブログページでは、

同じように強化子についての循環論を避けることができる「反応遮断化理論」「不均衡理論」についてみていきましょう。


ブログページから「反応遮断化理論」と「不均衡理論」を学びましょう


ABAにおける強化子とは?ー反応遮断化理論

「反応遮断化理論(Response Deprivation theory)」William Timberlake・James Allison (1974)によって提唱されました。 

William Timberlake他(1974)によればこの理論には2つの前提があり、

1つ目は(強化子を取りにいく)手段となる行動は、自由場面(※ ベースライン)とスケジュールが制限される場面との比較された場合に生まれること、

そして2つ目は自由場面での行動とスケジュールが制限される場面での行動の矛盾を解決する理由としては、動物の生物学的要因と能力に基づくことです。

William Timberlake他(1974)は反応遮断(Response Deprivation)が満たされる条件として、

スケジュールが限定される場面では、ベースライン(自由に反応できる場面)と比較して強化子を取りに行く手段となる行動のアクセス量に満たないとき、反応遮断の状態が発生すると定義できると述べました。


Enせんせい

難し、意味不明

なんのこっちゃ?

と思ったかもしれません

この先のページで反応遮断化理論について簡単に説明します



ABAの強化子理論ー反応遮断化理論を簡易的に解説

「反応遮断化理論」を簡単に解説していきます。

まず「ベースライン」とは、何も操作をしていない状況で自由にできるシチュエーションと考えてください。

ABA自閉症療育を例にこの反応遮断化理論を用いる用とした場合、

最初にベースラインとして自由に何をしても良い状況を観察しましょう。

60分間、観察をしたとき、

ゲーム   ・・・30分(60分の50%)

動画    ・・・15分(60分の25%)

ボール遊び ・・・ 9分(60分の15%)

お勉強   ・・・ 6分(60分の10%)

という割合で活動をお子さんが自発的な行動を行なったとします。

上の活動がベースラインデータです。


次に「スケジュールが限定される場面」とは、何か操作を行う状況で完全に自由には行動できないシチュエーションと考えてください。

簡単に言い換えればこの場面とは、あなたがお子さんに何かをやらせたいと考えて実行する場面です。

「お勉強をしなさい」

「着替えなさい」

「早くお片付けをしなさい」

などの指示を行うシチュエーションです。

このとき「お勉強をする」「着替える」「片付ける」というお子さんの行動を強化したいとき、一体何が強化子になるか?

と、いうことを示した理論が「反応遮断化理論」です。


このことに対しての反応遮断化理論の回答は、

60分過ごす活動の中で、

ゲーム   ・・・30分以下しかできない(60分の50%以下)

動画    ・・・15分以下しかできない(60分の25%以下)

ボール遊び ・・・ 9分以下しかできない(60分の15%以下)

お勉強   ・・・ 6分以下しかできない(60分の10%以下)

場合、上に記載した4つの活動はどれもお子さんの行動を増加させる「強化子」として機能する

という回答です。

つまり「反応遮断化理論」とはベースラインで自由に行動(活動)できたときの行動量が制限(遮断)されると、その行動(活動)は強化子として機能する

ということを示した理論です。

坂上 貴之・井上 雅彦 (2018) は自由接近事態と比べてより反応が遮断化されている反応は、そうでない反応を強化すると反応遮断化理論について述べています。



ABA自閉症療育で反応遮断化理論を使用するメリット

ABA自閉症療育に「反応遮断化理論」を含めて考えると大切なメリットがいくつか見えてきます。

メリット1:行動(活動)が強化子になるという発想

「(ABA自閉症療育の基礎51)オペラント条件付けー強化子「プレマックの原理」(https://en-tomo.com/2020/10/29/reinforcement-premack-principle/)」

でも記載しましたが「プレマックの原理」や「反応遮断化理論」を知っていくと、

「強化子は行動のあとに伴う刺激(アイテム)」、という考え方から「強化子は行動のあとに伴う行動(活動)」という発想ができるようになります

この発想は「お菓子をあげなければいけない」「おもちゃを与えなければいけない」という思い込みからの解放です。



メリット2:比較的簡単にその子にあった強化子選定が可能

ABA自閉症療育でたまに耳にするのですが「この子には強化子がない」、「この子は強化子が効かない」という悩みが存在します。

強化子とは「特定の何か」ではないため、行動を起こしている以上強化子の存在は定義上認められるのですが、

このように悩む人の主張は基本的には「この子に何か教えるために、褒める、お菓子、おもちゃ、動画など考えられるものを用意してもあまり課題に乗り気にならない」というものが多いでしょう。

もしそのような悩みを持っているのであれば騙されたと思って一度「ベースライン」を計測し、何も操作をしていない状況で自由に行なっているお子さんの行動(活動)を強化子としてセッティングしてみてください。

反応遮断化理論が示す強化子の採択方法は何も特別なことをせず、放っておいて勝手にする活動を計測するだけなのです。

非常に楽な作業と言えます。



メリット3:ベースラインに現れた全ての行動(活動)が強化子になる

「プレマックの原理」では「ベースラインで6分しか行わなかったお勉強」は低頻度行動のため、高頻度行動の「ベースラインで30分行ったゲーム」と違って強化子とならないと考えられます。

しかし「反応遮断化理論」ではベースラインからの乖離が強化力を定義するため「ベースラインで6分しか行わなかったお勉強」も強化子になり得ると考えます。

これの何が便利か?と言えば「ベースラインで6分しか行わなかったお勉強」も勉強することを制限させれば強化力を持つため、

「着替えたあとにお勉強ができます」

「お片付けをしてからお勉強ができます」

という(親御様からすれば夢のような)ことが可能なわけです。

「着替えたあとにゲームができます」

「お片付けをしてからゲームをします」

という「プレマックの原理」の高頻度行動が強化子となるという結論と比較して記述すると、かなり状況が違って見えるでしょう?


例えばあなたが嫌々であっても健康のため自発的に週2日、1日1時間ランニングをしていることを想像してください。

そのランニングをある程度の期間継続して行えていた場合、

もし誰かが急に「あなたのランニング」を防止してきてできなくなったとすれば、嫌々行なっていたランニングも「ちょっとやりたくなる」気持ちはわからないでしょうか?


Enせんせい

以上の3点から、

個人的には反応遮断化理論をABA自閉症療育に組み込むメリットと考えています


William Timberlake他(1974)は論文の最後、これまで経験的に強化子となるであろうという結果が強化子として使用されてきたが、これは事後に強化子であったと確認できる方法である。

このような方法を放棄し、ベースラインと比較する反応遮断化理論の方法を提案する、

というような内容を述べます。


確かにその通りなのですが、

個人的には「褒める」「抱っこ」「くすぐり」などの社会的な関わりを行うことは、お子さんにとって社会的な関わりが魅力的(強化的)な結果と感じられるようになる可能性があるため、

ABA自閉症療育の文脈だけで見ればWilliam Timberlake他(1974)の提案を全面的に受け入れられるわけではないと思います。

しかし、どうしてもお子さんにとっての強化子が見つからない場合はWilliam Timberlake他(1974)の提唱した反応遮断化理論から強化子選択を試してみてはいかがでしょうか?



反応遮断化理論は強化子の循環論にどう回答するか?

ここまでの内容で見てきたように強化子の循環論問題に対する反応遮断化理論の答えは、

ベースラインで自由に行動(活動)できたときの行動量が制限(遮断)されると、その行動(活動)は強化子として機能する

という答えになります。

このような回答で循環論を避けることが可能です。


ーーーーーーーーーー

質問者「どうしてラットのレバー押しが増加したの?」 

学 者「ビールを与えることによって強化されたからだよ」 

質問者「ビールが強化子であることをどのように知るの?」 

学 者「ベースラインでラットがビールを飲む行動の時間を測定して、ラットのビールを飲む行動を遮断したからだよ。反応遮断化理論にしたがえば、遮断されたラットのビールを飲む行動は強化子であると言えるんだよ」 

(参考 James E. Mazur, 2006を改変)

ーーーーーーーーーー

反応遮断化理論では上記のように回答することが可能となり、循環論に陥ることはありません



反応遮断化理論と確立操作

Kevin P Klatt・Edward K. Morris (2001) 反応遮断化理論は確立操作であると述べています。

確立操作についてはここまで

「(ABA自閉症療育の基礎45)オペラント条件付けー確立操作(https://en-tomo.com/2020/10/10/establish-operation/)」

「(ABA自閉症療育の基礎46)オペラント条件付けー確立操作と弁別刺激の違い(https://en-tomo.com/2020/10/13/establish-operation-discrimination-stimulus-difference/)」

「(ABA自閉症療育の基礎47)オペラント条件付けー「無条件性確立操作」と「条件性確立操作」(https://en-tomo.com/2020/10/16/establishing-operation-type1/)」

「(ABA自閉症療育の基礎48)オペラント条件付けー確立操作「遮断化」「飽和化」「嫌悪化」(https://en-tomo.com/2020/10/19/establishing-operation-type2/)」

「(ABA自閉症療育の基礎49)オペラント条件付けー確立操作とレスポンデント条件付け(https://en-tomo.com/2020/10/24/respondent-operant-affect-each-other2/)」

以上のブログページでみてきました。


Paul A. Albert・Anne C. Troutman (1999) 確立操作について強化子の効力を高めたり、弱めたりするような先行状況の操作と述べています。

確立操作とはPaul A. Albert他 (1999) が述べているように強化子の価値を変容させるものなのですが、

Kevin P Klatt他 (2001) の主張によれば、反応遮断化理論の反応遮断化手続きを行うことで確立操作を生じさせるのです。

この内容に私は賛成です。

このブログページで見てきたようにベースラインで行った行動の良からの乖離は、行動を強化子として機能させますので反応遮断は確立操作として機能させることでしょう。


Kevin P Klatt他 (2001) 強化だけでなく、反応(行動)の飽和化(Response satiation)はその反応の関与機会の強化効果を一時的に廃止するか、罰としてそれらの機会を確立するとも述べており、

ベースラインで自由に行動できた時間・頻度以上にその行動を行わせようとした場合、その行為は「罰」として機能するとも述べています。

「罰(Punishment)」とは例えば「(ABA自閉症療育の基礎25)オペラント条件付け-罰(https://en-tomo.com/2020/08/20/operant-conditioning-basic-punishment/)」

で紹介したように罰は行動を消失・減少させる、行動のあとに伴う結果のことです。


反応遮断化理論をABA自閉症療育で考える際はKevin P Klatt他 (2001) が述べているように、確立操作の枠組みで考えるとわかりやすいと個人的には思っています。


確立操作とはオペラント条件付け条件付けでイラストに位置し考慮されます


反応遮断化理論の先、不均衡理論

「不均衡理論(Disequilibrium theory)」という理論があります。

Kenneth W.Jacobs ・ Zachary H.Morford・James E.King (2019) 不均衡理論が反応遮断化理論の最先端であると述べました。

Kenneth W.Jacobs 他(2019) によれば不均衡理論でもベースラインで自由に行動できた時間・頻度以上にその行動を行わせようとした場合その行為は「罰」として機能します。


また、教えた行動が「般化(generalization)」することはABA自閉症療育では重要な課題です。

※ 般化については「(ABA自閉症療育の基礎39)オペラント条件付けー般化(https://en-tomo.com/2020/09/14/discrimination-learning-generalization/)」を参照


Shira Richman (2001) 般化について直接教えていない様々な場面や状況、人に応じて適切な行動を示すこと。また、教えられた型どおりではない応答を示すことと述べました。

教えた行動がいろいろなシチュエーションで使用されることはABA自閉症療育にとっては重要です。


Kenneth W.Jacobs 他(2019) を参考にすれば般化が生じない原因は不均衡理論から考えれば、

そのシチュエーションが練習したシチュエーションと全く無関係、というだけでは無く、不均衡な状態が欠如しているかもしくは、不均衡の条件に満たない大きさであることに起因する可能性がある

からのようです。

簡単に上の内容を解釈すれば般化が起こらない原因は、

・ 般化して欲しいシチュエーションが、練習のシチュエーションと類似していない

・ 般化して欲しいシチュエーションで既に別の行動によって欲求が満たされている

・ 練習した行動は、ベースライン状況で自発される程のサイズになっていない

という内容になるでしょう。


個人的に注目したいのは2番目の「般化して欲しいシチュエーションで既に別の行動によって欲求が満たされている」という内容になります。

反応遮断化理論ではベースラインで行われていた活動に焦点を当てて強化子を説明してきましたが、

不均衡理論では特定の結果を満たす機能を持つ行動(Contingent Activity:随伴的活動)を1つのクラスにまとめて考えるようです(参考 Kenneth W. Jacobs・Zachary H. Morford・James E. King・Linda J. Hayes, 2017)


不均衡理論では例えば60分間のベースラインの中で30分間、「頭を打ち付ける」「奇声を上げる」「物を投げる」という行動が出現したとして、これらの行動が「大人の注目を得るために行われた」場合、

大人の注目を得られる行動を行うことを60分間から30分間以下に遮断すれば、大人の注目を得られる行動は強化子として機能し

大人の注目を得られる行動を行うことを60分間から30分間以上に飽和させれば、大人の注目を得られる行動は罰子として機能することを示します。

実はこのことはABA自閉症療育ではとても便利なことなのです。

Kenneth W. Jacobs他 (2017)は不均衡理論は行動を効果的にコントロールするために予測が出来る有効的なルールであると述べました。


例えば複数の行動をクラスにまとめ「大人の注目を得るために行われた」と予測するためには「機能分析(Functional Analysis)」という技法が必要になります。

機能分析はABA自閉症療育にとって重要キーワードですので、別の章で詳しく書いていくこととさせて下さい。



さいごに

ブログページでは「反応遮断化理論」について紹介してきました。

反応遮断化理論とは

ベースラインで自由に行動(活動)できたときの行動量が制限(遮断)されると、その行動(活動)は強化子として機能する

ということを示した理論です。

反応遮断化理論は「プレマックの原理」同様、強化子の循環論問題を解決することが可能にしました。


James E. Mazur (2006)は反応遮断化理論によってわれわれは、何が強化子として働くか前もって予測できるので、強化子の定義はもはた循環することはないと述べました。

実森 正子・中島 定彦 (2000) は反応遮断化理論について、現在ではプレマックの説よりもこちらの説の方が支持されていると述べています。

論文を読んでみるとわかりますが反応遮断化理論や不均衡理論の論文には例えば



Kenneth W.Jacobs ・ Zachary H.Morford・James E.King(2019)より抜粋

例えば上のような式が出てきます。

このような式が出てくるとなんとなく難しく感じるかもしれませんが、上の式はこのブログページで示してきたようにベースラインからの乖離を示したものです。


またこの系統の論文中出てくる「instrumental」という重要英単語があるのですが、

「instrumental」は直訳すると「楽器の」という意味で、この英単語は論文の内容を意味不明にさせます。

この単語は「instrumental performance」や「instrumental response」という文脈で出てくるのですが私は「中心的な手段となる行動」と訳しました。

「中心的な手段となる行動」とは「強化子を手に入れるために行う行動」のことです。


このページで強化子を振り返るフェイズは終了です。

このページで示した内容が2020年現在、強化子研究の最先端の理論と言えるでしょう。


次のページでは一旦ここまでのページをまとめたページを紹介します。

次のページは「オペラント条件付けー基本ユニット内容まとめページ」となります。

長かったですが、ここで一旦区切りとしましょう。


次のページは画像の「オペラント条件付け」基本ユニットのまとめページです

その後、少しマニアックな「選択行動」や「観察学習」、「言語行動」へと進んでいきます。



【参考文献】

・ James E. Mazur (2006) LEARNING AND BEHAVIOR:6Th ed. 【邦訳 磯 博行・坂上貴之・川合伸幸,訳 (2008) メイザーの学習と行動 日本語版 第3版 二瓶社】

・ 実森 正子・中島 定彦 (2000) 学習の心理 第2版 サイエンス社

・ Kenneth W.Jacobs ・ Zachary H.Morford・James E.King (2019)Disequilibrium in behavior analysis: A disequilibrium theory redux. Behavioural Processes Volume 162, May p197-204

・ Kenneth W. Jacobs・Zachary H. Morford・James E. King・Linda J. Hayes (2017) Predicting the Effects of Interventions: A Tutorial on the Disequilibrium Model. Behav Analysis Practice. 10:195–208.

・ Kevin P Klatt and Edward K. Morris (2001)he Premack Principle, Response Deprivation, and Establishing Operations. The Behavior Analyst. 4, No2 (Fall) p173-180

・ Paul A. Albert & Anne C. Troutman (1999) Applied Behavior Analysis for Teachers:Fifth Edition【邦訳 佐久間 徹・谷 晋二・大野 裕史 (2004) はじめての応用行動分析 二瓶社

・ 坂上 貴之・井上 雅彦 (2018) 行動分析学 行動の科学的理解をめざして 有斐閣アルマ

・ Shira Richman (2001)Raising aChild with Autism A Guide to Applied Behavior Analysis for Parents 【邦訳: 井上 雅彦・奥田 健次(2009/改訂版2015) 自閉症スペクトラムへのABA入門 親と教師のためのガイド 株式会社シナノ パブリッシング プレス】

・ William Timberlake・James Allison (1974) RESPONSE DEPRIVATION: AN EMPIRICAL APPROACH TO INSTRUMENTAL PERFORMANCE. Psychological Review Vol. 81 No. 2 p146-164