720 likes | 1.29k Views
學習歷程. 陳富美. 「學習」的定義 . 從行為主義的角度來看, 學習 ( learning )意味著 行為的改變 ( 建立) ── 而非 通常我們所說的「獲得觀念」、「了解道理」等等。. ” 學習”兩個大前提. 所謂的「學習」,包含兩個要件: (1) 行為的改變必須是基於 經驗的影響 ; (2) 行為的改變必須是 相當持久而穩定 的現象 疾病 , 腦傷 , 或藥物影響等生理變化造成的行為改變不屬於此類 . 偶一為之的行為也不屬於此類. 一定要記住的學者 : John Watson. 行為主義學派創始人. 行為主義學派( Behaviorism ) 認為 :.
E N D
學習歷程 陳富美
「學習」的定義 • 從行為主義的角度來看,學習(learning)意味著行為的改變(建立)──而非通常我們所說的「獲得觀念」、「了解道理」等等。
”學習”兩個大前提 • 所謂的「學習」,包含兩個要件:(1)行為的改變必須是基於經驗的影響;(2)行為的改變必須是相當持久而穩定的現象 • 疾病, 腦傷,或藥物影響等生理變化造成的行為改變不屬於此類. 偶一為之的行為也不屬於此類
一定要記住的學者: John Watson • 行為主義學派創始人
行為主義學派(Behaviorism)認為: • 每個人成為怎樣的人, 基本上決定於他的成長經驗 • 藉由經驗, 建立自己的行為模式
什麼是“經驗” (講義137) • 個人所遭遇到的事情(親身經歷) • 個人對於行為所產生結果的感受 • 個人觀察他人言行而產生的經驗
John Watson(華生)的名言 :(課本p176) • 給我一打健康的嬰兒,不論他們的先天才智、賦性、傾向、種族、出身背景為何,我保證可以將他們隨意地培養成,醫生、律師,乃至於乞丐、小偷。
Watson的主要論點(課本p176) • 人之所以表現出”某種行為“, 九成九是學來的 • 人出生時, 除了極少數動作外(如反射動作), 在心理上一無所有 • 一出生,沒有任何傾向,例如, 不特別乖巧, 也不特別叛逆 • 人在生長的過程中, 環境一點一滴, 夜以繼日的型塑一個人
我們說一個人”學乖了“ ”學聰明了”, 就是從經驗中學習的例子
行為主義學派的主張 • 不以心思、意識等為研究對象,研究外顯行為 • 不用內省法而改用實驗法為主要研究方法。
人與動物的區隔? • 一旦將「心思」排除於心理學之外,不承認它們對行為有影響,那麼人與動物的行為便不再有明顯的界線
什麼是“經驗” (講義138) • 個人所遭遇到的事情(親身經歷) :古典制約(classical conditioning) • 個人對於行為所產生結果的感受:操作制約(operant conditioning) • 個人觀察他人言行而產生的經驗: 觀察制約(observational learning)
古典制約:正統條件化 • 俄國生理學家Ivan Pavlov(巴卜洛夫)發現並深入探討的正統條件化(classical conditioning) 歷程,才是真正重要的學習歷程。
講義139 • Pavlov研究唾液在消化歷程中的角色。他假設:唾液分泌是動物口腔對食物刺激的生理反射。 • 然而,Pavlov發現:「中性」刺激 ,在特定條件下,也會引起唾液反應。此一現象非生理學所能解釋。
正統條件化 Pavlov 的實驗
古典制約 條件反應的習得(講義140)
正統條件化 條件化歷程應具備之要件 • 無條件刺激(unconditioned stimulus,US):無需其他條件就能引起特定反應(如流口水)的刺激。 • 無條件反應(unconditioned response,UR):由無條件刺激所引發的反應 。
條件刺激(conditioned stimulus,CS):只有在特定條件下,可以引發原先只有US才能引發的反應之中性刺激。 • 條件反應(conditioned response,CR):由CS所引發的反應,跟UR是同類的,但在強度上稍弱一點。
古典制約 聯結論(課本p185) • 有些心理學家喜歡用聯結(association),這個字眼來指稱正統條件化歷程。他們認為,條件化的結果是使得CS與US在受試者腦中發生聯結。 • 因此,行為主義的學習觀點被稱為聯結論(associationism)。
正統條件學習的三要素 • CS與US配對呈現 • CS先於US • 兩者的時間間隔不能太長 • 動物學到什麼? CS顯然預告US的來臨
正統條件化 條件反應的消除與自然恢復 (講義 141) • 消除程序是CS單獨出現(不再有US伴隨出現)的程序。 • 已被消除的條件反應,在休息一段時間後,會再度出現,只是強度比未消除前弱了一點。這個現象稱為條件反應的自然恢復(spontaneous recovery)。
正統條件化 正統條件化的學習曲線
古典制約 刺激的類化與辨別 (講義p141) • 除了原先的CS外,類似於CS的其他刺激是否也能引發CR • 這種「由類似刺激引發條件反應」的現象,稱為刺激類化(stimulus generalization)
刺激的類化與辨別 刺激的類化與辨別 • 類化反應也有它的缺點,比如說,「一朝遭蛇咬,十年怕草繩。」便是對蛇的過度類化反應。這種反應雖有助於對蛇類提高警覺,卻也造成不必要的緊張。
刺激的辨別 • 所謂刺激的辨別(stimulus discrimination),是學習針對不同的刺激(譬如,蛇與草繩)給予不同的反應。
高層制約 • 當制約刺激(CS)可以單獨引起制約反應(CR),這時制約刺激可以當作非制約刺激(UCS) ,使它與另一個制約刺激配對出現,藉以建立另一個古典制約學習
正統條件化 高層制約
慾求的條件化與嫌惡的條件化(課本193) • 當我們使用食物、糖水等作為US時,由於這類刺激是受試者所慾求的,因此,這類的條件化稱為慾求的條件化(appetitive conditioning)。 • 使用電擊、令人害怕的巨響等作為US的條件化,則稱為嫌惡的條件化(aversive conditioning)
正統條件化 嫌惡的條件化 • Watson & Raynor(1920)對未滿周歲的小亞伯進行實驗。每當小白鼠出現,亞伯高興的爬過去時,實驗者就以鐵棒敲出巨響,讓亞伯驚慌害怕。實驗進行沒幾次,小白鼠會引發亞伯的懼怕反應。 • 甚至對於任何毛絨絨的物品,都會驚慌害怕。
這個實驗有道德上的缺陷,卻為心理學增添了知識,讓我們了解,情緒反應的根源常是條件化經驗。這個實驗有道德上的缺陷,卻為心理學增添了知識,讓我們了解,情緒反應的根源常是條件化經驗。 • 你可能「沒來由的」討厭某人,事實上,它是「有來由的」——他可能曾與某個嫌惡刺激(aversive stimulus)發生聯結,或與某個討厭的人很像,使你對他產生厭惡的類化反應。
古典制約學習的應用(講義142) • 恐懼或焦慮的情緒 • 愉快情緒的學習 • 廣告行銷 • 生理的反應 • 以古典制約治療不適應行為
生理反應的舉例 • 對喝過糖精(CS)的老鼠注射抑制免疫力的藥物(US),能讓糖精具有抑制免疫力的功效。 • 果凍的甜味(CS)與促進殺手細胞活力的藥物(US)聯結,能使果凍擁有提升免疫力的功效。 • 這方面的研究叫心理神經免疫學(psychoneuroimmunology)。
以古典制約治療不適應行為 • 尿床的行為改變治療 • 睡在特製的床墊上 • 尿床後,床就會發出鈴聲(UCS) ,將小孩吵醒 • 尿床前,會有膀胱積尿的感覺(CS) ,都在鈴聲之前出現。 • 經過幾次連結後,CS就可以喚醒(CR)小孩起床上廁所。
古典制約的特點 • CR都是由自主神經系統控制的反應,不是我們所能隨意控制。 • 學習完全決定於外在條件,只要CS與US適當的配對,就會造成條件化。學習者是被動的,他的反應是由刺激所「引發」的,不是「自發」的。 • 我們日常生活中大部分的學習卻不是這樣的。
操作制約學習(講義145) • 古典制約學習無法解釋許多行為: 例如海豚跳躍表演 • 心理學家開始研究動物” 解決問題的能力” • 先驅性研究:Thorndike的難題箱(puzzle box)實驗。
操作的條件化 (講義143)
Thondike實驗的理論重點(講義144) • 學習是嘗試錯誤(trail-and-error)歷程 : 不斷嘗試錯誤,最後學會做出正確的反應 • 效果律(law of effect):行為是否持續出現,決定於它的效果。
Thondike實驗的理論重點(講義145) • 練習律: 隨著練習次數增加,正確反應與刺激間產生多次的連結,稱為練習率 • 準備率: 個體要解決問題,身心準備狀態也是重要因素。如果個體注意力不集中,或沒有興趣去獲得酬賞物,則刺激與反應間就不容易產生連結
操作的條件化 Skinner的研究 • Thorndike的觀點在大約四十年後,在B. F. Skinner(史基納)手上大放異彩。他發展出許多精巧的技術,對行為作實驗分析,大大的擴展了行為研究的領域。
Skinner操作制約的主要論點(講義145) • 個體表現行為之後,如能獲得滿意的結果,則該行為就獲得強化(reinforce) 。因此該行為重複出現的機率會增多。
操作的條件化 Skinner的實驗分析 • Skinner的實驗儀器,叫Skinner箱(Skinner box),可用來訓練鴿子或老鼠學會各種行為。
為何叫做”操作”制約 • 受試者在操作(operate)它的環境,所以Skinner稱這種學習為操作制約(operant conditioning)。
操作制約 • 從行為主義者的角度看,了解人的想法是多餘的。促成老鼠不斷壓桿的,不是它的任何想法,而是伴隨著壓桿動作而來的食物丸子(或其他獎賞物) 。
Skinner 操作制約的學習理論(講義146) • 正強化作用(positive reinforcement):個體表現某種行為之後,如果能立即獲得酬賞物(reward),該行為得到強化,個體再次表現該行為的機率增加 • 這個酬賞物稱為正強化物(positive reinforcer):種類可能是食物、金錢、稱讚、優待、權力、成就感等
Skinner 操作制約的學習理論(講義147) • 負強化作用(negative reinforcement):個體表現某種行為之後,立即終止其所厭惡的刺激,則該行為會得到強化,個體再度表現該行為的機率將隨之增加。 • 這個被終止的刺激稱之為負增強物(negative reinforcer):可能包括電擊、處罰、嘲笑、嘮叨、罰錢等 • 因負強化物的消失,使個體的行為得到強化
懲罰 • 正懲罰(positive punishment): 個體表現某種行為之後,立即給予其所厭惡的刺激,則該行為會被抑制,個體再度表現該行為的機率將隨之減少 • 負懲罰(negative punishment): 個體表現某種行為,立即去除其所喜愛的刺激則該行為會被抑制,個體再度表現該行為的機率將隨之減少
習得的無助感(講義147) • 如果個體嘗試各種行為,都無法終止厭惡的刺激,就可能學習到沒有希望的無助行為,這種現象稱為習得無助感( learned helplessness) ,習得無助感有可能導致憂鬱症
操作的條件化 穿梭箱 • 穿梭箱(shuttle box)是研究負面強化的儀器。它是隔成兩半的長方形箱子,中間有一道矮矮的隔間,它可以升起,以便將箱子的兩半完全隔斷。 • 它的地板是由金屬條組成的,因此可以通電。電路的設計是,當一邊通電的時候,另一邊就沒電。
強化時制:強化物出現的時間(講義147) • 行為出現後馬上出現增強物學習效果較佳 • 若過一段時間再給予增強,這種延宕強化, 學習效果較差