學習歷程

學習歷程 陳富美

「學習」的定義 • 從行為主義的角度來看，學習（learning）意味著行為的改變(建立）──而非通常我們所說的「獲得觀念」、「了解道理」等等。

”學習”兩個大前提 • 所謂的「學習」，包含兩個要件：(1)行為的改變必須是基於經驗的影響；(2)行為的改變必須是相當持久而穩定的現象 • 疾病, 腦傷,或藥物影響等生理變化造成的行為改變不屬於此類. 偶一為之的行為也不屬於此類

一定要記住的學者: John Watson • 行為主義學派創始人

行為主義學派（Behaviorism)認為: • 每個人成為怎樣的人, 基本上決定於他的成長經驗 • 藉由經驗, 建立自己的行為模式

什麼是“經驗” (講義137) • 個人所遭遇到的事情(親身經歷) • 個人對於行為所產生結果的感受 • 個人觀察他人言行而產生的經驗

John Watson（華生）的名言：(課本ｐ１７６） • 給我一打健康的嬰兒，不論他們的先天才智、賦性、傾向、種族、出身背景為何，我保證可以將他們隨意地培養成，醫生、律師，乃至於乞丐、小偷。

Watson的主要論點(課本ｐ１７６) • 人之所以表現出”某種行為“, 九成九是學來的 • 人出生時, 除了極少數動作外(如反射動作), 在心理上一無所有 • 一出生,沒有任何傾向,例如, 不特別乖巧, 也不特別叛逆 • 人在生長的過程中, 環境一點一滴, 夜以繼日的型塑一個人

我們說一個人”學乖了“ ”學聰明了”, 就是從經驗中學習的例子

行為主義學派的主張 • 不以心思、意識等為研究對象，研究外顯行為 • 不用內省法而改用實驗法為主要研究方法。

人與動物的區隔? • 一旦將「心思」排除於心理學之外，不承認它們對行為有影響，那麼人與動物的行為便不再有明顯的界線

什麼是“經驗” (講義138) • 個人所遭遇到的事情(親身經歷) ：古典制約(classical conditioning) • 個人對於行為所產生結果的感受：操作制約(operant conditioning) • 個人觀察他人言行而產生的經驗: 觀察制約(observational learning)

古典制約:正統條件化 • 俄國生理學家Ivan Pavlov（巴卜洛夫）發現並深入探討的正統條件化(classical conditioning) 歷程，才是真正重要的學習歷程。

講義139 • Pavlov研究唾液在消化歷程中的角色。他假設：唾液分泌是動物口腔對食物刺激的生理反射。 • 然而，Pavlov發現：「中性」刺激，在特定條件下，也會引起唾液反應。此一現象非生理學所能解釋。

正統條件化 Pavlov 的實驗

古典制約 條件反應的習得(講義140）

正統條件化 條件化歷程應具備之要件 • 無條件刺激(unconditioned stimulus,US)：無需其他條件就能引起特定反應(如流口水)的刺激。 • 無條件反應(unconditioned response,UR)：由無條件刺激所引發的反應。

條件刺激(conditioned stimulus,CS)：只有在特定條件下，可以引發原先只有US才能引發的反應之中性刺激。 • 條件反應(conditioned response,CR)：由CS所引發的反應，跟UR是同類的，但在強度上稍弱一點。

古典制約 聯結論（課本ｐ１８５）　 • 有些心理學家喜歡用聯結（association），這個字眼來指稱正統條件化歷程。他們認為，條件化的結果是使得CS與US在受試者腦中發生聯結。 • 因此，行為主義的學習觀點被稱為聯結論（associationism）。

正統條件學習的三要素 • CS與US配對呈現 • CS先於US • 兩者的時間間隔不能太長 • 動物學到什麼? CS顯然預告US的來臨

正統條件化 條件反應的消除與自然恢復 (講義 141) • 消除程序是CS單獨出現（不再有US伴隨出現）的程序。 • 已被消除的條件反應，在休息一段時間後，會再度出現，只是強度比未消除前弱了一點。這個現象稱為條件反應的自然恢復（spontaneous recovery）。

正統條件化 正統條件化的學習曲線

古典制約 刺激的類化與辨別 (講義p141) • 除了原先的CS外，類似於CS的其他刺激是否也能引發CR • 這種「由類似刺激引發條件反應」的現象，稱為刺激類化(stimulus generalization）

刺激的類化與辨別 刺激的類化與辨別 • 類化反應也有它的缺點，比如說，「一朝遭蛇咬，十年怕草繩。」便是對蛇的過度類化反應。這種反應雖有助於對蛇類提高警覺，卻也造成不必要的緊張。

刺激的辨別 • 所謂刺激的辨別（stimulus discrimination），是學習針對不同的刺激（譬如，蛇與草繩）給予不同的反應。

高層制約 • 當制約刺激(CS)可以單獨引起制約反應(CR)，這時制約刺激可以當作非制約刺激（UCS) ，使它與另一個制約刺激配對出現，藉以建立另一個古典制約學習

正統條件化 高層制約

慾求的條件化與嫌惡的條件化（課本１９３） • 當我們使用食物、糖水等作為US時，由於這類刺激是受試者所慾求的，因此，這類的條件化稱為慾求的條件化（appetitive conditioning）。 • 使用電擊、令人害怕的巨響等作為US的條件化，則稱為嫌惡的條件化(aversive conditioning)

正統條件化 嫌惡的條件化 • Watson ＆ Raynor（1920）對未滿周歲的小亞伯進行實驗。每當小白鼠出現，亞伯高興的爬過去時，實驗者就以鐵棒敲出巨響，讓亞伯驚慌害怕。實驗進行沒幾次，小白鼠會引發亞伯的懼怕反應。 • 甚至對於任何毛絨絨的物品，都會驚慌害怕。

這個實驗有道德上的缺陷，卻為心理學增添了知識，讓我們了解，情緒反應的根源常是條件化經驗。這個實驗有道德上的缺陷，卻為心理學增添了知識，讓我們了解，情緒反應的根源常是條件化經驗。 • 你可能「沒來由的」討厭某人，事實上，它是「有來由的」——他可能曾與某個嫌惡刺激（aversive stimulus）發生聯結，或與某個討厭的人很像，使你對他產生厭惡的類化反應。

古典制約學習的應用(講義142) • 恐懼或焦慮的情緒 • 愉快情緒的學習 • 廣告行銷 • 生理的反應 • 以古典制約治療不適應行為

生理反應的舉例 • 對喝過糖精（CS）的老鼠注射抑制免疫力的藥物（US），能讓糖精具有抑制免疫力的功效。 • 果凍的甜味（CS）與促進殺手細胞活力的藥物（US）聯結，能使果凍擁有提升免疫力的功效。 • 這方面的研究叫心理神經免疫學（psychoneuroimmunology）。

以古典制約治療不適應行為 • 尿床的行為改變治療 • 睡在特製的床墊上 • 尿床後，床就會發出鈴聲(UCS) ，將小孩吵醒 • 尿床前，會有膀胱積尿的感覺(CS) ，都在鈴聲之前出現。 • 經過幾次連結後，CS就可以喚醒(CR)小孩起床上廁所。

古典制約的特點 • CR都是由自主神經系統控制的反應，不是我們所能隨意控制。 • 學習完全決定於外在條件，只要CS與US適當的配對，就會造成條件化。學習者是被動的，他的反應是由刺激所「引發」的，不是「自發」的。 • 我們日常生活中大部分的學習卻不是這樣的。

操作制約學習(講義145) • 古典制約學習無法解釋許多行為: 例如海豚跳躍表演 • 心理學家開始研究動物” 解決問題的能力” • 先驅性研究：Thorndike的難題箱(puzzle box)實驗。

操作的條件化 (講義143)

Thondike實驗的理論重點(講義144) • 學習是嘗試錯誤（trail-and-error）歷程 : 不斷嘗試錯誤，最後學會做出正確的反應 • 效果律(law of effect)：行為是否持續出現，決定於它的效果。

Thondike實驗的理論重點(講義145) • 練習律: 隨著練習次數增加，正確反應與刺激間產生多次的連結，稱為練習率 • 準備率: 個體要解決問題，身心準備狀態也是重要因素。如果個體注意力不集中，或沒有興趣去獲得酬賞物，則刺激與反應間就不容易產生連結

操作的條件化 Skinner的研究 • Thorndike的觀點在大約四十年後，在B. F. Skinner（史基納）手上大放異彩。他發展出許多精巧的技術，對行為作實驗分析，大大的擴展了行為研究的領域。

Skinner操作制約的主要論點(講義145) • 個體表現行為之後，如能獲得滿意的結果，則該行為就獲得強化(reinforce) 。因此該行為重複出現的機率會增多。

操作的條件化 Skinner的實驗分析 • Skinner的實驗儀器，叫Skinner箱(Skinner box)，可用來訓練鴿子或老鼠學會各種行為。

為何叫做”操作”制約 • 受試者在操作（operate）它的環境，所以Skinner稱這種學習為操作制約（operant conditioning）。

操作制約 • 從行為主義者的角度看，了解人的想法是多餘的。促成老鼠不斷壓桿的，不是它的任何想法，而是伴隨著壓桿動作而來的食物丸子（或其他獎賞物）。

Skinner 操作制約的學習理論（講義１４６） • 正強化作用(positive reinforcement):個體表現某種行為之後，如果能立即獲得酬賞物(reward)，該行為得到強化，個體再次表現該行為的機率增加 • 這個酬賞物稱為正強化物(positive reinforcer)：種類可能是食物、金錢、稱讚、優待、權力、成就感等

Skinner 操作制約的學習理論（講義１４７） • 負強化作用（negative reinforcement)：個體表現某種行為之後，立即終止其所厭惡的刺激，則該行為會得到強化，個體再度表現該行為的機率將隨之增加。 • 這個被終止的刺激稱之為負增強物（negative reinforcer)：可能包括電擊、處罰、嘲笑、嘮叨、罰錢等 • 因負強化物的消失，使個體的行為得到強化

懲罰 • 正懲罰(positive punishment): 個體表現某種行為之後，立即給予其所厭惡的刺激，則該行為會被抑制，個體再度表現該行為的機率將隨之減少 • 負懲罰(negative punishment): 個體表現某種行為，立即去除其所喜愛的刺激則該行為會被抑制，個體再度表現該行為的機率將隨之減少

強化與懲罰的區辨圖表

習得的無助感(講義147) • 如果個體嘗試各種行為，都無法終止厭惡的刺激，就可能學習到沒有希望的無助行為，這種現象稱為習得無助感( learned helplessness) ，習得無助感有可能導致憂鬱症

操作的條件化 穿梭箱 • 穿梭箱（shuttle box）是研究負面強化的儀器。它是隔成兩半的長方形箱子，中間有一道矮矮的隔間，它可以升起，以便將箱子的兩半完全隔斷。 • 它的地板是由金屬條組成的，因此可以通電。電路的設計是，當一邊通電的時候，另一邊就沒電。

強化時制：強化物出現的時間（講義１４７） • 行為出現後馬上出現增強物學習效果較佳 • 若過一段時間再給予增強，這種延宕強化，學習效果較差

學習歷程

學習歷程

Presentation Transcript

Learning and Lifelong learning

Learning:

Learning

LEARNING

LEARNING

Learning

Learning

Learning

Learning About Learning

Reinforcement Learning : Learning Algorithms

e-Learning B-Learning

Learning E-Learning: Introduction

learning

Blended Learning , Better Learning

Learning and Learning LiveCode

Learning styles Learning Preferences Learning Strategies

LEARNING

Learning

Deep Learning Feature Learning Representation Learning Generative Learning

LEARNING

Learning

Learning about learning