ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 강화와 처벌 : 정적강화, 부적강화, 정적처벌, 부적처벌
    김학성의 심리학 이야기 2022. 4. 21. 21:41

     고전적 조건형성에 대해서는 내 블로그에서 충분히 다룬거 같고.. 이제는 도구적(조작적) 조건형성 위주로 글을 써볼랑께 잘 보숑~~

     

     원래는 동기에 대해서 글을 쓸라고 했는데..

     내 포스트를 보니까 정적, 부적 강화, 처벌에 대한 글이 없드라구.. 그래서 기본적인 거니까 정리하고 넘어갈게!

     결국 강화와 처벌이 4부까지 연장됐네.. ㅋㅋㅋㅋ

     

     그리고 내 블로그 안에서만이라도 용어의 확립이 필요할거 같아서.. 매번 도구적 혹은 조작적 조건형성 이라고 길게 쓰는게 넘 귀찮아.. 구글에서 Operant Conditioning (조작적 조건형성) 으로 검색하면 검색 결과가 약 1,570,000개가 나오고,  Instrumental Conditioning (도구적 조건형성) 으로 검색하면 18,900,000개가 나오드라구. 도구적 조건형성이 10배 이상 많지? ㅋㅋㅋ 내 블로그에서는 세계적 흐름의 따라 조작적 조건형성이 아닌 도구적 조건형성으로 용어를 통일하도록 할게.

     하지만! 도구적 조건형성과 조작적 조건형성의 의미는 꼭 알고 있어야 돼. 간단하게 정리하고 넘어갈까? 전에 어떤 분이 댓글로 둘의 차이가 뭐냐고 물어 보셔가지고.. 간단하게 복습하고 넘어갈게!

     다 알고 있는 사람은 굳이 안읽어도 됨. 강화와 처벌 마지막 포스트니까 정리하고 넘어감..

     

     도구적 조건형성
     도구적 조건형성에서 '도구'라는 말을 우리가 사용하는 칼이나 가위 같은 도구(Tools)로 이해하면 안돼. 여기서 도구란 Instrumental의 뜻 중 '수단'의 뜻으로 해석하는게 가장 좋아. 무슨 수단 일까? 바로 보상을 위한 수단이지.
     도구적 조건형성

     쏜다이크 Thorndike 의 문제상자를 기억해 봐. 고양이가 문제 상자를 빠져나오기 위해 왔다갔다 하다가 우연히 레버를 건드리게 되고 맛있는 먹이를 먹을 수 있게 되지? 그 다음번에 문제상자에 들어갔을 때도 레버를 건드리면 문이 열리게 돼. 이 과정이 반복되면 고양이는 '아, 레버를 건드리면 문이 열리는 구나!' 하고 학습하는거지. 그래서 다음 번에 문제상자에 들어갔을 때에도 고양이는 레버를 건드릴거야. 레버를 건드리는 행동이 강화 된 것이지.

     여기서 도구는 뭘까? 보상은 맛있는 먹이일테고..

     고양이가 문제상자를 빠져나오기 위해 장치를 건드려야만 문제상자를 빠져나와 먹이를 먹을 수 있지? 바로 그 행동이 '도구'야. 상자를 빠져나오기 위한 '수단적 행동'이 되는거지.

     

     조작적 조건형성

     조작적 조건형성의 '조작'은 'Operant' 인데, 움직이고, 행동하고, 작용하고, 자발적이고.. 사전을 찾아보면 이런 뜻이야.

     스키너 박스 기억나? 불빛이 보이면 쥐가 레버를 눌러서 먹이가 나오는 박스 말야. 이 상자에서도 마찬가지로 쥐가 레버를 눌러야 먹이를 먹을 수 있지. 쥐가 자신이 레버를 누르는 '조작'을 가해야 먹이를 먹을 수 있는 거지.

     도구적 조건형성이랑 비슷하지? 행동이 도구적 수단이 되어 보상물을 얻는 것 말야. 그래서 도구적 조건형성이랑 조작적 조건형성이 그놈이 그놈인거야!

     

     그래서! 도구적 조건형성의 목적은,

     어떤 행동을 더 많이 하거나 하지 않게끔 강화와 처벌을 사용하는 것이지! 어떤 걸로? 강화물(보상물, 유인물)로!

     

     그런데!! 이런 강화와 처벌에도 종류가 있다는 사실!!

     네가지나!!

     강화계획에서 고정, 변동, 비율, 간격 조합으로 네가지 강화계획이 있다고 배웠잖아?

     이것과 더불어 가장 헷갈리는게!! 바로!!

     

     정적 강화

     부적 강화

     정적 처벌

     부적 처벌

     

     여기서 강화물이란 좋은 것이 될 수도 있고 나쁜 것이 될 수도 있어. 행동이 어떻게 변화하는지에 따라서 강화물의 성격을 정해야 하니까 무조건 어떤 강화물이 좋은 강화물이다! 나쁜 강화물이다! 라고는 하면 안돼!

      

     -

     

     외우기 제일 쉬운 방법은,

     '정적'이 들어간 놈들은 '강화물'이 제공된다는 것이고,

     '부적'이 들어간 놈들은 '강화물'을 철회한다는 것이야.

     '강화'가 들어간 놈들은 어떤 행동을 더 많이 하게 끔 하기 위함이고,

     '처벌'이 들어간 놈들은 어떤 행동을 덜 하게 끔 하기 위함이야.

     

     이거만 알고 있으면 나머지는 조합하기만 하면 되지..

     

     -

     

     정적 강화 Positive Reinforce

     강화물을 제공해서 행동을 증가 

     

     정적 강화는 우리가 기존에 알고 있던 거 그대로야. 다른 설명이 필요 할까?

     스키너 박스나 쏜다이크의 문제 상자 또한 대표적인 정적 강화야.

     쥐가 레버를 누르는 행동을 증가 시키기 위해 먹이라는 강화물을 제공 하는거지..

     쉽지?

     

     -

     

     부적 강화 Negative Reinforce

     강화물을 없애서 행동을 증가

     

     이게 뭔소리야? 할테지? ㅋㅋㅋㅋ

     강화물을 없애서 어떤 행동을 증가 시키는거야. 아니 이게 뭔소리야.

     여러분!! 강화물이 뭘까요? '어떤 행동을 증가 시키기 위한 유인물' 이지요?

     긍정적 이미지 일까 부정적 이미지 일까?

     대부분 '강화물'을 '긍정적' 이미지와 연관 지어. 하지만! '강화물'은 행동만 증가/감소 시킬 수 있다면 그 어떠한 '자극물'도 '강화물'이 될 수 있는거야. 강화물 자체는 행동을 증가 시키는 자극물 일 뿐이지 그 자체가 절대적으로 긍정정 성격을 띄고 있는 것이 아니라는 것!! 꼭 기억해!! 사람마다 다를수도 있어!!

     

     그럼 예를 들어 볼게.

     쥐를 상자에 넣을거야. 이 상자의 바닥에는 전기가 흘러서 쥐의 발이 바닥에 닿으면 쇼크가 오는거지. 아프겠다.. 근데!! 벽에 있는 레버를 건드리면 전기가 끊기는거야. 쇼크가 없어지는 거지.

     그럼 쥐는 어떻게 할까? 전기충격을 받지 않기 위해 레버를 눌러야 겠지?

     여기서 전기충격은 강화물이 될거야. 레버를 누르는 행동에 대한 강화물. 이제 감이 와?

     

     사람에게는 어떻게 적용될까?

     엄마의 잔소리(강화물)를 듣지 않기 위해 방 청소(행동)를 하는 것,

     선생님에게 꾸지람(강화물)을 듣지 않기 위해 공부(행동)를 하는 것..

     무수히 많겠지?

     

    -

     

     정적 처벌 Positive Punishment

     강화물을 제공해서 행동을 감소

     

     이번엔 처벌이야. 처벌은 기본적으로 행동 감소가 목표야. 그런데!! 강화물을 제공해서 행동을 감소 시킨다니??

     잊지 말 것은, 강화물 자체는 행동을 증가/감소 시킬 수 있다면 모든 자극물이 강화물이 될 수 있다는 거지. 꼭 좋은 강화물, 나쁜 강화물 할 것 없이 말야. 앞에서 말한 것 처럼 절대적으로 좋다 나쁘다 라고 할순 없어!

     예를 들어볼게.

     쥐가 앞발을 비비는 행동을 하는게 싫어졌다고 생각해봐. 앞발을 비비는 행동을 감소 시키고 싶으니까 일단 처벌이 되겠지? 어떻게 하면 좋을까? 앞발을 비빌 때 마다 전기충격을 주면 되지!! ㅋㅋㅋㅋ 잔인 하지만..

     앞발을 비비는 행동을 하면 전기충격(강화물)을 제공해서 앞발을 비비는 행동을 감소시키는 거야.

     

     사람에게는 어떻게 적용될까?

     컴퓨터 오락하는 시간을 줄이기 위해(처벌) 엄마가 잔소리(강화물)를 하는 것.

     코파는 행동을 줄이기 위해(처벌) 코를 팔 때 마다 꿀밤(강화물)을 쥐어 박는 것.

     직원들이 업무 시간에 딴짓 하는 것을 줄이기 위해(처벌) 딴짓을 하면 상사의 잔소리 폭격(강화물)을 주는 것.

     

     등등이 있겠지..

     강화물이 꼭 부정적 자극물일 필요는 없어!! 행동을 증가/감소 시킬 수만 있으면 그 어떤 자극물도 강화물이 되는거야!!

     

    -

     

     부적 처벌 Negative Punishment

     강화물을 없애서 행동을 감소 시키는 것

     

     부적 강화와 마찬가지로 강화물을 빼았는거야. 하지만 부적 강화는 행동 증가가 목표 이지만, 부적 처벌은 행동 감소가 목표 이겠지?

     

     쥐가 앞발을 비비는 행동을 감소 시키고 싶어.

     어떻게 할까?

     쥐가 앞발을 비빌 때 마다 상자 안에 들어있는 산소를 다 없애버리는 거야. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

     그럼 앞발을 비빌 때 마다 숨이 막히겠지?

     쥐가 레버를 누르는 행동을 없애고 싶으면?

     레버를 누를 때 마다 갖고 있던 먹이를 빼앗아 버리는거야. ㅋㅋㅋㅋ 잔인하다

     

     사람에게는?

     컴퓨터 오락하는 시간을 줄이기 위해(처벌) 컴퓨터 오락을 하면 갖고 있던 용돈(강화물)을 뺐는 것.

     코파는 행동을 줄이기 위해(처벌) 하루동안 코를 파면 밥(강화물)을 안주는 것.

     직원들이 업무시간에 딴짓 하는 것을 줄이기 위해(처벌) 딴 짓을 하면 월급(강화물)을 깎는 것... 이게 제일 잔인하다.

     

    -

     

     2020년 1월 31일 추가 내용

     이해를 돕고자 내용을 추가합니다.

     

     도구적 조건형성에서는

     보상 rewarding, 쾌 pleasant 그리고 욕구 증진 appetitive 자극 stimulus과

     혐오 aversive, 불쾌 unpleasant 그리고 유해 noxious 자극

     에 대한 강화물을 말하고 있습니다. 보통 긍정적인 것과 부정적인 것으로 나뉘는데 도구적 조건 형성 자체가 정적 positive, 부적 negative를 나누고 있기 때문에 긍정과 부정이라는 용어를 또 사용할 순 없겠죠.

     어떤 용어라도 좋으나 자극 자체에 대한 절대적인 분류는 할 수 없겠습니다.

     

     욕구를 증진 할 수 있으면 통상적으로 불쾌하다고 생각하는 자극도 강화물이 될 수 있습니다. 예를 들어 페인트 냄새, 수영장 락스 냄새, 병원 냄새, 아주 매운 음식 등.. 사람과 상황에 따라 어떠한 자극이라도 욕구를 증진 시킬 수 있으면 욕구 증진 자극이 될 수도 있고 아니면 유해 자극이 될 수도 있습니다. 너무 고정적으로 'a라는 자극은 쾌자극이고 b라는 자극은 혐오자극이다!' 라고 생각하지는 말아주세용~

     

     암튼 부적 처벌과 부적 강화에서는 '유해 자극'에 대해 말하고 있습니다. 저는 '유해 noxious'를 생략하고 '자극 stimulus'이라고만 하였는데 도구전 조건형성의 목적이 행동의 확률을 증가 혹은 감소 시키는 것이 목적이기 때문에 행동과 증가에 초점을 맞추고 자극을 판단해야 하기 때문입니다. 앞서 말씀드렸 듯이 어떤 자극 하나만 놓고서는  이 자극이 욕구 증진 자극이 될 지, 유해 자극이 될지 모르기 때문입니다. 심지어 신체적 고통 마저 누군가에게는 욕구 증진 자극이 될 수 있으니까요..

     

     그리고! 사실 부적 강화에는 두 종류가 있습니다. '도피 Escape'와 '능동적 회피 Active Avoidance'입니다. 부적 강화 자체를 '도피'라고도 합니다. 사실 이 주제는 '도피 학습 Esapce Learning'등에서 다루어야 하는데.. 부적 강화에 대한 내용 보완으로 추가합니다.

     

      엄마의 잔소리가 혐오 자극이고, 숙제하는 행동을 증가시키고자 한다면

     

     '도피'는 혐오 자극을 철회해서 행동을 증가시키는 것을 뜻 합니다. 부적 강화 그 자체 이지요? 그래서 부적 강화를 '도피'라고도 합니다.

     들려오는 엄마의 잔소리를 도피하기 위해 숙제하는 행동을 하는 것이 되겠네요. 

     

     '능동적 회피'는 혐오 자극을 피하기 위한 행동 증가를 뜻하는데요, 만약 어머니께서 "너 6시까지 숙제 다 안해 놓으면 잔소리 들을 줄 알아!" 라고 하셨을 때 학성이는 어머니의 잔소리를 피하기 위해 6시 이전에 숙제를 다 해야 할 것입니다.

     

     '도피'는 강화 하고자 하는 행동을 하면 혐오 자극이 철회 되는 것이고,

     '능동적 회피'는 혐오 자극을 회피 하고자 행동을 하는 것 입니다. 

     

     -

     

     강화 - 행동 증가, 처벌 - 행동 감소

     정적 - 강화물 제공, 부적 - 강화물 철회

     행동의 증가/감소만 가능하다면 어떠한 자극물도 강화물이 될 수 있다는거!!

     

     이렇게 외우면 헷갈리지 않겠지?

    -

     

     도구적 조건형성 정적 (강화물 제공) 부적 (강화물 철회)
    욕구 증진, 보상, 쾌 자극 보상 자극 제공 : 정적 강화 보상 자극 철회 : 부적 처벌
    유해, 혐오, 불쾌 자극 혐오 자극 제공 : 정적 처벌 혐오 자극 철회 : 부적 강화
    (도피, 능동적 회피)

     

     

     

     마지막은 간단한 예시로 정리한 표입니돵..

     사실 위에 있는 글 다 필요 없고 이 표만 알고 있으면 됨...ㅋㅋㅋㅋ 근데 난 왜 이렇게 길게 적었을까.. ㅠㅠ

     안뇽~~

     

     

     

    -

     

     제 네이버 블로그에서 가져왔어용~

     

     

Designed by Tistory.