Теория оперантного обусловливания Б.Ф. Скиннера. Оперантное (инструментальное) научение Что такое бихевиоризм

(B.F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

Как уже и говорилось ранее, респондентное поведение - это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности - это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы ).

Реакция - это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения - это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперант-ной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно - оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей - выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием , все же многие родители упорно подкрепляют последний.

Подкрепление является одним из принципов обусловливания. Уже с младенческого возраста, согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов. Существуют два разных вида подкрепления. Некоторые, например еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого, одобрение, похвала) являются обусловленными подкреплениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.

Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают, например, пища, денежное вознаграждение, похвала. Тем не менее, Скиннер подчеркивает важность негативного подкрепления, которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие, психологическое давление. При наказании неприятный стимул следует за реакцией, уменьшая вероятность того, что реакция появится вновь. Скиннер с сожалением замечал, что наказание - "это самая распространенная техника контроля над поведением, применяемая в современном мире . Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу" (цит. по: Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. С. 241).
Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае, если подкреплять ее немедленно. Иначе реакция, начавшая было формироваться, быстро угаснет.

При оперантном, так же как и при респондентном, обусловливании наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожими на те, на которые первоначально был выработан условный рефлекс. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой-то одной собаки, положительная реакция ребенка (улыбка, произнесение слова "папа", движение на встречу и проч.) на всех мужчин, похожих на его отца .

Формирование реакции представляет собой процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия. Т.е. серия первоначально усвоенных действий в конечной форме воспринимается как целостное поведение.

Сам процесс поддерживается так называемым режимом подкрепления. Режим подкрепления - процент и интервал подкрепления реакций. Для исследования режимов подкреплений Скиннер изобрел ящик Скиннера (Skinner box), благодаря которому он наблюдал за поведением животных.

Схематически это выглядит так:
S1 - R - S2,
где S1 - рычаг;
R - нажатие на рычаг;
S2 - пища (подкрепление).

Поведение контролируется при помощи изменения условий среды (или подкрепления). Их, например, можно давать (1) через определенный промежуток времени, независимо от числа реакций; (2) через определенное число реакций (нажатие на рычаг) и др.

Режимы подкрепления

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое, или частичное, подкрепление.
Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо было выполнить соответствующую деятельность, во втором подкрепляют за объем той работы (количество действий), которая должна была быть произведена.

На основе двух параметров были описаны четыре режима подкрепления:

1. Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным количеством (объемом) реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ. Например, оплата труда переводчику за количество переведенных знаков, или машинистке за количество напечатанного материала.

2. Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

3. Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Так, покупка лотерейных билетов может быть примером работы такого режима подкрепления. В данном случае покупка билета означает, что с какой-то вероятностью может выпасть выигрыш. Вероятность возрастает, если покупается не один, а несколько билетов. Однако результат в принципе мало предсказуем и непостоянен, и человеку редко удается вернуть вложенные в покупку билетов деньги. Тем не менее неопределенность результата и ожидание большого выигрыша приводят к очень медленному затуханию реакции и угасанию поведения.

4. Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал. Подобно режиму подкрепления с постоянным интервалом, в этом случае подкрепление зависит от времени. Интервал времени произволен. Короткие интервалы, как правило, порождают высокую скорость реагирования, а длинные - низкую. Такой режим применяется в учебном процессе, когда оценка уровня достижений производится нерегулярно.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того, само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного может выступать в качестве подкрепления.

Рост и развитие личности

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. Эта же идея излагается Скиннером в книге "Вербальное поведение" (1957). Он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища или вода, а одобрение и поддержка взрослых.
С критическими замечаниями в адрес концепции Скиннера выступил в 1959 г. известный американский лингвист Н. Хомский. Он отрицал особую роль подкрепления в ходе овладения речью и критиковал Скиннера за пренебрежение синтаксическими правилами, которые играют роль в осознании человеком языковых конструкций. Он считал, что обучение правилам не требует особого учебного процесса, а совершается благодаря врожденному, специфическому речевому механизму, который называется "механизмом овладения речью". Таким образом, овладение речью происходит не в результате научения, а посредством естественного развития.

Психопатология

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

(1) Неусвоенная реакция или поведенческий дефицит возникает в результате отсутствия подкрепления при формировании необходимых навыков и умений. Депрессия также рассматривается как результат отсутствия подкрепления для формирования или даже поддержания необходимых реакций.

(2) Неадаптивная реакция - результат усвоения действия, неприемлемого для общества, не соответствующего нормам поведения. Такое поведение возникает как следствие подкрепления нежелательной реакции, либо в результате случайного совпадения реакции и подкрепления.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.
А. Изменение поведения может происходить вследствие самоконтроля.

Самоконтроль включает в себя две взаимозависимые реакции:

1. Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций ("уход" чтобы не выразить "гнев"; удаление пищи, чтобы отвыкнуть от переедания).

2. Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Б. Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.
Вольпе (Wolpe) определяет терапию поведения как терапию обусловливания, подразумевающую использование сформулированных в процессе экспериментирования принципов научения с целью изменения неадекватного поведения. Неадекватные привычки ослабляются и устраняются; адаптивные привычки, напротив, вводятся и усиливаются.

Цели консультирования:

1) Изменение неадекватного поведения.

2) Научение принятию решения.

3) Предотвращение проблем путем антиципации результатов поведения.

4) Устранение дефицита в поведенческом репертуаре.

Этапы консультирования:

1) Поведенческая оценка, сбор информации о приобретенных действиях.

2) Процедуры релаксации (мышечная, вербальная и т.д.).

3) Систематическая десенсибилизация - связь расслабления с образом, вызывающим тревогу.

4) Тренинг ассертивности

5) Процедуры подкрепления.

Достоинства и недостатки теорий научения

Достоинства:

1. Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

2. Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

3. Прагматический подход к терапии позволил создать важные процедуры для изменения поведения.

Недостатки:

1. Редукционизм - сведение принципов поведения, полученных на животных, к анализу поведения человека.

2. Низкая внешняя валидность вызвана проведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

3. Игнорирование когнитивных процессов при анализе S-R связей.

4. Большой разрыв между теорией и практикой.

5. Поведенческая теория не дает стабильных результатов.

Основной предмет

исследования Внешне наблюдаемое, доступное наблюдению и из-

мерению поведение человека

Методы исследования Наблюдение, экспериментальное научение в проблемном

ящике, экспериментальный анализ поведения

Основные понятия Поведение, респондентное и оперантное научение,

принципы обусловливания, подкрепление, поощрение

и наказание, режим подкрепления, модификация

поведения

Основные идеи Основное внимание - влиянию внешнего окружения.

Велико значение в жизни людей оперантного

научения, при котором поведенческие модели опре-

деляются их последствиями (характером подкрепления),

т.е. поведение объясняется в терминах стимулов

и подкрепляющих последствий. Поведенческие

реакции складываются постепенно и постоянно

Факторы развития Социальный фактор, научение

Ценное - Раздвигание рамок теории научения до более

сложных моделей оперантного поведения

Привлечение внимания к условиям социальной

среды, к характеристикам подкрепления поведения

индивида

Широкое практическое применение (модификация

поведения, оперантные техники для коррекции пове-

денческих проблем, программированное обучение)

Направления критики - Приписывание решающей роли в развитии чело-

века воздействиям окружающей среды

Принципиальный отказ от анализа внутренних

(психологических) факторов поведения, когнитивных

составляющих

Идеи Скиннера нашли достаточно широкое практическое применение. Стратегия успешного последовательного приближения и техники позитивного подкрепления составили основу методов модификации поведения индивида, бихевиоралъного тренинга. Среди конкретных областей их приложения - преодоление разнообразных страхов, тревожных и навязчивых состояний, перестройка деструктивного поведения, обучение навыкам общения, тренировка уверенности в себе, тренинг с биологической обратной связью в лечении тревоги, мигрени, мышечного напряжения и гипертензии. Применяются оперантные методики и к детям дошкольного возраста, и к пациентам психиатрических клиник, и к заключенным в тюрьмах. Широкую известность получили методики «жетонного вознаграждения», сенсибилизации и десенсибилизации, «выключенного времени», или «тайм-аута». Программированное обучение с использованием компьютера строится во многом на принципах, разработанных Скиннером. Многие специалисты признают эффективность «технологии строительства поведения», но подчеркивают при этом механистичность метода, авторитарные тенденции руководителя и игнорирование внутренних факторов развития (интересов, чувств, мыслей человека) и предостерегают от чрезмерно широкого применения этого метода.

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ:

1. Каковы закономерности формирования новых форм поведения (с позиции классического бихевиоризма)?

2. Каково соотношение биогенетических и бихевиористских идей в психологии?

3. Сравните обучение по законам классического обусловливания и оперантного научения.

4. Приведите примеры разных видов подкрепления нормативного поведения ребенка и взрослого.

5. Как решается проблема возрастной периодизации развития в поведенческой психологии?

6. Что такое модификация поведения?

7. В чем специфика бихевиорального подхода к проблеме социализации детей?

ЗАДАНИЕ 1

Прочитайте отрывок из статьи Дж. Уотсона «Бихевиоризм», выделите в тексте специфические для бихевиоризма понятия, ключевые положения, характерные для этого подхода, обращая внимание на их формулировки.

«Другими словами, бихевиоризм полагает стать лабораторией общества. Обстоятельство, затрудняющее работу бихевиориста, заключается в том, что стимулы, первоначально не вызывавшие какой-либо реакции, могут впоследствии вызвать ее. Мы называем это процессом обусловливания (раньше это называли образованием привычек). Эта трудность заставила бихевиориста прибегнуть к генетическому методу. У новорожденного ребенка он наблюдает так называемую физиологическую систему рефлексов, или, лучше, врожденных реакций. Беря за основу весь инвентарь безусловных, незаученных реакций, он пытается превратить их в условные. При этом обнаруживается, что число сложных незаученных реакций, появляющихся при рождении или вскоре после него, относительно невелико. Это приводит к необходимости совершенно отвергнуть теорию инстинкта. Большинство сложных реакций, которые старые психологи называли инстинктами, например, ползание, лазание, опрятность, драка (можно составить длинный перечень их), в настоящее время считаются надстроенными или условными. Другими словами, бихевиорист не находит больше данных, которые подтверждали бы существование наследственных форм поведения, а также существование наследственных специальных способностей (музыкальных, художественных и т.д.). Он считает, что при наличии сравнительно немногочисленных врожденных реакций, которые приблизительно одинаковы у всех детей, и при условии овладения внешней и внутренней средой возможно направить формирование любого ребенка по строго определенному пути» (Хрестоматия по истории психологии. Период открытого кризиса (начало 10-х годов - середина 30-х годов XX в.).

Дополнительная литература:

1. Выготский А.С. Предисловие к русскому переводу книги Э. Торндайка «Принципы обучения, основанные на психологии» // Собр. соч.: В 6 т. Т. 1. С. 177-195.

2. Линде Н.А. Психотерапия в социальной работе. М., 1992.

3. Рудестам К. Групповая психотерапия. М., 1993.

4. Хямяляйнен Ю. Воспитание родителей. М., 1993.

Глава VIII ПСИХИЧЕСКОЕ РАЗВИТИЕ РЕБЕНКА КАК ПРОБЛЕМА СОЦИАЛИЗАЦИИ: ТЕОРИИ СОЦИАЛЬНОГО НАУЧЕНИЯ

Термин оперантное обусловливание был предложен Б. Ф. Скиннером (1904- 1990) в 1938 году (Skinner, 1938; особенно см. Skinner, 1953). Он утверждал, что поведение животных происходит в окружающей их среде и повторяется или не повторяется в зависимости от его последствий. В соответствии с точкой зрения Торндайка эти последствия могут принимать различные формы, такие как получение вознаграждений за выполнение некоторых действий или осуществление некоторого поведения для избежания неприятностей. Многие виды стимулов могут выступать в роли вознаграждения (пища, похвала, социальные взаимодействия), а некоторые - в роли наказания (боль, дискомфорт). Выраженное в несколько резкой, крайней форме, но верное мнение Скиннера: все то, что мы делаем или не делаем, происходит из-за последствий.

Скиннер изучал оперантное обусловливание в лаборатории, главным образом в опытах с крысами и голубями. Например, несложно исследовать поведение крыс, нажимающих на рычаг или «педаль», что они с готовностью научаются делать для получения вознаграждения в виде пищи. Тогда можно манипулировать такими переменными, как режим и регулярность предоставления пищи (например, после каждого нажатия на рычаг, через определенное число нажатий), чтобы посмотреть, какие влияния окажут эти изменения на поведение крысы. Затем Скиннер сконцентрировался на характере нажатия на рычаг как функции непредвиденных обстоятельств различных типов, т. е. факторов, могущих заставить крысу нажимать рычаг быстрее, медленнее либо не нажимать вовсе.

В некотором смысле Скиннер повернул стрелки часов вспять, вернувшись к строгому бихевиоризму. На всем протяжении его почти шестидесятилетней и в высшей степени выдающейся научной карьеры он непреклонно отказывался использовать такие термины, как научение, мотивация, и какие-либо другие, обозначающие что-либо невидимое в объясняемом поведении. Он обосновывал это тем, что такие термины заставляют нас полагать, что мы понимаем что-то, чего на самом деле не понимаем. Его собственные слова звучали так:

Когда мы говорим, что человек ест, потому что он голоден... много курит, потому что он заядлый курильщик... или хорошо играет на пианино, потому что обладает музыкальными способностями, мы вроде бы имеем в виду причины поведения. Но подвергнутые анализу, эти фразы оказываются просто неправомерными (излишними) описаниями. Некий простой набор фактов описывается двумя утверждениями: «он ест» и «он голоден». Или, например: «он много курит» и «он заядлый курильщик». Или: «он хорошо играет на пианино» и «он обладает музыкальными способностями». Практика объяснения одного утверждения в терминах другого опасна, потому что она предполагает, будто мы нашли причину, а поэтому не нуждаемся в дальнейшем поиске (Skinner, 1953, р. 31).

Другими словами, такие утверждения образуют замкнутый круг. Как мы узнаем, что человек голоден? Потому что он ест. Почему он ест? Потому что он голоден. Однако многие исследователи указывали, что существуют пути выхода из этой ловушки, способы сохранить в научном обращении термины, описывающие внутренние, невидимые состояния или процессы. Мы уже отмечали один из них: использование представителями теории научения операциональных определений таких состояний, как голод. Тем не менее продолжаются дебаты относительно допустимой степени употребления подобных терминов.

Оперантное обусловливание Скиннера, с соответствующими ограничениями и оговорками (особенно в отношении людей), обсуждаемыми в главе 3 в контексте его анализа, стало считаться важнейшим способом, посредством которого окружающая среда влияет на наше развитие и поведение.

Американская психология – это психология научения.
Это направление в американской психологии, для которого понятие развития отождествляется с понятием научения, приобретения нового опыта. Большое влияние на разработку этой концепции оказали идеи И.П.Павлова. Американские психологи восприняли в учении И.П.Павлова идею о том, что приспособительная деятельность характерна для всего живого. Обычно подчеркивают, что в американской психологии был ассимилирован павловский принцип условного рефлекса, который послужил толчком для Дж.Уотсона к разработке новой концепции психологии. Это слишком общее представление. В американскую психологию вошла сама идея проведения строгого научного эксперимента, созданного И.П.Павловым еще для изучения пищеварительной системы. Первое описание И.П.Павловым такого эксперимента было в 1897 г., а первая публикация Дж.Уотсона – в 1913 г.
Разработка идей И.П.Павлова в американской психологии заняла несколько десятилетий, и каждый раз перед исследователями выступал один из аспектов этого простого, но вместе с тем еще не исчерпанного в американской психологии явления – феномена условного рефлекса.
В наиболее ранних исследованиях научения на передний план выступила идея сочетания стимула и реакции, условных и безусловных стимулов: был выделен временной параметр этой связи. Так возникла ассоцианистическая концепция научения (Дж.Уотсон, Э.Газри). Когда внимание исследователей привлекли функции безусловного стимула в установлении новой ассоциативной стимульно-реактивной связи, возникла концепция научения, в которой главный акцент был сделан на значении подкрепления. Это были концепции Э.Торндайка и Б.Скиннера. Поиски ответов на вопрос о том, зависит ли научение, то есть установление связи между стимулом и реакцией, от таких состояний испытуемого, как голод, жажда, боль, получивших в американской психологии название драйва, привели к более сложным теоретическим концепциям научения – концепциям Н.Миллера и К.Халла. Две последние концепции подняли американскую теорию научения до такой степени зрелости, что она готова была ассимилировать новые европейские идеи из области гештальт-психологии, теории поля и психоанализа. Именно здесь наметился поворот от строгого поведенческого эксперимента павловского типа к изучению мотивации и познавательного развития ребенка Бихевиористское направление также занималось проблемами возрастной психологии. Согласно бихевиористской теории, человек таков, каким он научился быть. Эта мысль дала повод ученым назвать бихевиоризм «теорией обучения». Многие из сторонников бихевиоризма полагают, что человек учится вести себя всю жизнь, но не выделяют каких-либо особых стадий, периодов, этапов. Вместо этого они предлагают 3 типа обучения: классическое обусловливание, оперантное обусловливание и обучение посредством наблюдения.
Классическое обусловливание – это простейший тип обучения, в процессе которого используются лишь непроизвольные (безусловные) рефлексы в поведении детей. Эти рефлексы у человека и животных являются врожденными. Ребенок (как и детеныш животных) в ходе обучения чисто автоматически реагирует на какие-либо внешние стимулы, а затем учится реагировать таким же образом на стимулы, несколько отличающиеся от первых (пример с 9-тимесячнымАльбертом, которого Райдер и Уотсон учили бояться белую мышь).
Оперантное обусловливание – это специфический тип обучения, который разработал Скиннер. Суть его заключается в тои, что человек контролирует свое поведение, ориентируясь на его вероятные последствия (положительные и отрицательные). (Скиннер с крысами). Дети перенимают у других различные формы поведения посредством методов обучения, особенно таких, как подкрепление и наказание.
Подкрепление – это любой стимул, увеличивающий вероятность повторения определенных реакций, форм поведения. Оно может быть позитивным негативным. Позитивным является подкрепление, приятное человеку, удовлетворяющее какую-то его потребность и способствующее повторению форм поведения, заслуживших поощрения. В опытах Скиннера позитивным подкреплением была пища. Негативным является такое подкрепление, которое заставляет повторять реакции неприятия, отторжения, неприятия чего-либо.
Сторонники бихевиористской теории установили, что наказание тоже является специфическим средством обучения. Наказание – это стимул, заставляющий отказаться от вызвавших его действий, форм поведения.
Понятия «наказание» и «негативное подкрепление» часто путают. Но при наказании человеку дается, предлагается, навязывается нечто неприятное или же у него отбирается нечто приятное, а в результате и то, и другое вынуждает его прекратить какие-то действия и поступки. При негативном же подкреплении убирается нечто неприятное с целью поощрения определенного поведения.
Обучение посредством наблюдения. Американский психолог Альберт Бандура, признавая важность обучения по типу классического и оперантного обусловливания, все же считает, что в жизни обучение происходит благодаря наблюдению. Ребенок наблюдает за тем, что делают, как ведут себя родители, другие люди в его социальном окружении и старается воспроизводить образцы их поведения.
Бандуру и его коллег, акцентирующих внимание на зависимости личностных характеристик человека от его способности учиться у окружающих, обычно называют теоретиками социального обучения.
Суть обучения посредством наблюдения состоит в том, что человек копирует чьи-то образцы поведения, не ожидая ни какого-либо поощрения или наказания за это. За годы детства ребенок накапливает огромную информацию о разлчных формах поведения, ъотя в своем поведении он может и не воспроизводить их.
Однако если он видит, что какие-то дела, поступки, поведенческие реакции других детей поощряют, то, скорее всего, он будет стараться копировать их. Кроме того, вполне вероятно, что он будет охотнее подражать тем людям, которыми он восхищается, которых любит, которые в его жизни значат больше, чем другие. Дети никогда не станут добровольно копировать образцы поведения тех, кто им не приятен, кто для них ничего не значит, тех, кого они боятся.
В опытах Э.Торндайка (исследование приобретенных форм поведения), в исследованиях И.П.Павлова (изучение физиологических механизмов научения) подчеркивалась возможность возникновения на инстинктивной основе новых форм поведения. Было показано, что под влиянием среды наследственные формы поведения обрастают приобретенными умениями и навыками.

Будучи ортодоксальным бихевиористом, Б.Ф. Скиннер отрицал все представления о том, что люди самодеятельны и их поведение определено предполагаемым существованием внутренних факторов. Отдавая должное глубине теоретических положений психоанализа, автор утверждал, что используемая терминология не позволяет давать рабочие определения и осуществлять эмпирическую проверку гипотез. Он считал необходимым тщательнее изучать условия среды, в которых формируется личность. Эти условия Б.Ф. Скиннер рассматривал как ключевой фактор, управляющий поведением человека.

В теории Б.Ф. Скиннера отсутствуют попытки изучения внутренних процессов и состояний личности. Автор утверждал, что человеческий организм – это "черный ящик", чье содержимое (мотивы, влечения, конфликты, эмоции и так далее) следует исключить из сферы эмпирического исследования . Следовательно, адекватные толкования можно сделать не обращаясь к каким-либо иным объяснениям, кроме тех, что отвечают за функциональные отношения между различными стимулами и наблюдаемыми поведенческими реакциями.

В отличие от представителей классической теории обусловливания (И.П. Павлов, Дж. Б. Уотсон), Б.Ф. Скиннер не делал акцента на важности нейрофизиологических факторов, отвечающих за поведение человека. Скиннер допускал, что поведение можно достоверно определить, предсказать и проконтролировать условиями окружения.

Признавая необходимость и значимость экспериментального исследования, Скиннер придерживался мнения о том, что определение влияния контролируемых переменных на обусловленный компонент поведения отдельного организма в контролируемом окружении важнее, нежели делать выводы о поведении несуществующего усредненного индивида.

Прерогативой подхода Б.Ф. Скиннера являлся функциональный анализ поведения организма: установление точных, реальных и обусловленных взаимоотношений между открытым поведением (реакцией) организма и условиями окружающей среды (стимулами), контролирующими их.Эти переменные должны существовать независимо от нас, быть очевидными и определяемыми количественно. Причинно-следственные отношения, проистекающие из функционального анализа, становятся всеобщим законом науки о поведении. Практической целью является возможность манипулирования переменными окружающей среды (независимыми), которые позволяют делать прогноз, и затем измерение поведенческой реакции (зависимые переменные) .

Структура. Формулируя идеи об устройстве личности Б.Ф. Скиннер опирался на классический бихевиоральный подход, изложенный в условно-рефлекторной терии И.П. Павлова и теории Дж.Б. Уотсона. Оба автора подчеркивали значение условных стимулов для формирования реакции организма и исключали значение промежуточных переменных (рис. 4).

Реакция

Рис. 7. Условно-рефлекторная модель поведения

Обусловливание поведения стимулами внешней среды, предшествующими этому поведению называется классическим или респондентным обусловливанием . Респондентное поведение обычно влечет за собой рефлексы, включающие автономную нервную систему. Однако респондентному поведению можно и научить.

Классическими в этом плане являются эксперименты И.П. Павлова, который, сочетая индифферентный стимул (звук) со значимым стимулом (пища), вызывающим безусловный рефлекс (слюноотделение), добился формирования реакции слюноотделения на первоначально индифирентный стимул. Новая реакция (слюноотделение на звук) получила название условный рефлекс.

В более поздних трудах И.П. Павлов отмечал, что при угасании условного рефлекса подкрепление (пища) значимо для сохранения респондентного научения.

Теория инструментального, или оперантного, обусловливания Б.Ф. Скиннера осталась в рамках прежней парадигмы «стимул–реакция (поведение)», однако подчеркнула значение событий, следующих за поведением (носящих также характер стимулов). Эти стимулы имели позитивный или негативный характер и играли роль в закреплении поведения или отказе от его повторения. В этой теории стимул приобрел функциональные качества подкрепления , повышающего силу реакции . Таким образом формула прежняя формула поведения была расширена (рис.5).

Рис. 8. Оперантная модель поведения

Обусловливание поведения стимулами внешней среды, следующими за этим поведением называется оперантным обусловливанием .

Б.Ф. Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. В основном на поведение воздействуют стимульные события, которые наступят после него, а именно – его последствия. Природа этого последствия изменяет тенденцию организма повторять данное поведение в будущем. Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Сила позитивного подкрепляющего стимула определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему. В случае неблагоприятных последствий вероятность получить оперант уменьшается. Следовательно, негативные, или аверсивные последствия ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их, через что и происходит научение. Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления – правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве случаев социальное поведение человека подкрепляется только иногда.

. Режим прерывистого подкрепления можно классифицировать в соответствии с двумя основными параметрами:

1) подкрепление может иметь место только после того, как истек определенный временной интервал с момента предыдущего подкрепления;

2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций. В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления:

– режим подкрепления с постоянным соотношением – организм подкрепляется по наличию заранее определенного числа соответствующих реакций (например, выплата заработной платы за количество произведенных действий);

– режим подкрепления с постоянным интервалом – организм подкрепляется после того, как установленный временной интервал проходит с момента предыдущего подкрепления (например, выплата денег за определенный период работы);

– режим подкрепления с вариативным соотношением – организм подкрепляется на основе какого-то в среднем предопределенного числа реакций (например, игра в рулетку).

– режим подкрепления с вариативным интервалом (ВИ) – организм получает подкрепление после того, как проходит неопределенный временной интервал (например, неожиданные контрольные работы для студентов) .

Различают два типа подкрепления – первичное и вторичное. Первичное подкрепление – это любое событие или объект, сами по себе обладающие подкрепляющими свойствами (пища, вода, физический комфорт, секс). Вторичное, или условное подкрепление – это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма (деньги, внимание, статус, отношения, оценки) . Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Существуют социальные подкрепляющие стимулы (определенное поведение других людей), действующие неявно, но влиятельно относительно подкрепления поведения в разнообразных ситуациях.

Согласно точке зрения Б.Ф. Скиннера, условные подкрепляющие стимулы очень важны в контроле поведения человека, и вероятно, каждый человек проходит уникальную науку научения. Подкрепление и наказание, будучи стимулами, регулирующими поведение, могут носить позитивный и негативный характер (табл. 8). Для закрепления реакции демонстрируемой реакции используются оба типа подкрепления, для отказа от демонстрируемого поведения – оба типа наказания.