Иллюстрация: mundosanto.com

Пока я писала эту статью, открыла Facebook сорок два раза. Во-первых, там могли появиться личные сообщения. Во-вторых, комментарии к моему последнему посту. В-третьих, лайки к моим комментариям. В реальной жизни хоть что-то из вышеперечисленного обнаружилось только в 11 случаях из 42. Это соотношение близко к оптимальному. Так и задумано. Cоздатель Facebook Марк Цукерберг не зря изучал в Гарварде психологию. При манипуляциях мной цинично используется психологический эффект под названием intermittent reinforcement – прерывистое, или вариативное подкрепление. Когда я не уверена в том, что в Facebook будет что-нибудь новенькое, мне особенно интересно его открывать, я делаю это намного чаще, и радуюсь новостям сильнее.

Я мало отличаюсь от голубя

Белая голубка не только символ мира, но и любимое экспериментальное животное американских бихевиористов, так что к семидесятым годам уже было вполне понятно, как с ней обращаться. Чтобы голубка стремилась заслужить награду, она должна хотеть есть. Это обеспечивается за счет диеты, на которой вес птицы падает до 80% от нормального. Затем вечно голодную голубку помещают в экспериментальную камеру.
Теперь голубке предстоит выбор между двумя кнопками. При нажатии на первую кнопку всегда загорается белая лампочка, и в кормушку падает зерно. При нажатии на вторую возможны варианты: либо загорится зеленая лампочка и появится зерно, либо загорится красная лампочка, а потом на четыре секунды вырубится свет. Каждая экспериментальная сессия продолжается до тех пор, пока птица не добудет сорок зерен. Кнопки периодически меняют местами, чтобы голубь не привыкал все время нажимать только на левую или на правую.
Пока обстановка новая и неизученная, голубь нажимает на обе кнопки с равной вероятностью. Но с каждой следующей сессией соотношение изменяется. Подопытные птицы все чаще и чаще нажимают на ту кнопку, которая им больше нравится. И нет, это не «высокоэффективная» кнопка, которая приносит еду всегда.

Голуби предпочитают «низкоэффективную» кнопку, которая приводит к получению еды менее чем при половине попыток. К пятнадцатой экспериментальной сессии все птицы выбирают ее в 80–100% случаев.

После того как кнопки меняют местами, большинство птиц быстро разбирается в новой ситуации – и снова начинает выбирать ненадежную кнопку, чтобы трудиться с непредсказуемым результатом. Похоже, что в этом случае награда приносит им больше удовольствия.

От лабораторных экспериментов к цирковым выступлениям

Экспериментальная психология демонстрирует, что вариативное подкрепление оказывается более эффективным, чем постоянное, и для человека. Новорожденные младенцы быстро запоминают, что за поворот головы им полагается соска, и вертят головой значительно интенсивнее, когда к награде приводит не каждое движение. Дети от четырех до восьми лет тоже охотно нажимают на кнопки, когда количество наград не связано с интенсивностью работы прямым и очевидным образом. 

В одной из наиболее интересных работ на эту тему в качестве непредсказуемого приза использовались инъекции никотина (это действительно жутко эффективная штука, ведь он напрямую стимулирует систему вознаграждения в головном мозге). И люди, и животные, участвовавшие в экспериментах, были готовы бесконечно нажимать на рычаг, чтобы получить дозу никотина. Пока он и так поступал в кровь каждую минуту, люди и обезьяны ленились и вспоминали о необходимости нажимать на рычаг реже чем один раз в сто секунд. Чем реже были инъекции никотина, тем интенсивнее испытуемые давили на рычаг – когда пауза между инъекциями достигала 20 минут, они делали это уже по два раза в секунду.
Самый известный популяризатор вариативного подкрепления – это Карен Прайор, автор бестселлера «Не рычите на собаку». Она много лет занималась дрессировкой дельфинов, и заметила, что совершенно неэффективно подкреплять вкусной рыбкой каждый прыжок – в этом случае дельфины начинают прыгать кое-как, лишь бы отделаться. 

А вот если вознаграждать животное время от времени, за самые удачные прыжки, то оно будет стараться всегда.

С тех пор, как книга Карен Прайор была переведена на русский язык, рекомендация использовать вариативное подкрепление в дрессировке распространилась по всем тематическим сайтам. Чаще всего там подчеркивают, что хозяин животного может применять вариативное подкрепление неосознанно и во вред воспитанию – например, давать собаке кусочки со стола только раз в неделю, будучи уверенным, что в целом он отучает ее выпрашивать кусочки, а не поддерживает эту привычку.

Что все это означает на практике

Мозг очень хорошо умеет ждать и надеяться, это бы жизнелюбие – да в мирных целях! Чем больше мозг верит в то, что вот-вот случится что-нибудь интересное и приятное, тем интенсивнее он к этому стремится и тем больше усилий он готов прилагать. Этот факт нужно осознавать и грамотно использовать.
Крупных успехов в этом добились разработчики компьютерных игр и веб-интерфейсов. Любая игрушка и любой сайт должны поддерживать у пользователей надежду, что с ними скоро случится что-то хорошее. Каждый раз, когда ваш герой путешествует по карте, он может найти сундук с сокровищами – а может и не найти. Каждый раз, когда вы заходите на Slon, тут может найтись что-нибудь интересное – а может и нет. Надежда на то, что в следующий раз будет лучше, заставляет ходить еще и еще. Навязший в зубах пример – это азартные игры, в которых совершенно неизвестно, какой будет награда в следующий раз, и когда вообще она появится. 

На самом деле, природа этого кайфа – такая же, как в рыбалке, поиске грибов или автостопе: вот сейчас, еще немножко, и мне наконец повезет. 

Плохое и неправильное использование вариативного подкрепления – это делать время от времени те вещи, которые не надо бы делать вообще. Аллен Карр написал много спорных вещей, но в одном он, к сожалению, абсолютно прав: эпизодические сигареты – это плохой способ бросить курить. Срываясь два раза в месяц, вы и правда уходите от физиологической зависимости. Но проблема в том, что мечта о курении и тоска по сигаретам при таком раскладе будут существовать в вашей голове каждый день всю оставшуюся жизнь, а не затухнут через пару месяцев, как при полном отказе. То же самое с неконструктивными отношениями: если вы пошлете тупую влюбленную телочку к чертовой матери решительно и однозначно, то через два месяца она о вас уже и не вспомнит, а вот если вы из гуманизма будете раз в три недели с ней спать, то вы и правда испоганите ей всю жизнь.
С другой стороны, тот факт, что вариативное подкрепление эффективно поддерживает привычки, можно использовать и для закрепления каких-нибудь полезных действий. Для этого разработана целая психологическая система – «Habit Judo». Идея в том, что вы не просто вознаграждаете себя каждый раз, когда совершили утреннюю пробежку, вычесали шерсть коту или позвонили бабушке, – вы получаете непредсказуемое количество баллов, которое определяет компьютер, от одного до десяти. Настоящая награда, например шоколадка, полагается тогда, когда сумма баллов превысит заданное число. Вы точно не знаете, когда это произойдет, так что жизнь становится похожей на компьютерную игру, и вырабатывать привычку становится интересно. По такому же принципу, кстати, работает система Like’n’Pay – кнопочка перед статьей, позволяющая перевести деньги любому автору Slon. Когда автор публикует статью, он понятия не имеет, заплатит ли за нее хоть кто-нибудь, и если да, то сколько – десять рублей или целую тысячу? Это делает процесс работы страшно увлекательным.