Condicionamento Operante
Condicionamento Operante
Condicionamento Operante
Tiago Azevedo06/08/20160
Por exemplo, quando um rato de laboratório pressiona um botão azul, ele recebe uma bolinha
de comida como recompensa, mas quando ele aperta o botão vermelho ele recebe um leve
choque elétrico.
Como resultado, ele aprende a pressionar o botão azul, mas evitar o botão vermelho.
Através da primeira parte do século 20, o behaviorismo havia se tornado uma grande força
dentro da psicologia. As ideias de John B. Watson dominaram essa escola de pensamento
desde o início. Watson focava nos princípios do condicionamento clássico , sugerindo que
poderia tomar qualquer pessoa, independentemente da sua origem e treiná-la para ser
qualquer coisa que ele escolhesse.
Sua teoria foi fortemente influenciada pelo trabalho do psicólogo Edward Thorndike, que
propôs o que chamou de lei do efeito. De acordo com este princípio, as ações que são seguidas
por resultados desejáveis são mais suscetíveis de serem repetidas, enquanto aquelas seguidas
por resultados indesejáveis são menos susceptíveis de serem repetidas.
O condicionamento operante se baseia em uma premissa bastante simples – ações que são
seguidas por reforço serão reforçadas e tem mais probabilidade de ocorrer novamente no
futuro. Se você contar uma história engraçada na classe e todo mundo rir, provavelmente você
vai ser mais propenso a contar essa história de novo no futuro.
Por outro lado, as ações que resultam em punição ou consequências indesejáveis serão
enfraquecidas e terão menos probabilidade de ocorrerem novamente no futuro. Se você
contar a mesma história novamente em outra classe, mas ninguém rir, desta vez, você vai ser
menos propenso a repetir a história novamente no futuro.
Tipos de comportamentos
Você não tem que aprender esses comportamentos, eles simplesmente ocorrem de forma
automática e involuntariamente.
Comportamentos operantes, por outro lado, são aqueles sob nosso controle consciente.
Alguns podem ocorrer espontaneamente e outros propositadamente, mas são as
consequências dessas ações que influenciam ou não as ocorrências futuras. Nossas ações
sobre o meio ambiente e as consequências dessa ação tornam-se uma parte importante do
processo de aprendizagem.
Skinner inventou dispositivos diferentes durante sua infância e ele colocou essas habilidades
para trabalhar durante seus estudos sobre o condicionamento operante. Ele criou um
dispositivo conhecido como câmara de condicionamento operante, na maioria das vezes
referida hoje como uma caixa de Skinner. A câmara era essencialmente uma caixa que poderia
conter um pequeno animal tal como um rato ou pombo. A caixa também continha uma barra
ou a chave que o animal poderia pressionar para receber uma recompensa.
Reforço
Reforçadores positivos são eventos favoráveis ou resultados que são apresentados após o
comportamento. Em situações que refletem o reforço positivo, uma resposta ou
comportamento é reforçada pela adição de algo, como elogio ou uma recompensa direta.
Punição
Punição positiva, por vezes referida como punição por aplicação, apresenta um evento
desfavorável ou resultado a fim de enfraquecer a resposta que se segue.
Punição negativa, também conhecida como a punição por remoção, ocorre quando um evento
favorável ou resultado é removido após um comportamento ocorrer.
Esquemas de reforço
Skinner também descobriu que, quando e com que frequência comportamentos eram
reforçadas desempenhava um papel na velocidade e força da aquisição. Ele identificou vários
diferentes esquemas de reforço:
Reforço contínuo envolve a entrega de um reforço cada vez que uma resposta ocorre.
Aprendizagem tende a ocorrer de forma relativamente rápida, no entanto, a taxa de resposta
é muito baixa. Extinção também ocorre muito rapidamente uma vez que o reforço é
interrompido.
Esquema de razão fixa são um tipo de reforço parcial. As respostas são reforçadas apenas após
a ocorrência de um número específico de respostas. Isso normalmente leva a uma taxa de
resposta bastante estável.
Esquema de intervalo fixo é outra forma de reforço parcial. Reforço ocorre apenas após um
certo intervalo de tempo decorrido. As taxas de resposta permanecem relativamente estáveis
e começam a aumentar à medida que o tempo de reforço se aproxima, mas lentas
imediatamente após o reforço tem sido entregue.
Esquema de reforço de razão variável também é um tipo de reforço parcial que envolve
reforçar o comportamento depois de um variado número de respostas. Isto leva a uma alta
taxa de resposta e as taxas de extinção lentas.
Esquema de reforço de intervalo variável é a forma final de reforço parcial que Skinner
descreveu. Esta agenda envolve a entrega de reforço após um período variável de tempo
decorrido. Isto também tende a conduzir a uma taxa de resposta rápida e lenta taxa de
extinção.
Referências
Domjan, M. (2003). The Principles of Learning and Behavior, Fifth Edition. Belmont, CA:
Thomson/Wadsworth.
Skinner, B. F. (1935) Two types of conditioned reflex and a pseudo type Journal of General
Psychology, 12, 66-77.
Skinner, B. F. (1953). Science and human behavior. New York: Simon & Schuster.
Posts relacionados: