Avance de Marco Teorico-1
Avance de Marco Teorico-1
Avance de Marco Teorico-1
LICENCIATURA EN PSICOLOGÍA
“PROGRAMA DE REFORZAMIENTO”
Comportamiento Operante
El condicionamiento operante lleva a cabo un proceso que resulta ser muy sencillo. Este
hace mención sobre cómo es que una conducta puede presentar efectos llamados
"reforzantes" generando que ocurra una vez más la misma conducta. Pueden
presentarse reforzadores positivos y negativos según sea necesario, cada uno actuará
de forma apropiada. El reforzador positivo fortalecerá cualquier conducta que la genere:
un premio hacia un niño por obtener buena calificación al finalizar el curso académico
será un reforzador positivo, ya que este ampliará la probabilidad de que suceda de nuevo
en próximos cursos, etc. Mientras que el reforzador negativo será capaz de fortalecer
cualquier conducta que lo restringe o modere: si a la persona le molesta el olor de la
basura en su casa, la acción de llevarla a un depósito para que la casa este limpia y tenga
3
un buen olor será una disminución que negativamente reforzará al sujeto puesto que cada
que su casa tenga un olor desagradable por la basura esté la sacará (Skinner, 1974).
Comportamiento Innato
La relación entre la conducta y los estilos serán llamados “reflejo”. Después de darle este
término se menciona que se le dio de esta manera por la anatomía y fisiología básica
siendo así un aproximado. Solo es una descripción, no es como tal una teoría o
explicación. De esta forma cuando un bebe realiza un acto como succionar por un reflejo
se piensa que evolucionó al realizar esto. Al inicio cuando los reflejos se estudiaban se
cuestionaba sobre la veracidad de este. Por lo que se pensaba que estos tienen lugar en
la psique o en el alma. por lo que generaron un análisis (Skinner, 1974).
La conducta refleja será aquella que tendrá un estímulo, que como ya lo mencionamos
anteriormente será involuntario, la conducta operante tendrá un reforzador negativo por
lo que tendrá como respuesta una conducta impetuosa (Skinner, 1974).
MARCO TEÓRICO
Programa de Reforzamiento
Un programa de reforzamiento es aquel en donde un sujeto recibe determinado refuerzo
o recompensa mediante la frecuencia de repetición para realizar una conducta esperada.
El sujeto se encarga de seguir determinadas reglas que indican el momento y forma en
el que se adquirirá la nueva conducta.
• Razón fija: Es aquel en el que el sujeto no obtiene el reforzador cada vez que
realiza la conducta; para ello, existe una serie de patrones con relación a cuando
se debe obtener (Castillero, 2019).
Es decir, la recompensa llega después de determinado número de respuestas
correctas; sin embargo, la actividad se reduce después del reforzamiento (Giraldo,
2019).
• Razón variable: Consiste en respuestas aleatorias, el reforzamiento varia de
ensayo en ensayo y el sujeto nunca sabe si su respuesta será recompensada. En
4
este, no existe un patrón establecido en el que se presenta el reforzador
(Castillero, 2019).
El reforzamiento de razón variable tiene una respuesta alta y constante, lo cual es
ideal para mantener determinada conducta (Giraldo, 2019).
• Intervalo fijo: Es aquel en donde se refuerza el comportamiento después de un
tiempo definido y no después de un determinado numero de respuestas.
La actividad aumenta cuando se está próximo al tiempo límite por lo que el
aprendizaje es de rápida extinción (Giraldo, 2019).
Intervalo variable: En este tipo de programa, se refuerza un comportamiento en
tiempos variables después de repetir la conducta esperada, presentando una tasa
de respuesta estable (Giraldo, 2019).
Las respuestas esperadas con respecto al tipo de programa que se emplee suelen ser
siempre distinta. Una de las principales diferencias con respecto a los tipos de programas
está relacionado a que los programas de razón tienden a superar a los programas fijos
debido a sus altas tasas de respuesta, mientras que los programas de razón variable
mayormente dan altas tasas de respuestas casi constantes (Prada, 2006).
Para este proyecto, el tipo de reforzamiento que será utilizado para el ratón será el
reforzamiento de intervalo fijo, ya que la respuesta esperada se refuerza únicamente
después de que ha transcurrido una cantidad establecida de tiempo después de un punto
de referencia o de entrega del reforzador o del inicio del ensayo.
Encadenamiento
Es una instalación de conductas en un determinado orden o secuencia (cadena); es decir,
es una secuenciación de fragmentos conductuales más simples en una sola conducta
compleja. Cada conducta de la cadena, excepto la última, compone o produce una señal
o estímulo discriminativo para la siguiente respuesta; cada conducta de la cadena,
excepto la primera, sirve de reforzador condicionado para la anterior (Bados y García,
2011).
5
El encadenamiento implica vincular, combinar comportamientos simples para formar
comportamientos más complejos o de orden superior, alcanzando potencialmente
diferentes reforzadores (o reforzadores potenciales). Lo que sucede en una cadena es
que la conducta se ordena de manera que el reforzador del eslabón anterior sirva como
estímulo característico de la siguiente respuesta, y así sucesivamente, hasta que la última
conducta conduce a la consecución del reforzador buscado en el último paso (Mairal,
2020).
Tipos
De acuerdo con Martin y Pear (1996/1999), se presentan dos modos básicos de instruir
una cadena de conductas. En el encadenamiento mediante tarea total donde se enseña
(ABCD), la persona ejecuta en cada ensayo, con más o menos ayuda, cada uno de los
componentes de la cadena (A, B, C, D) desde la apertura hasta un final, siendo reforzada
por ello, y sigue así ensayo tras ensayo hasta que es capaz de elaborar toda la cadena
sin ayuda alguna (Bados y García, 2011).
6
• Encadenamiento hacia adelante consiste en (enseña A, enseña AB, enseña ABC,
enseña ABCD). Inicialmente se enseña al mismo tiempo se refuerza el primer eslabón
de la cadena, luego la persona tiene que realizar los dos primeros, para después
realizar los tres primeros y así sucesivamente hasta aprender toda la cadena.
• Encadenamiento hacia atrás (enseña D, enseña CD, enseña BCD, enseña ABCD).
Se enseña inicialmente de esta manera se refuerza el último paso de la cadena, luego
la persona tiene que realizar los dos últimos pasos, después los tres últimos y así
hasta que se logra aprender toda la cadena (Bados y García, 2011).
Las distintas técnicas de encadenamiento no muestran que una sea mejor que otra sin
embargo suele predeterminar cual puede ser mejor para una situación en particular. Un
ejemplo de ello es la eficacia que presenta el encadenamiento hacia atrás y parece ser
esencialmente útil con personas que presentan deficiencias de lenguaje o que tienen
dificultades para obtener una conducta compleja mediante métodos tradicionales (Bados
y García, 2011).
Por otro lado, se enseña la cadena en el orden correcto para que cada paso siga
inmediatamente, no otro paso adelante o atrás. Se modela toda la cadena de
comportamiento describiendo verbalmente cómo se realizó cada paso antes de pedirle a
la persona que realice una acción. Luego se permite que la persona comience (la forma
en que comience dependerá del método de circuito utilizado). Si las secuencias son muy
largas o complicadas, divídalas en secuencias y patrones más cortos y repita las
7
instrucciones para cada secuencia. (Una vez que se aprenden todas estas secuencias,
se organizan para formar un circuito completo) (Bados y García, 2011).
En las primeras etapas, se usa el refuerzo (idealmente social, como elogios) para obtener
los pasos correctos de la cadena. Este aumento luego se reduce a medida que mejoran
las habilidades de las personas y solo se proporciona al final de la cadena (Bados y
García, 2011).
HIPÓTESIS
OBJETIVOS
Objetivo General
Demostrar que a través del programa de reforzamiento en cadena se puede lograr
modificar la conducta dirigida a metas.
Objetivos Específicos
• Reafirmar la vigencia de la Teoría de Skinner (condicionamiento operante).
• Reconocer la adquisición de aprendizaje por medio del reforzamiento.
• Identificar como influye la memoria en el proceso de condicionamiento.
8
PREGUNTAS DE INVESTIGACIÓN
JUSTIFICACIÓN
Los comportamientos con tales consecuencias se vuelven más probables a través del
proceso de condicionamiento operante, en este caso se utilizó la comida con el sujeto de
investigación como reforzador siendo por el cual a través de este fungiendo como
estímulo y con su presencia fortalezca la conducta o las respuestas de parte de la
especie.
9
Cabe señalar, que se ha demostrado su vigencia de manera extensa mediante
experimentos a nivel de laboratorio, siendo la primera teoría del aprendizaje basada en
un trabajo objetivo y metódico que intenta explicar los procesos de aprendizaje
individuales.
METODOLOGÍA
10
acierto; en ambos casos se regresa a la línea de inicio o salida. Toda la práctica
tiene un total de 30 a 45 minutos de duración.
• Reforzador: El estímulo utilizado en la práctica es el alimento “corn flakes”,
dividido en pequeños trozos para las 18 sesiones de cada práctica.
Descripción de la práctica
Por medio de la primera fase se realizó el registro de la conducta inicial y error de
conducta inicial del sujeto a primera instancia con el fin de que el sujeto en este caso el
ratón logre familiarizarse con el laberinto además de que reconozca el reforzador,
asimismo identifique la trayectoria correcta que tiene que recorrer para llegar al reforzador
acertando de manera exitosa.
Materiales de registro
Mediante hojas de registro y bitácoras se realiza la descripción de cada uno de los
ensayos del sujeto presentado. Se han desarrollado cuatro registros durante cuatro
sesiones. A excepción de nuestro equipo el cual hasta el momento solo obtuvo tres
registros debido a que en la primera sesión aún no se contaba con el instrumento a
trabajar el cual en este caso sería el laberinto para el sujeto. Sin embargo, no afecto esta
situación en las demás sesiones.
Durante cinco minutos el ratón estuvo explorando el laberinto para que comenzara a
familiarizarse con el nuevo lugar y así observar que camino prefería para así colocarle el
refuerzo. Posteriormente a los cinco minutos de exploración, se le regreso al lugar de
salida durante treinta segundos para iniciar con el condicionamiento. Todos los ensayos
cuentan con la misma rutina: treinta segundos de espera en la línea de salida, una vez
que ha salido y el ratón se marca el primer error, se cuentan dos minutos y se regresa a
la línea de inicio o salida.
11
En el primer ensayo, se presentó el primer error de conducta inicial al seguir la ruta
contraria de donde se encontraba el reforzador, se comenzó a contabilizar los dos
minutos esperando a que encontrara el reforzador, el cual era “chocokrispi”. Cuando
tomaba el camino en donde se encontraba dicho reforzador, solo lo pisaba o lo evadía,
no olfateaba ni miraba hacía donde estaba.
Para los cuatro ensayos siguientes paso exactamente lo mismo, solo evadía el reforzador
y durante el transcurso de los cinco ensayos en total, presentó cuatro errores en el ensayo
número cuatro y cinco errores en el ensayo número cinco. Asimismo, el ratón estuvo
constantemente haciendo sus necesidades, lo cual nos daba una muestra de nerviosismo
y por lo que se tuvo mucho cuidado e higiene para evitar que lo ingiriera.
Para el ensayo número seis, se le cambio el reforzador por una hojuela de “corn flakes”
que se tuvo que dividir para los ensayos faltantes. Asimismo, tuvo su primer ensayo
exitoso logrando comer la hojuela del nuevo cereal, indicándonos que el antiguo
reforzador “chocokrispi” no era el correcto y por lo tanto no llamaba la atención del ratón
y no mostraba avances durante anteriores ensayos.
En el ensayo número siete, tuvo tres errores consecuentes antes de volver a encontrar
el reforzador e ingerirlo, por lo que hasta la cuarta ocasión en este ensayo pudo tener la
conducta exitosa. Durante el ensayo número ocho no se presentó ninguna dificultad en
que el ratón encontrara la hojuela, por lo que se tuvo la conducta exitosa en el primer
traslado.
Los últimos dos ensayos fueron un poco menos tardados, ya que en el ensayo número
nueve solo presento dos errores y posteriormente encontró el reforzador. Para el ensayo
número diez, que fue el último, no presento ningún error teniendo una conducta exitosa.
12
y el contacto; continuo a esto, se colocó en la entrada del laberinto para iniciar el recorrido
de exploración.
Para esta segunda práctica, el ratón estuvo explorando el laberinto durante tres minutos
previos a encontrar el reforzador. En esta ocasión se pudo identificar que se encontraba
un poco más tranquilo a diferencia del primer ensayo. Terminados los minutos de
exploración se reintegró al lugar de salida del laberinto contando 30 segundos para
comenzar con el condicionamiento.
En esta ocasión se realizaron dieciocho ensayos, los cuales se llevaron a cabo con la
misma rutina de treinta segundos de espera en la línea de salida, una vez que ha salido
se empezó a contabilizar cuantas veces tomaba el camino correcto en el cual se
encontraba el reforzador y marcando error o acierto de acuerdo con el camino que tomara
el ratón.
Para los primeros siete ensayos no presento errores o retardos para encontrar el
reforzador presentando una conducta exitosa, sin embargo, para el regreso a la línea de
salida se estuvo guiando ya que se mostraba confuso, esperando que en los próximos
ensayos posteriormente tuviera éxito para el regreso.
Pero al octavo ensayo se decidió dividir la hojuela del “corn flakes” con el fin de reducir
el tamaño, ya que el ratón comenzó a presentar una conducta alterada y nerviosa.
Durante este ensayo acertó el lado correcto del reforzador, sin embargo, no pudo terminar
de comerlo.
13
hasta el punto de casi salirse del laberinto, pero logrando el objetivo de comer el
reforzador.
Para el último ensayo, el ratón logro tener otro acierto, aunque de forma tardía. Para
finalizar se regresó el ratón a la línea de salida y posteriormente a su jaula, finalizando el
condicionamiento con 12 conductas exitosas durante los dieciocho ensayos
consecutivos.
Por último, durante la sesión número cuatro en un inicio, se tomó al ratón de su jaula
directamente con la mano presentando algunas fallas ya que el sujeto se encontraba
escondido y cuando se intentó tomarlo colocó un poco de resistencia de momento,
aunque después se logró tomarlo de una manera fácil e inmediata permitiéndonos
trasladarlo al laberinto de manera sencilla.
Durante tres minutos el ratón estuvo explorando el laberinto para que por medio de la
familiarización existente lograra llegar al reforzador cuando este se le presentara.
Posteriormente a los tres minutos de exploración, se le regreso al lugar de salida durante
treinta segundos para iniciar con el condicionamiento. Todos los ensayos cuentan con la
misma rutina: treinta segundos de espera en la línea de salida, una vez que ha salido y
el ratón se marca el primer error, se cuentan dos minutos y se regresa a la línea de inicio
o salida.
Para el cuarto ensayo acertó, pero pudimos observar que el sujeto se llevaba el
reforzador a una distancia diferente de donde se encontraba para después ingerirlo.
Durante los siguientes siete ensayos no presento ningún error, acertando de manera
exitosa. En el ensayo número doce y trece cometió un error para después regresar al
camino del reforzador logrando un acierto.
14
Durante los ensayos faltantes tuvo conductas iniciales de éxito logrando comer la hojuela
del cereal satisfactoriamente. Los ensayos en esta sesión fueron notoriamente
inmediatos demostrando un avance en la conducta del ratón.
15
REFERENCIAS
16