Ta 2 Psicologia Experimental
Ta 2 Psicologia Experimental
Ta 2 Psicologia Experimental
TÍTULO
PRESENTADO POR:
CURSO:
PSICOLOGÍA EXPERIMENTAL
DOCENTE:
CHICLAYO, PERÚ
1
CAPÍTULO I: PLANTEAMIENTO DEL PROBLEMA
corto periodo de tiempo, lo que puede proporcionar datos significativos sobre los principios
Uno de los desafíos clave en este ámbito es determinar la eficacia del refuerzo
acción de presionar una palanca para obtener una recompensa (Domjan, 2015). La cuestión
2
1.2 Formulación del problema
1.3.1. Objetivo General: Determinar el efecto del refuerzo positivo sobre la conducta
- Determinar cuál es el efecto del refuerzo positivo sobre la conducta operante, a través
- Determinar cuál es el efecto del refuerzo positivo sobre la conducta operante, a través
- Determinar cuál es el efecto del refuerzo positivo sobre la conducta operante, a través
- Determinar cuál es el efecto del refuerzo positivo sobre la conducta operante, a través
- Determinar cuál es el efecto del refuerzo positivo sobre la conducta operante, a través
3
1.4 Justificación de la investigación
A nivel teórico, la investigación sobre los efectos del refuerzo positivo en sujetos
con sujetos biológicos, y gran parte de lo que se sabe sobre el refuerzo positivo proviene de
estos estudios (Skinner, 1938). Sin embargo, la incorporación de sujetos virtuales en estos
comparar los resultados obtenidos en sujetos virtuales con los hallazgos previos en sujetos
biológicos, se pueden identificar similitudes y diferencias que ayudan a refinar los principios
una serie de ventajas metodológicas significativas. Primero, permite un control preciso de las
Segundo, los experimentos con sujetos virtuales pueden ser realizados de manera más
tiempo y sin los mismos costos asociados a los experimentos con animales o humanos
4
principios del refuerzo positivo pueden ser aplicados para entrenar agentes de IA y robots
autónomos, mejorando su capacidad para aprender tareas complejas de manera eficiente. Esto
aprender de manera continua (Domjan, 2015). Al validar la eficacia del refuerzo positivo en
5
CAPÍTULO II: MARCO TEÓRICO
Antecedentes Internacionales:
Condicionamiento Operante:
mediante sus consecuencias. Desarrollado y sistematizado por B.F. Skinner, esta teoría se
basa en la idea de que las conductas que son seguidas por consecuencias favorables tienen
más probabilidades de repetirse, mientras que las seguidas por consecuencias desfavorables
acción para incrementar o reducir la probabilidad de que dicha acción se repita en el futuro.
Primero, se identifica la acción específica que se busca modificar, como enseñar a un perro a
sentarse. (Domjan, 2003) Luego, se determinan las consecuencias que seguirán a esta acción,
6
El reforzamiento se desglosa en positivo y negativo: positivo implica agregar algo
agradable después de la acción deseada, como dar una golosina al perro cuando se sienta,
mientras que negativo implica eliminar algo desagradable, como detener un ruido molesto
positivo implica aplicar algo desagradable después de la acción no deseada, como regañar al
perro cuando no se sienta, y negativo implica eliminar algo deseable, como quitarle un
juguete al perro cuando no se sienta. Una vez establecidas estas consecuencias, se aplican de
manera coherente cada vez que se observe la acción objetivo, para que el animal o la persona
asocien claramente la acción con sus resultados. Finalmente, se lleva a cabo una supervisión
continua de los cambios en la acción para evaluar la efectividad del proceso, utilizando
Refuerzo Positivo
después de que se realice una conducta, con el objetivo de aumentar la probabilidad de que
Refuerzo Negativo
probabilidad de que una conducta se repita. Este método implica retirar un elemento aversivo
Castigo positivo
Castigo negativo
7
El castigo negativo implica retirar un estímulo agradable para reducir la probabilidad
de que una conducta se repita. Este método consiste en eliminar algo placentero como
Programas de reforzamiento
una conducta. Este tipo de programas tienen una función importante en la conformación y el
continuos e intermitentes.
número de respuestas y dentro de este período de tiempo sucedió algún tiempo después de la
Ambos tipos de programas pueden ser fijos o variables, lo que demuestra esto el
puede ser constante o fluctuar alrededor del valor promedio. También pueden ser continuos o
intermitentes; Esto significa posibles recompensas ocurren cada vez que el sujeto realiza la
(Ferster & Skinner, 1957). El refuerzo continuo es más beneficioso para moldear la
más rápido danos una patita si le premiamos cada vez que nos da la patita, pero solo una vez
8
hemos aprendido este comportamiento, será más difícil que deje de hacerlo si se lo damos
Moldeamiento
(Skinner, 1957). Este proceso comienza identificando una acción que se parece a la conducta
objetivo y luego aplicando refuerzos cada vez que el sujeto realiza esta acción. A medida que
el sujeto se aproxima más a la conducta deseada, los criterios para recibir el refuerzo se
vuelven más estrictos, recompensando solo aquellas acciones que se asemejan aún más a la
conducta final. De esta manera, se guía al sujeto a través de pequeños pasos, refinando
Programas de razón
Los programas de razón son sistemas de reglas que determinan cuándo y cómo se
condicionamiento operante (Ferster & Skinner, 1957). Estas reglas dictan la frecuencia y el
Razón fija
Razón variable
Por otro lado, en un programa de razón variable (VR), el refuerzo se otorga después
9
Programas de intervalo
proporcionan refuerzos o castigos según el tiempo que pasa desde la última respuesta
(Domjan, 2003). Pueden ser de dos tipos: fijos, donde el tiempo entre recompensas o castigos
es constante, o variables, donde este tiempo varía, pero sigue un promedio constante.
Intervalo fijo
Intervalo variable
primera respuesta que ocurre después de un período de tiempo que varía, aunque con un
de que esa respuesta ocurra nuevamente en el futuro. Según Skinner (1953), el refuerzo
positivo fortalece una conducta al seguirla de manera contingente con un estímulo apetitivo.
Esto puede incluir recompensas tangibles como comida o recompensas intangibles como
elogios.
comportamiento que se emite por un organismo y que puede ser modificado por sus
10
consecuencias. Esta conducta es voluntaria y controlada por reforzadores o castigos en el
entorno del individuo. De acuerdo con Thorndike (1911), la ley del efecto establece que las
11
El refuerzo positivo aplicado a través del programa de razón variable en el
REFERENCIAS BIBLIOGRÁFICAS:
A., R. J., & G., G. S. C. (s/f). Análisis molar del comportamiento en contingencias de
2024, de https://www.redalyc.org/journal/2745/274571372002/274571372002.pdf
Chávez C., B., Huamani H., J., Castro C., L., Gonzales T., C., Manco V., S., & Chauca C.,
https://doi.org/10.56891/acpp.v8i2.399
12
Domjan, M. (2015). Principles of Learning and Behavior. Cengage Learning.
https://aulavirtual.ibero.edu.co/recursosel/documentos_para-descarga/Principios
%20de%20aprendizaje%20y%20conducta%20-%20Domjan%209th.pdf
Flores T.M, Gonzales C.A, Tapia O.J, Lopez R.G, Sandoval H.S. (2021). Refuerzo positivo
https://lamenteesmaravillosa.com/
https://d1wqtxts1xzle7.cloudfront.net/
https://revistas.unam.mx/index.php/acom/article/view/87198
https://www.bfskinner.org/newtestsite/wp-content/uploads/2014/02/ScienceHumanBe
havior.pdf
Century.https://www.researchgate.net/publication/313181463_The_behavior_of_orga
nisms_-_Skinner_BF
Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.
https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf
13
Thorndike, E. L. (1911). Animal intelligence: Experimental studies. Macmillan
Press. https://doi.org/10.5962/bhl.title.55072
358. https://doi.org/10.1037/h0045807
14