sábado, 31 de enero de 2015

Condicionamiento Operante de Skinner








Burrhus Frederick Skinner nació en Susquehanna (Pensilvania, USA) en 1904. En 1931 recibió el doctorado en psicologia en la Universidad de Harvard. Fue profesor de las universidades de Minnesota, Indiana y Harvard. Ha recibido varias distinciones de primera calidad: en 1958 la Asociación Americana de Psicología le otorgó el Premio a la Contribución Científica Distinguida; en 1968 el presidente de Estados Unidos le concedió el Premio Nacional de la Ciencia; en 1971 se Ie otorgó el Premio Kennedy por su investigaci6n en el retraso mental, y también en 1971 recibió la Medalla de Oro de la Fundación Americana de Psicología como reconocimiento a sus realizaciones científicas. Es considerado como uno de los más grandes psicólogos de todos los tiempos y el más grande exponente de la corriente conductista.

Skinner usa el método inductivo, parte de los datos empíricos y gradualmente, si los hechos lo permiten, llega a una generalización. Los datos observables deben ser identificados y establecidos claramente. Luego se sitúan en clases o categorías y se establecen leyes que representen sus interrelaciones. Por fin, se desarrollan conceptos de orden superior.

También Skinner entra por el principio del antirreduccionismo metodológicos: la tarea del psicólogo consiste en relacionar los datos observables de la conducta con el ambiente donde tienen lugar. No hay razón para referir sus datos a los datos procedentes de otros métodos de observación propios de otras ciencias. Para Skinner el ambiente es el gran "seleccionador" de la conducta. La selección que ejerce el ambiente se da sobre un organismo que tiene su historia particular, pertenece a una especie determinada, posee patrimonio genético propio y en el momento en que da la respuesta se encuentra en un estado de privación más o menos grande. La selección opera sobre el conjunto de estos datos.


 Skinner también nos habla de programas de reforzamiento, es decir, de las diversas maneras como se puede aplicar el refuerzo y los resultados obtenidos. Hay muchísimos programas de reforzamiento (Ferster y Skinner. 1957) pero aquí nos limitaremos a los 4 más simples: -
·        Refuerzo de razón fija: se refuerza un comportamiento después de un cierto número de respuestas. Por ejemplo: el dueño de la fábrica premia al obrero cada vez que Ie presenta 10 pares de zapatos terminados. El ejemplo se esquematizara RFIO (razón fija 10)
·        Refuerzo de razón variable: se refuerza un comportamiento al azar, pero en tomo a un cierto promedio. Así, por ejemplo, el dueño de la fábrica premia al obrero a veces cuando Ie presenta 15 pares de zapatos terminados. a veces cuando Ie presenta 25. a veces cuando Ie presenta 18, a veces cuando Ie presenta 22 ... el promedio sería 20. EI esquema del ejemplo sería RV20 (raz6n variable 20).
·        Refuerzo de intervalo fijoo: se refuerza un comportamiento después de un determinado tiempo, no después de un determinado número de respuestas. Ejemplo: al final de cada mes se Ie paga al obrero. Esquema: IFI (intervalo fijo 1). - Refuerzo de intervalo variable: se refuerza un comportamiento en tiempos variables, pero en torno a un cierto promedio. Ejemplo: después de dos meses de trabajo se da un premio extra at obrero, otras veces después de cuatro meses. otras veces después de 3 meses ... el promedio sena 3 meses. Se indicaría el ejemplo: IV3 (intervalo variable 3).

·        el Sr. B.F Skinner. Skinner, según lo escrito en su libro "Más allá de la libertad y de la dignidad" de 1971, tendiente a erradicar en nombre de la ciencia determinista y naturalista, la concepción tradicional de occidente, que ve en el hombre a un ser libre y responsable y afirma que la lucha del hombre por su libertad personal, no se debe a su inalienable voluntad, sino a una serie de procesos conductuales, característicos del organismo humano, cuyo principal efecto consiste en la tentativa de evitar lo que él llama caracteres aversivos del ambiente, recondicionando adecuadamente estos procesos conductuales. Así, la conducta no es ningún proceso interno, sino que es la acción del organismo ante las condiciones del mundo exterior, por esto considera Skinner que "no existe el hombre autónomo". La conducta, la cual es el objeto de estudio de Skinner, también hace posible relacionar al hombre con una vida social y armónica que proporciona al individuo seguridad y felicidad, por lo que él considera a la Libertad, no una ventaja sino más bien una amenaza. Su influencia de género neo-conductista, introdujo el concepto Condicionamiento operante; proceso mediante el cual se aumenta o disminuye la probabilidad de dar una respuesta, designando Skinner a esto como Reforzamientos, el cual consiste en un Estimulo Reforzante, que incrementa la posibilidad de un comportamiento, pudiendo ser éste negativo o positivo, dependiendo de la relación que el individuo tenga con el medio ambiente. Consiste en que un organismo haga algo influenciado por una serie de actos. En este trabajo, a pesar del extensísimo material existente, compilaremos brevemente su estructura, analizando los distintos tipos de refuerzos y factores que influyen en ellos; también sus programas de reforzamiento que pueden ser parciales o continuos. Skinner también plantea que toda la conducta humana es producto de reforzamientos, atribuyendo una importancia fundamental al aprendizaje aplicado a la educación y a la vida diaria. Por último, sabremos cuáles son las implicaciones didácticas, cuál es el aporte de esta teoría a la Educación tradicional, a través de los programas más significativos de reforzamiento, clarificando lo que Skinner planteaba al decir que el profesor es un “constructor de conductas”. Finalmente se realizarán observaciones a las objeciones y desacuerdos de esta teoría y se darán a conocer algunas diferencias con otras teorías.

Principios del Condicionamiento Operante (Skinner)

 ·        La expresión Condicionamiento Operante refleja el hecho de que el animal opera, o actúa, de acuerdo con el ambiente natural o el del laboratorio, para producir un efecto. El efecto producido determinará si el animal ejecuta de nuevo una respuesta, o si continuará comportándose como antes. El experimento llevado a cabo por Skinner fue el siguiente: para estudiar la conducta operante inventó la caja de condicionamiento operante: colocó a una rata blanca hambrienta (privada de alimento por 24 horas) en una caja bien aislada en la que se encuentra una palanca que puede ser accionada por el animal. Si la rata acciona la palanca, un dispositivo mecánico deja caer una bolilla de alimento al comedero instalado dentro de la misma caja dentro de la misma caja, cerca de la palanca. En un comienzo, el comportamiento del animal en la caja de experimentación es más o menos caótico: explora la caja y corre de aquí para allá, sin tocar la palanca. Al cabo de un tiempo, y por casualidad acciona la palanca y el alimento cae en el comedero p. La rata ingiere la bolilla y vuelve a accionar la palanca, repitiéndose lo sucedido anteriormente. El proceso se repite con insistencia y la rata corre sin cesar del comedero a la palanca. La característica esencial del condicionamiento operante reside en el refuerzo (alimento) que percibe la conducta operante (accionar la palanca). Para estudiar la conducta operante se inventó la caja de condicionamiento operante. Es una caja con una pequeña palanca en la pared y un dispensador de alimento o líquido que aparecerá cada vez que se presione la palanca. El esquema del condicionamiento operante es el siguiente: Estímulo Condicionado : Palanca dentro de la caja. 

Respuesta Condicionada : Accionar la palanca. Estímulo Incondicional : Bolilla de alimento Respuesta Incondicional : Comer así que esta teoría del aprendizaje intenta explicar la conducta que es nueva para el organismo, proponiendo que dicha conducta operante se adquiere debido a que las consecuencias que percibe el organismo aprendiz, aumentan o disminuyen la frecuencia de aparición de esas conductas. Definiendo términos, tendremos que la Conducta operante, es un comportamiento que es nuevo para el organismo porque no se encuentra programado en su código genético. El Evento reforzante trata de la entrega de algún estímulo del ambiente que satisface alguna necesidad del organismo que aprende (la entrega de un premio). Y el Estímulo reforzante, es un estímulo del ambiente que aplicado al organismo que aprende, tiene la capacidad de hacer que aumente la frecuencia de aparición de alguna conducta. Skinner estableció una serie de principios: - Las personas actúan (operan) en su medio natural. Su comportamiento siempre guarda relación con otros sujetos, hechos u objetos del entorno. Hay siempre unos antecedentes y unos consecuentes que influyen en las conductas. Con lo que si controlamos o modificamos unos u otros, podemos modificar las conductas de los sujetos. - Cualquier conducta de un sujeto puede llegar a repetirse con frecuencia si los resultados o consecuencias de la misma son satisfactorios. Un refuerzo es cualquier cosa que incrementa la aparición de una conducta. Un mismo acontecimiento puede ser reforzante para una persona y para otra no. - Se pueden distinguir entre refuerzos primarios y secundarios, así como refuerzos positivos y negativos: º Los refuerzos primarios son aquellos estímulos que poseen un valor reforzante natural para los sujetos sin necesidad de que éstos sean adiestrados para ser reforzados por ellos. Son, por ejemplo, un alimento, una bebida… º Los refuerzos secundarios son estímulos neutros que por asociación con los refuerzos primarios acaban por adquirir las propiedades reforzantes de éstos. Por ejemplo, cuando un padre le da a un hijo una golosina por hacer los deberes y le dice “muy bien”, poco a poco, estas palabras adquieren propiedades reforzantes. º Los refuerzos positivos son estímulos cuya presentación contingente a la respuesta aumenta la probabilidad de aparición de esa respuesta. Pueden ser primarios o secundarios. º Los refuerzos negativos son estímulos aversivos, cuya retirada contingente a la conducta, incrementa la posibilidad de que esta conducta se vuelva a repetir. También pueden ser primarios o secundarios. - Los programas de refuerzo pueden ser continuos o intermitentes. Si una conducta es reforzada cada vez que aparece, hablamos de un programa de refuerzo continuo. 

Si no es reforzada en todas las ocasiones que aparezca esa conducta, le estamos aplicando un programa de refuerzo intermitente. Cuando se genera una nueva conducta, se comienza con un programa continuo para ir poco a poco pasando de un programa intermitente hasta llegar a la presentación muy escasa de la recompensa. Eso sí, el refuerzo no debe retirarse totalmente porque si no la conducta se extinguirá. Hay que distinguir entre condicionamiento instrumental y condicionamiento operante. En el instrumental, las posibilidades de respuesta están restringidas por el experimentador, con lo que el animal o la persona tienen una oportunidad limitada de comportarse. En este caso es el ambiente el que limita las posibilidades de recompensa. En cambio, en el condicionamiento operante, es el animal o la persona las que pueden controlar la frecuencia de la respuesta y conseguir así la cantidad de reforzamiento que quieran. De manera que la educación es el aprendizaje de ciertas respuestas útiles para la vida. Vale acotar que ambos pueden ocurrir separadamente o en combinación para producir aprendizajes cada vez más complejos. Entonces, tenemos que el término de Condicionamiento Operante se debe a Skinner, y en el principio es equivalente al del aprendizaje instrumental propugnado por Thorndike. El término se refiere a un proceso en el que la frecuencia de suceso de la unidad de la conducta (respuesta) se modifica como efecto de las consecuencias que lleva aparejadas esa conducta. Además, el condicionamiento operante invierte la situación respecto al condicionamiento.

clásico, que pasa a ser R – E. Es el refuerzo experimentado como consecuente al comportamiento lo que ocasiona. Por ejemplo, la teoría del condicionamiento clásico de Pávlov, explica como los estímulos simultáneos llegan a evocar respuestas semejantes, aunque tal respuesta fuera evocada en principio sólo por uno de ellos. La teoría del condicionamiento instrumental u operante de Skinner describe cómo los refuerzos forman y mantienen un comportamiento determinado. En condicionamiento clásico, un estímulo neurológico se convierte en un reflejo asociado. El sonido de la campana, como un estímulo neurológico, se asocia al reflejo de salivación. En el condicionamiento operatorio el aprendiz "opera" en el entorno y recibe una recompensa por determinada conducta (operaciones). Eventualmente se establece la relación entre la operación (accionar una palanca) y el estímulo de recompensa (alimento). 


PROCEDIMIENTOS PARA REDUCIR O ELIMINAR LA CONDUCTA

Extinción Este procedimiento debe ser aplicado a cualquier conducta mal aprendida. Consiste en, una vez identificado el reforzador, suprimirlo para que tal conducta desaparezca gradualmente, es decir, en no dar la recompensa que la mantiene. La suspensión de reforzamiento debe ser completa; no se debe administrar nunca para esa conducta (si no estaríamos recompensando de “forma intermitente”, que como hemos visto antes es un procedimiento para mantener la estabilidad de una conducta). Será más efectiva cuando se preste atención positiva (se administren consecuencias positivas) a otras conductas alternativas a las que se quiere eliminar.
Cuando se utiliza éste método al principio se produce un aumento momentáneo de la conducta que precisamente se quiere eliminar. Hay que esperar a que pase este aumento inicial de frecuencia para observar la disminución gradual típica de la extinción. Por ejemplo, cuando llega una visita Alfonso hace “tonterías” y sus padres le dicen: “Estate quieto”, “Es que no paras ni un momento”, “Deja de hacer tonterías”, etc., proporcionándole recompensas de atención que hacen que la conducta de “hacer tonterí- as” aumente. Bastará con suprimir la atención que los padres prestan a ese comportamiento (y por el contrario prestarle atención a conductas contrarias positivas) para que Alfonso reduzca de forma gradual el comportamiento indeseable.

 Reforzamiento de conductas incompatibles Es un método complementario de cualquier intento de eliminar una conducta problemática. Se basa en la administración de recompensas de forma continua a aquellas conductas que son incompatibles con la que se quiere suprimir y en no aplicar ningún tipo de consecuencia a la conducta que se quiere eliminar (ignorarla). El aumento de la conducta alternativa incompatible conlleva una disminución de la conducta indeseable. Por ejemplo, y siguiendo el ejemplo anterior, hacer caso a Alfonso en el momento en que esté distraído jugando, o haya esperado a que no haya nadie hablando para tomar la palabra.


Es un procedimiento que puede ser de gran utilidad cuando no podemos retirar el reforzador que mantiene la conducta. Lo que se hace es sacar a la persona de la situación en la que se encuentre cuando realiza la conducta que deseamos suprimir. Puede hacerse dejándole en su cuarto y llevándose de la habitación todo el material, juguetes, etc., poniendo al niño de cara a la pared, en “el rincón de los aburridos” o llevándole. La decisión para utilizar tiempo fuera.

Control de estímulos Si un estímulo está siempre presente cuando se refuerza una respuesta (y ausente cuando no se refuerza) la conducta en cuestión se emite con mayor probabilidad ante dicho estímulo que en cualquier otra situación. Aunque en un principio sean neutrales, como consecuencia del hecho de estar presentes siempre que una conducta es reforzada, adquieren determinado control sobre ella. Entonces alterando los antecedentes que controlan las condiciones, podemos eliminar la conducta. La conducta problema puede ser cambiada asociando estímulos (antecedentes) con recompensas no deseadas. Por ejemplo, si un niño charla continuamente con el compañero que tiene a su lado, el profesor generalmente cambia al niño de sitio. Cambiando el sitio, el profesor cambia el contexto estimular (en este caso la proximidad) en el que la charla (que se quiere evitar) tiene lugar. El procedimiento de cambio de estímulos tiene, sin embargo, un corto efecto a la hora de reducir conductas no deseadas.

Costo de respuesta o castigo negativo Consiste en quitar, como consecuencia de la conducta, algo que gusta (algún reforzador disponible). Se llama también castigo negativo porque se suprime algo que gusta, pero no hace uso de estimulación aversiva. Por ejemplo, para reducir la conducta indeseada de mantener un coche aparcado durante mucho tiempo en una zona muy congestionada, aumenta el precio del aparcamiento por cada hora adicional.

Práctica positiva Este método consiste en hacer que la persona practique, durante periodos de tiempo determinados, conductas físicamente incompatibles con la conducta inapropiada. No se mejora, sino que se ejecuta el comportamiento adecuado. Este procedimiento tiene efectos rápidos y de paso enseña conductas aceptables a los niños. Por ejemplo, Pedro entra dando un portazo: “Sal y cierra despacio”. Es importante que utilicemos siempre una clave verbal previa (una advertencia del tipo “no” en tono claro y firme) que pueda servirnos posteriormente para ser usada como forma de control sin necesidad de recurrir continuamente a la práctica positiva.

Saciedad Con este procedimiento conseguimos suprimir una conducta basándonos en la utilización del propio reforzador que la mantiene porque aumentando de forma considerable la administración de reforzamiento hacemos que el reforzador pierda su valor como tal. De hecho, el exigir la realización continuada de una actividad en principio agrada ble puede convertirla en aversiva. Cuando se decida utilizar este procedimiento ha de tenerse claro que la conducta problemática que se quiere eliminar la usamos como recompensa —y sólo como tal— de otras actividades. Al igual que un reforzador que se presenta con mucha frecuencia y en grandes cantidades produce saciedad, cansa y pierde su eficacia en el mantenimiento de la conducta, si consideramos la conducta problemática como una posible recompensa y la usamos sistemáticamente como tal, conseguiremos que el niño se canse de ella, es decir, deje de realizar la conducta problemática. Por ejemplo, un niño que sólo quiere comer patatas fritas. Que sólo coma eso para desayunar, comer, merendar y cenar.


Castigo Consiste en aplicar una consecuencia punitiva a una conducta. El castigo debe ser usado sólo y exclusivamente cuando otros procedimientos no hayan funcionado o cuando la propia vida del niño esté en peligro y ello pueda evitarse recurriendo al castigo. Tal es el caso de las conductas de autoagresión. El castigo es efectivo porque reduce o elimina rápidamente la conducta indeseable. Sin embargo, existen muchas razones para evitarlo: sólo funciona cuando está presente la persona que castiga, puede provocar agresividad hacia otros (personas o cosas) y no se puede establecer una relación adecuada entre castigador y castigado puesto que este último tiende a escapar del primero, etcétera. Para que sea efectivo han de cumplirse al menos los siguientes requisitos: ha de aplicarse inmediatamente después de la conducta problemática; debe ir precedido de una señal (un tono verbal, un gesto, etc.) que más adelante pueda impedir por sí sola la aparición de la conducta indeseada; ha de aplicarse de forma continua para la conducta que se pretende eliminar (da mejores resultados con conductas que ocurren muy a menudo); debe reducir efectivamente la conducta indeseado (si utilizamos un azote, estamos utilizando un azote, no unas caricias). Siempre deben premiarse las conductas alternativas capaces de sustituir a la conducta problemática que estamos castigando. Cuando se decida aplicar el castigo como procedimiento de reducción o eliminación de conductas, ha de emplearse con absoluta calma y retirando otros posibles reforzadores que existiesen en el momento de aplicar el castigo.



Referencias Consultadas
http://centros5.pntic.mec.es/ies.victoria.kent/Rincon-C/Curiosid/Rc-30/RC-30.htm 



¿En qué consiste el condicionamiento operante?
Se trata de mirar las cosas al revés: no desde el estímulo sino desde la respuesta: el sujeto quiere cambiar ambiente, quiere obtener cambio mediante su comportamiento (apagar la alarma del despertador quiere lograr el silencio¿?) Si la ley del efecto postula que una respuesta queda asociada a un estímulo cuando se obtiene una consecuencia reforzante, Skinner se apoya sobre esto para decir: la conducta del sujeto OPERA para influir en ambiente -y por coniguiente obtener consecuencia deseable.
¿Qué es una operante?
Una OPERANTE es una conducta que opera sobre el ambiente para lograr cambio. (hay conductas no operantes¿?)
¿En qué se diferencian el condicionamiento clásico y el condicionamiento
operante?

En el clásico se da que a determinado estímulo determinada respuesta…el foco está en entender a la conducta como una respuesta. Mientras que en el condicionamiento operante de Skinnerla conducta no responde sino que opera: intenta influir en ambiente para lograr un cambio.
. ¿Cómo se define el refuerzo desde la postura skinneriana?
Comparado con condicionamiento clásico, Skinner da preponderancia a la idea del refuerzo: porque el sujeto opera en función de los refuerzos que obtiene con su conducta.
Un refuerzo (ya sea positivo o negativo) tiene el objetivo de aumentar la probabilidad de cambio de conducta, aumentar probabilidad de que cambio se produzca.

. ¿Qué es un refuerzo positivo?
Premio. Es un refuerzo que aumenta la probabilidad de emisión de una determinada conducta para que aparezca el refuerzo. Ej: rata pulsa palanca y obtiene comida. Más recreo, chocolate, azucar, estrellitas, nota (puede funcionar como positivo o negativo).
.¿Qué es un refuerzo negativo?
Tiene como consecuencia la desaparición de un estímulo adversivo (alarma es refuerzo negativo, aumenta la probabilidad de que me despierte con tal de hacer desaparece el estímuloa dversivo del ruido). La alarma es un refuerzo porque aumenta la probabilida de la conducta “despertarse”. Y la conducta es “operante” porque me despierto con la intención de modificar el ambiente “apagar el despertador”.
El valor de un refuerzo tiene que ver con la historia de cada uno: no funciona en todos lo mismo. Ej: el sueldo puede funcionar como refuerzo positivo si no me gusta el trabajo que tengo que hacer pero hay gente a la que el sueldo no le funciona como refuerzo.
.¿En qué consiste el castigo?
Busca extinguir una conducta pero según Skinner no lo logra: a diferencia del refuerzo negativo, no aumenta la probabilidad de extinción de conductas, sino que la suspende para luego volver “reforzada”. El castigo suspende una conducta pero no la extinque. Y además, puede llevar a la “abulia”, la falta total de deseo.
*Si se incorpora el “estímulo adversivo” este funciona como castigo. Un castigo que se tuvo en pasado funciona como refuerzo negativo (amenaza: perder el recreo)
Tanto en refuerzos positivos como negativos y los castigos, es fundamental especificar del lado que se lo mira: del que lo aplica o del que lo vive.
.¿Qué críticas le realiza Skinner a la utilización del castigo?
Que suspende pero no extingue la conducta que se desea evitar.
.¿Qué alternativas propone Skinner para suprimir conductas no deseadas?
¿Introducir estímulos adversivos???
Encuentro la respuesta en el libro de Schunk
Las alternativas al castigo que propone Skinner son:
-Determinar los elementos del ambiente que provocan conducta indeseable y cambiar estímulos discriminativos (alumno que se porta mal atrás, moverlo al frente)
-Permitir que continue comportamiento no deseado hasta que se sacie (método de fatiga de Guthrie) Ej: padre dejar que niño siga con rabieta hasta cansarse -con mi hijo no funciona!-
-Ignorar conducta indeseable (cuál es la diferencia con anterior: actitud frente alguna falta menor, por ejemplo: el cuchicheo en clase)
-Condicionar conducta incompatible con refuerzo positivo. Ej En vez de castigar por comportase mal, el refuerzo positivo le enseña a conducirse de forma aceptable. Ej que maestro elogie los hábitos de trabajo productivo…tiene a favor que muestra a estudiante comportamiento adaptativo. Es proceso más largo que el castigo pero a la larga suele ser más eficaz. RECURSO DE FACEBOOK CON EL ME GUSTA: refuerzo positivo para conducta deseable.
.¿Cómo se logra la extinción de una respuesta?
Con refuerzos negativos??? Y las alternativas al castigo arriba mencionadas. ¿?
.¿Cómo se explica el olvido desde esta postura teórica?
Olvido es ausencia de mecanismos reforzadores hasta extinción¿?
Teorías del olvido: Desuso, interferencia o represión.

1 6 .¿Qué es un “refuerzo generalizado”?
1 7 .¿Qué es un “refuerzo diferencial”?
1 8 .¿En qué consisten los programas de refuerzo de razón?
1 9 .¿En qué consisten los programas de refuerzo de tiempo?
2 0 .¿Cuáles son los programas de reforzamiento más efectivos? ¿Por qué?
2 1 .¿Cómo explica Skinner la conducta supersticiosa?
2 2 .¿En qué consiste el método de las aproximaciones sucesivas?
2 3 .¿Cómo se concibe la enseñanza?
2 4 .¿Cuáles son las críticas que Skinner formula a la escuela y las propuestas que plantea para superarlas?
2 5 .¿Qué es la “máquina de enseñar”? ¿Cuáles serían sus ventajas?
2 6 .¿Cuáles son las críticas que le realizan a la “máquina de enseñar”?

referencia consultada.
https://educacionuba.wordpress.com/2010/08/27/guia-conductismo/

No hay comentarios:

Publicar un comentario