You are on page 1of 156

PSICOLOGIA

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


5 edicin

Michael Domjan

Juan Carlos Cabrera Valderrama Cdiz 2009-2010

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera - 2009/2010

Antecedentes histricos
Desarrollo histrico del estudio de la mente. Desarrollo histrico del estudio de los reflejos.

El amanecer de la nueva era


La cognicin comparada y la evolucin de la inteligencia. Neurologa funcional. Modelos animales de la conducta humana. Modelos animales y robtica.

Definicin de aprendizaje:
La distincin entre aprendizaje y ejecucin. El aprendizaje y otras fuentes de cambion conductual. Diferentes tipos de mecanismos causales.

Aspectos metodolgicos del estudio del aprendizaje


El aprendizaje como ciencia experimental. La perspectiva de proceso general en el estudio del aprendizaje.

Uso de animales no humanos en la investigacin sobre aprendizaje


Razones del uso de animales no humanos en la investigacin sobre aprendizaje. Los animales de laboratorio y la conducta normal. El debate pblico sobre la investigacin con animales no humanos.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Antecedentes Histricos
Las aproximaciones tericas al estudio del aprendizaje tienen sus races en la filosofa de Ren Descartes. Antes de Descartes, se pensaba que el comportamiento humano estaba enteramente determinado por la intencin consciente y por el libre albedro. Descartes reconoci que muchas cosas que hacen las personas son respuestas automticas a estmulos externos, aunque no abandon por completo la idea del libre albedro y del control consciente. Por tanto, formul la visin dualista del comportamiento humano conocida como dualismo cartesiano: conducta voluntaria controlada por la mente y conducta involuntaria controlada por mecanismos reflejos.

Ren Descartes (1596-1650)

Mundo fsico (causa de la accin involuntaria)

rganos sensoriales Glndula pineal

Cerebro

Mente (causa de la accin voluntaria)

Accin voluntaria o involuntaria

Msculos

Diagrama de dualismo cartesiano. Los rganos sensoriales detectan los eventos del mundo fsico. Desde aqu la informacin se trasmite al cerebro. El cerebro est conectado a la mente por medio de la Glndula pineal. La accin involuntaria se realiza por un arco reflejo que enva mensajes en primer lugar a los rganos sensoriales al cerebro y despus del cerebro a los msculos. La accin voluntaria se inicia en la mente, que enva mensajes al cerebro y despus a los msculos.

Descartes asume que los estmulos del ambiente externo son la causa de toda conducta involuntaria. Estos estimulos producen respuestas involuntarias por medio de un circuito neuronal que incluye al cerebro. Sin embargo, crea que los mismos nervios transmitan la informacin de los rganos de los sentidos al cerebro y del cerebro a los msculos. Este circuito permita reacciones rpidas a estmulos exteros ( ejemplo: retirar rpidamente un dedo del fogn caliente). Descartes crea que los animales carecan del libre albedro y eran incapaces de acciones voluntarias y conscientes, frente a los seres humanos que se les atribua una mente o alma. La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glndula pineal, cerca del cerebro, por lo que poda tener conciencia de la conducta involuntaria e iniciar las

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, sta poda tener lugar independientemente de la estimulacin externa. El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones intelectuales, base del estudio del aprendizaje moderno: 1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente. 2.- La reflexologa, del mecanismo de la conducta involuntaria.

Desarrollo histrico del estudio de la mente.


Los filsofos preocupados por la mente estaban interesados en descubrir qu era la mente y cmo funcionaba. Preguntas similares se plantean los psiclogos cognitivos actuales. En cuanto al contenido de la mente. Descartes crea que la mente contena ideas innatas independientemente de la experiencia personal. La aproximacin filosfica segn la cual nacemos con ideas innatas acerca de ciertas cosas se denomina innatismo. Otros filsofos posteriores a Descartes se enfrentaron a la postura nativista, como John Locke(1632-1704) crea que las ideas de las personas eran aprendidas directa o indirectamente a travs de experiencias posteriores al nacimiento, recibiendo esta el nombre de empirismo. En cuanto a cmo funciona. Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyes que pudieran identificar. Mientras que el filsofo Thomas Hobbes ( 1588-1679) fue pionero en proponer que al igual que los reflejos, la mente operaba de forma predecible y conforme a leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio del hedonismo (las personas tratan de lograr el placer y de evitar el dolor). Los empiristas britnicos propusieron que las sensaciones simples se combinan hasta formar ideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto un coche, se establece asociacin con estos atributos de los coches, de manera que esta palabra volver a activar los recuerdos de los aspectos del coche que hemos experimentado cuando vuelva a oirla. Los empiristas britnicos consideraban que tales asociaciones constituan los ladrillos de la actividad mental y dedicaran un considerable esfuerzo en detallar las Leyes de asociacin.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Leyes de asociacin. Los empiristas britnicos aceptaron dos conjuntos de leyes para el establecimiento de asociaciones: Primarias: formuladas por Aristoteles que propuso tres principios, Contigidad: si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida quedarn asociados. Por ejemplo, si nos encontramos con el olor de la salsa de tomate y de los espaguetis con la suficiente frecuencia, nuestro recuerdo de los espaguetis se activar con el mero olor de la salsa de tomate. Similitud y contraste: dos ideas se asocian si son similares en algn aspecto (por ejemplo, si las dos son rojas) o si tienen alguna caracterstica contraria (por ejemplo, si una es muy alta y otra muy baja). Secundarias: varios filsofos formularon leyes de asociacin secundarias, entre ellos Tomas Brown(1778-1820) propuso que la formacin de asociaciones entre dos sensaciones estaba influida por un nmero de factores, incluyendo la intensidad de las sensaciones y la frecuencia y recencia con que las dos ocurrian conjuntamente. Adems, se consideraba que la formacin de una asociacin entre dos eventos dependa del nmero de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud entre estas asociaciones pasadas y la que se forma en el presente.

La investigacin emprica de los mecanismos de asociacin no comenzara hasta el siglo XIX, con el trabajo pionero del psiclogo alemn Hermann Ebbinghaus (1850-1909) inventor de las slabas sin sentido, combinaciones de tres letras sin ningn significado, estudi listas de estas y midi su capacidad de recordarlas bajo diversas condiciones experimentales, permiti comprobar que : la fuerza de las asociaciones mejoraba con el entrenamiento. Las slabas sin sentido que aparecan juntas en una lista quedaban asociadas con mayor fuerza que las slabas que estaban ms distantes, Una slaba se asocia con mayor fuerza a la siguiente de la lista que a la anterior.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Desarrollo histrico del estudio de los reflejos.


Al formular el concepto de reflejo, Descartes hizo una gran contribucin a la compresin de la conducta, aunque estaba eqivocado en sus ideas acerca del acto reflejo cuando creia que los mensajes sensoriales iban de los rganos de los sentidos al cerebro y los mensajes motores iban del cerebro a los msculos, viajando por los mismo nervios; y cuando pensaba que los nervios eran tubos huecos y su transmisin neuronal involucraba gases a los que denomin espritus animales. Supona que estos espritus animales, liberados por la glndula pineal, se desplazaban por los tubos neurales y entraban en los musculos hinchandolos y provocando el movimiento. Por ltimo, Descartes consideraba el movimiento reflejo era de carcter innato y que estaban fijados por la anatoma del sistema nervioso. Charles Bell (1774-1842) y Franois Magaendie (1783-1855) mostraron que eran fibras nerviosas distintas las encargadas de transmitir la informacin sensorial desde los organos sensoriales a SNC (sistema nervioso central) y la informacin motora, del SNC a los msculos. John Swanmmerdan (1637-1680) en 1669 mostr que el influjo de espiritus animales desde la glndula pineal resultaba innecesario y Francis Glisson (1597-1677) demostr que las contracciones musculares no se deban a que los msculos se hincharan por un gas. Descartes y la mayor parte de los filsofos posteriores asumieron que los reflejos eran responsables nicamente de reacciones sencillas a estmulos externos. Se supona que un estimulo mayor corresponde a una respuesta ms vigorosa. Por ejemplo, si tocamos un fogn, cuanto mayor sea el calor ms rpido se retira la mano. Hasta el s.XIX I.M. Sechenov (1829-1905) propuso que los estmulos no siempre elicitan respuestas reflejas de forma directa. En algunos casos pueden liberar respuesta que estaba inhibida, cuya fuerza no depender de la intensidad del estimulo. Por ejemplo, pequeas particulas de polvo pueden producir potentes estornudos. Sugiri que formas complejas de comportamiento (acciones o pensamientos) que ocurrian en ausencia de estmulo elicitador manifiesto eran de hecho respuestas reflejas. As, la conducta voluntaria y los pensamientos estn en realidad elicitados por estmulos dbiles y apenas visibles. Sechenov no tom en consideracin que la conducta de los organismos no permaneca fija e invariable a lo largo
6 I.M. Sechenov ( 1829-1905)

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes se consider las respuestas reflejas como innatas y fijadas de antemano por las conexiones del sistema nervioso y por tanto un estmulo dado elicitara la misma respuesta a lo largo de toda la vida del individuo. Pavlov demostr experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer nuevos reflejos para los estmulos. Trabaj desde la tradicin fisiolgica de la reflexologa tratanto de determinar las leyes de la asociacin mediante la investigacin experimental . El anlisis de tipo asociativo continua jugando un importante papel en investigaciones tanto fisiolgicas como conductuales, aunque algunos han complementado los mecanismos asociativos con otro tipo de procesos.

Ivan Pavlov (1849-1936)

El Amanecer De Una Nueva Era


Los estudios experimentales sobre los principios bsicos de aprendizaje se realizan frecuentemente con animales no humanos y dentro de la tadicin reflexolgica.

La cognicin comparada y la evolucin de la inteligencia.


Surge como consecuencia de los escritos de Charles Darwin que atacaba los privilegios que Descartes daba a los humanos cuando asumia que slo estos posean mente. En su segunda obra ms importante, El origen del hombre, Darwin, argument que "el hombre desciende de algn ser ms primitivo, a pesar de que por el momento se desconozcan los eslabones intermedios". Al reclamar la continuiad entre los dems animales y los humanos, Darwin trat de caracterizar, no slo la evolucin de los rasgos fsicos, sino tambien la evolucin de las capacidades psicolgicas o mentales. En su opinin, la mente humana es producto de la evolucin. Sugera que los animales tambin poseen capacidades similares a las humanas incluso capaces de creer en entidades espitiruales.

Charles Darwin (1809-1882)

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Darwin recopil evidencias anecdticas de formas de comportamiento inteligente en animales, que hoy no satisface los estandares cientficos pero que el tema de investigacin siguen siendo de mxima actualidad por la posibilidad de seguir la huella de la evolucin de la inteligencia por medio de destudios delas capacidades de las diversas especies animales. George Romanes en su libro inteligencia animal de 1882, sugiri que la inteligencia podra identificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar los antiguos, de acuerdo con los resultados de su propia experiencia individual". La defini como la capacidad de aprender.

Neurologa Funcional.
De acuerdo con el principio del nervismo, las principales funciones fisiolgicas estn gobernadas por el sistema nervioso (SN). Ivan Pavlov dedic su vida a investigarlo y gran parte a la identificacin de los mecanismos neurales de la digestin. El descubrimiento por parte de los britanicos Bayliss y Starling evidenciando el control parcial del pncreas por factores hormonal y no por factores neurales, hizo que abandonara el estudio de la fisiologa del sistema digestivo para investigar los reflejos condicionados. La afirmacin de Pavlov segn la cual los estudios de aprendizaje revelan cmo opera el sistema nervioso es ampliamente aceptada por los neurocientficos contemporaneos. Kandel, por ejemplo, ha comentado que "el principio central de las modernas neurociencias es que todo comportamiento es un reflejo del funcionamiento del cerebro". El psiclogo del comportamiento es como un conductor que trata de descubrir el funcionamiento de un vehculo experimental probandolo, en lugar de estudiando el motor. Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinaria del sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistema nervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismo por el cual persisten las respuestas aprendidas y de las circunstancias en las cuales la informacin aprendida es o no accesible. Al detallar las funciones del sistema nervioso, los estudios conductuales del aprendizaje definen los rasgos u operaciones que deben ser explicados por investigaciones de tipo neurofisiolgico.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Modelos animales de la conducta humana.


La realizacin de inferencias sobre el comportamiento humano partiendo de investigaciones con otras especies animales puede ser arriesgada, si se realiza de forma injustificada; y controvertida si las razones para la utilizacin del modelo no se entiende apropiadamente. Los modelos bases suelen ser animales de otras especies como palomas, ratones y ratones, primates. La utilizacin de animales como modelo es una herramienta cientifica bsica y potente. Permite el estudio de aspectos de la realidad que representan en condiciones sencillas, controladas y econmicas. Lo importante del modelo animal es que la caracteristica a estudiar sea similar a las conductas humanas. Por ejemplo, las similitudes entre las ratas y los humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo vlido para investigar el aprendizaje de aversin a la comida en humanos. Dollard y Miller fueron partidarios de una integracin en la que los estudios de laboratorio realizados con animales no humanos se usaran para aislar e identificar los fenmenos que podran posteriormente ser estudiados con xito en personas. La investigacin con animales permite tambin aumentar nuestra confianza en los datos obtenidos con humanos mediante mtodos de investigacin menos rigurosos.

Modelos animales y robtica.


Los modelos animales de aprendizaje y conducta tambin revisten cierta importancia en relacin a la robtica y a los sistemas de inteligencia artificial. Los robots son mquinas capaces de realizar funciones o tareas especficas. La meta de la robtica es hacer mquinas tan "inteligentes" como sea posible. Al igual que Romanes defini el trmino "inteligencia" a partir de la capacidad de aprender, los ingenieros actuales contemplan la capacidad de recordad y aprender a partir de la experiencia como un rasgo importante de los sitemas artificiales "inteligentes". La informacin sobre las caractersticas y mecanismos de tal aprendizaje puede obtenerse a partir de estudios de aprendizaje realizados por animales no humanos. Por ejemplo, en inteligencia artificial se utilizan frecuentemente mecanismos asociativos para permitir que las respuestas de estos sistemas sean modificables por la experiencia.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Definicin De Aprendizaje.
No hay una definicin de aprendizaje universalmente aceptada. Sien embargo, muchos aspectos quedan recogidos en las siguiente afirmacin: El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estmulos y/o respuestas especficas y que es resultado de la experiencia previa con esos estmulos y respuestas o con otros similares.

La distincin entre aprendizaje y ejecucin.


Siempre que contemplamos evidencia de aprendizaje, observamos la aparicin de un cambio en el comportamiento. Es la nica forma de saber si el aprendizaje a tenido lugar. El comportamiento est determinado por muchos otros factores distintos del aprendizaje. La ejecucin se refiere a las acciones de un organismo en un momento concreto. La ejecucin esta determinada por la oportunidad, la motivacin y las capacidades sensoriales y motoras, adems del aprendizaje. Por lo que, un cambio de actuacin no puede ser automticamente considerada como una manifestacin de aprendizaje.

El aprendizaje y otras fuentes de cambio conductual.


La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conducta que es excesivamene breve para ser considerados como aprendizaje. Se produce por el esfuerzo fsico y provoca una disminucin gradual en la fuerza de una respuesta. Este tipo de cambio est producido por la experiencia, pero no se considera ejemplo de aprendizaje debido a que la debilitacin de la respuesta desaparece si se permite al individuo descansar un rato. Un cambio en las condiciones estimulares tambin puede alterar la conducta temporalmente (La luz del cine se enciende de repente, el espectador cambia su comportamiento, y cuando se apaga se vuelve a concentrar en la pelicula). Como tampoco puede considerarse aprendizaje los que implican alteracin en el estado fisiolgico o motivacional del organismo ( el hambre, la sed, cambios en niveles hormonas sexuales, drogas psicoactivas, etc. provocan cambios conductuales transitorios). En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de la experiencia con eventos del entorno que requiere la definicin de aprendizaje. Destacabel de este tipo es la maduracin. Un nio no alcanza un objeto que est en una estantera alta hasta que crezca lo suficiente.
10

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Diferentes tipos de mecanismos causales.


Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles de explicacin. Cuatro tipos de causas descritos por Aristteles. Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientes para producir un resultado en la conducta. Segundo, causas materiales, cambios en los mecanismos sinpticos; cambios neurales. Tercera, causas formales son las teoras o modelos de aprendizaje. Cuarta, causas finales son las explicaciones del aprendizaje que pone nfasis en su funcin o utilidad. Los cientificos de orientacin biolgica a menudo establecen una distincin entre las causas prximas o inmediatas del comportamiento y sus causas ltimas. Las causas prximas se corresponden con las causas eficientes y materiales de Aristteles. Las causas ltimas se corresponden con las causas finales.

Aspectos Metodolgicos Del Estudio del Aprendizaje.


La investigacin sobre los procesos de aprendizaje se caracteriza por dos rasgos metodolgicos principales. Uno es consecuencia directa de la definicin de aprendizaje y requiere el uso de mtodos de investigacin experimentales, en lugar de mtodos observacionales. Los fenmenos del aprendizaje no pueden investigarse sin una metodologa experimental. El segundo rasgo metodolgico es ms una cuestin de preferencia que de necesidad.

El aprendizaje como ciencia experimental.


De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atencin en las causas eficiente, materiales y formales. Independientemente del tipo de causa, este nfasis prescribe que las investigaciones de aprendizaje utilicen una metodologa experimental. Las causas no pueden observarse directamente. Tan slo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales. En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, en presencia y en ausencia de la presunta causa. Hay que comparar las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestin con las acciones de los individuos que no han sido expuestos a dicho procedimiento. La nica forma de demostrar que la exposicin a ese entrenamiento es la causa del cambio conductual
11

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

estudiado es manipular experimentalmente la presencia y la ausencia de dicha exposicin. Por esta razn, el aprendizaje slo puede estudiarse mediante tcnicas experimentales y tiene lugar bsicamente en el laboratorio.

La perspectiva de proceso general en el estudio del aprendizaje.


El segundo rasgo metodolgico de los estudios de aprendizaje es una perspectiva basada en procesos generales. sta es ms una cuestin de preferencia que de necesidad. Sin embargo, al adoptar una perspectiva de proceso general, los investigadores del aprendizaje animal siguen una antigua tradicin cientfica. Elementos de la perspectiva de proceso general. La caracterstica ms obvia de la naturaleza es su diversidad. Los cientificos han elegido fijarse en los aspectos comunes para buscar la uniformidad y formular leyes generales con las que organizar y explicar la diversidad de los eventos del universo. Los investigadores del aprendizaje animal han seguido esta misma tradicin. Un presupuesto fundamental de la perspectiva de proceso general es que los fenmenos estudiados son el resultado de procesos ms elementales. Adems, se asume que esos procesos elementales operan de forma similar independientemente de dnde se encuentren. Por tanto, se asume que la generalidad emerge a nivel de los procesos bsicos o elementales. Los investigadores del condicionamiento y el aprendizaje se han adherido a la perspectiva de proceso general desde los comienzos de esta rea de estudio en psicologa. Se han centrado en los aspectos comunes de los diversos tipos de aprendizaje y han asumido que los fenmenos de aprendizaje son producto de procesos elementales que operan de forma similar en diversas situaciones de aprendizaje. El presupuesto segn el cual las leyes "universales" de la asociacin son las responsables de los fenmenos de aprendizaje no excluye que los animales puedan aprender sobre multitud de estmulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Se asume que la generalidad se sita en los principios o procesos de aprendizaje; no en el contenido o en la velociad del mismo. El trabajo del psiclogo del aprendizaje es descubrir esas leyes universales. Implicaciones metodolgicas de la perspectiva de proceso general. Si asumimos que existen principios universales de aprendizaje, entonces deberamos ser capaces de descubrir esos principios en cualquier situacin en la que el aprendizaje tenga lugar. Por tanto, una importante implicacin metodolgica de la perspectiva de proceso general es que se pueden descubrir los principios del aprendizaje estudiando cualquier especie o sistema de respueta que muestre aprendizaje. Los investigadores han confluido hacia unos
12

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

paradigmas experimentales estandarizados o convencionales. La mayor parte de los estudios de aprendizaje se realizan en estos paradigmas. A lo largo de los aos se han ido perfeccionando estos paradigmas experimentales convencionales, para ajustarse a las predisposiciones conductuales de los animales de investigacin. Debido a estas mejoras, estas preparaciones experimentales permiten realizar estudios de laboratorio con respuestas bastante naturales. Demostracin de la generalidad de los fenmenos de aprendizaje. Asumir que existen procesos elementales de aprendizaje comunes no es lo mismo que demostrar empricamente estas similitudes. La verificacin emprica de la existencia de tales mecanismos comunes en diversas situaciones sigue siendo necesaria para construir una explicacin verdaderamente general del aprendizaje. Una teora general del aprendizaje no puede verificarse empricamente utilizando slo unos pocos paradigmas experimentales estandarizados. La generalidad del aprendizaje debe probarse realizando estudios de distintas especies y situaciones.

Uso de Animales No Humanos En La Investigacin Sobre Aprendizaje.


Gran parte de los experimentos se han realizado con animales no humanos por razones tanto tericas como metodolgicas.

Razones del uso de animales no humanos en la investigacin sobre aprendizaje.


Para investigar los fenmenos de aprendizaje se requiere el uso de mtodos experimentales que puedan atribuir la adquisicin de una nueva conducta a una experiencia previa en particular. Este control experimental de la experiencia previa no puede alcanzarse con el mismo grado de precisin cuando se utilizan sujetos humanos que cuando se utilizan animales de labotatorio. Con los animales de laboratorio, los cientificos pueden estudiar cmo se aprende las reacciones emocionale intensas y cmo el aprendizaje interviene a la hora de buscar comida, evitar el dolor o el estrs, o encontrar posible pareja sexual. Con las personas, se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una vez que stas ya han sido aprendidas. Incluso para procedimientos teraputicos eficaces en el tratamiento de la conducta inadaptada requiere conocer primero los mecanismos por los cuales se aprenden dichas respuestas emocionales, conocimiento que requiere estudios con animales de laboratorio.

13

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Obtener informacin sobre las bases evolutivas y biolgicas del aprendizaje, o cmo evoluciona la cognicin y la inteligencia requieren el apoyo o la utilizacin de animales de investigacin. Igualmente el conocimiento de las bases biolgicas del aprendizaje necesitan el apoyo de los animales de laboratorio para desenmaraar cmo aprende y recuerda el sistema nervioso. Los estudios conductuales de aprendizaje realizados con animales son un requisito necesario para cualquier intento de investigar las bases biolgicas del aprendizaje con animales. La neurociencia tiene que fundamentarse en la ciencia del comportamiento. Estudiar los procesos de aprendizaje en animales criados en condiciones de control de laboratorio es ms simples que hacerlo en personas cuyos ambientes son mucho ms variados y difciles de describir. El comportamiento de los animales no se ve complicado por los procesos lingsticos que juegan un papel tan importante en determinados tipos de conducta humana. Otra ventaja importante es que en la investigacin con animales no es necesario hacer peticiones explcitas a los sujetos. En la investigacin con humanos se debe asegurar que los participantes no estn influenciados por el deseo de complacer al investigador.

Los animales de laboratorio y la conducta normal.


Parece errnea la idea de alguno cuando sugieren que la endogamia y los largos periodos de cautiverio de los animales domesticados de laboratorio pueden influir en la conducta normal de estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines de investigacin a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el del humano.

El debate pblico sobre la investigacin con animales no humanos.


Ha habido un gran debate acerca de las ventajas y los inconvenientes de realizar investigaciones con animales. Parte del debate se ha centrado en la necesidad de dar un trato humano a los animales. Otros aspectos del debate han centrado los requisitos ticos y que debe cumplir el trato de los animales, en el derecho de los seres humanos a beneficiarse a expensas de los animales y en posibles alternativas a la investigacin con animales. La tica de la investigacin con animales de laboratorio. La preocupacin por el bienestar de los animales de laboratorio han dado lugar a la adopcin de reglas estrictas para el alojamiento de los animales y para la supervisin de la investigacin con animales. En el caso de la ciencia que estudia la conducta, siempre se preocupan de ese bienestar ya que no se

14

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

puede obtener informacin sobre el aprendizaje y la conducta normales utilizando animales enfermos o maltratados. Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos los esfuerzos necesarios para minimizarlos. Qu es un trato "humano" a los animales? Asumiendo que una especie merece el trato que establezcan las normas oficiales. A menudo se describe como "trato humano" al tratamiento que se considera apropiado para los animales de laboratorio. Deben los seres humanos beneficiarse del uso de otros animales? La relacin es simbitica ms que unilateral y de explotacin. Adems, el uso de animales de laboratorio en la investigacin representa tan slo una pequea parte del uso que otros humanos hacen de los animales domsticos, incluyendo su uso como fuente de alimentacin.

Estimaciones del nmero de animales empleados en avicultura y ganadera Pollos Gallinas ponedoras Pavos Ganado vacuno Cerdos Ovejas y corderos TOTAL AVICULTURA Y GANADERA 7.764.200.000 303.604.000 301.251.000 59.801.000 104.301.000 6.691.000 8.539.848.000

Estimaciones del nmero de animales empleados en Investigacin Perros Gatos Primates Caballos Conejos Animales de granja Ratas y ratones Otros TOTAL INVESTIGACIN 75.429 26.091 56.381 217.079 309.322 159.742 7.452.186 150.987 8.452.186 *Datos de 1997 de EEUU. Porcentaje del total empleado en investigacin = 0.099%

Alternativa a la investigacin con animales. La creciente preocupacin por aspectos ticos de la investigacin con animales ha llevado a la bsqueda de tcnicas alternativas. Russell y Burch (1959) formularon las "tres R": reemplazamiento de animales por otras tcnicas de estudio, reduccin del nmero de animales empeados por tcnicas estadsticas y refinamiento de los procedimientos experimentales para causar menos sufrimiento. Pero en la investigacin sobre aprendizaje no es posible la experimentacin sin organismos vivos.

15

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 1: Introduccin
Juan Carlos Cabrera

Algunas de las tcnicas propuestas: 1. Tcnica observacionales. Al necesitar los estudios de aprendizaje manipulacciones experimentales de la experiencia pasada, las observaciones realizadas sin intervenir sobre los animales no pueden proporcionar informacin sobre los mecanismos de aprendizaje. 2. Uso de plantas. El aprendizaje no puede estudiarse en plantas, ya que carecen de sistema nervioso, imprescindible para el aprendizaje. 3. Cultivo de tejidos. Aunque los cultivos de tejidos pueden revelar las operaciones de procesos celulares, el funcionamiento del estos procesos celulares dentro del organismo intacto slo puede estudiarse en el organismo intacto. Adems, la bsqueda de los mecanismos celulares del aprendizaje requiere una caracterizacin previa del aprendizaje a nivel conductual. 4. Simulaciones informticas. Sin los conocimientos precisos sobre la naturaleza de los fenmenos de aprendizaje y de los mecanismos y factores que determinan el aprendizaje, los programadores no pueden realizar una simulacin informtica. Por tanto, la investigacin con organismos vivos es un requisito para la simulacin informtica efectiva.

TERMINOS CLAVE
Aprendizaje Cambio duradero en los mecanismos de conducta que implica estmulos y/o respuestas especficos y que es resultado de la experiencia previa con esos estmulos y respuestas o con otros similares. Asociacin Conexin entre la representacin mental de dos eventos (dos estmulos o un estmulo y una respuesta) de forma que la ocurrencia de uno de los eventos activa la representacin del otro. Dualismo Visin de la conducta segn acciones pueden dividirse en dos conducta voluntaria controlada por conducta involuntaria controlada por reflejos. Ejecucin Actividades momento particular. de un la cual las categoras: la mente y mecanismos Hedonismo Postura filosfica propuesta por Hobbes segn la cual las acciones de un organismo estn enteramente determinadas por la persecucin del placer y la evitacin del dolor. Maduracin Cambio en la conducta causado por el desarrollo fsico o fisiolgico del organismo en ausencia de experiencia con eventos particulares del ambiente. Innatismo Postura filosfica segn la cual los seres humanos nacen con ideas innatas. Nervismo Postura filosfica adoptada por Pavlov segn la cual todos los procesos conductuales y fisiolgicos estn regulados por el sistema nervioso. Reflejo Mecanismo que permite que un evento especfico del ambiente elicite una respuesta especfica. Slaba sin sentido Combinacin de tres letras (dos consonantes y una vocal) sin significado.
16

organismo

en

un

Empirismo Corriente filosfica segn la cual todas las ideas de la mente tienen su origen en la experiencia.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

La naturaleza de la conducta elicitada.


El concepto de reflejo. Pautas de accin modal. Estmulos elicitantes de las pautas de accin modal. La organizacin secuencial de la conducta.

Efectos de la estimulacin repetida.


Atencin visual en los bebs humanos. Salivacin y evaluacin del sabor en humanos. Respuesta de sobresalto en ratas.

Los conceptos de hatituacin y sensibilizacin.


Adaptabilidad y generalidad de la habituacin y la sensibilizacin. Diferencias entre habituacin y adaptacin sensorial y fatiga. Teora de proceso dual de la habituacin y la sensibilidad.

Caractersticas de la habituacin y la sensibilizacin.


Curso temporal. Especificidad del estmulo. Efecto de un estmulo externo intenso.

Aplicacin a las emociones y la conducta motivada.


Reacciones emocionales y sus efectos posteriores. La teora del proceso oponente. Variaciones en la conducta dirigida a metas.

17

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

La Naturaleza de la Conducta Elicitada

(pg. 29)

Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de la conducta tiene lugar como respuesta a los estmulos; es decir, ocurre de forma elicitada.

El concepto de reflejo.
Un reflejo conlleva dos elementos ntimamente relacionados, un estmulo elicitante y su correspondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estmulo. Estmulo y respuesta es una consecuencia de la organizacin del sistema nervioso. reflejos simples suelen estar mediados por tres neuronas: Los

Neurona sentorial o neurona aferente, es activada por un estmulo ambiental y transmite el mensaje sensorial a la mdula espinal. Neurona motora o neurona eferente, trasmite el impulso desde la mdula espinal que activa el musculo involuntario en la repuesta refleja. Interneural el impulso que comunica las dos neuronas anteriores.

Organizacin neuronal de los reflejos simples. Los estmulos del entorno activan una neurona sensorial, que trasmite el mensaje sensorial a la mdula espinal. En este lugar, el impulso neuronal pasa a una interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo involucrado en el movimiento.

Los circuitos neuronales estn dispuestos de tal modo que determinadas neuronas sensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una
19

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

determinada respuesta refleja est elicitada nicamente por un conjunto limitado de estmulos. El conjunto formado por neurona aferente, la interneuraona y la neurona eferente constituyen el arco reflejo. El arco reflejo representa el nmero Arco reflejo mnimo de conexiones neuronales El estmulo provoca una reaccin automtica. Componentes: Neurona sensorial, interneural, neurona motora. necesarias para que tenga lugar el acto reflejo, pero pueden verse involucradas esctructuras neuronales adicionales. Por ejemplo, la informacin sensorial puede transmitirse al cerebro, que a su vez puede modificar la reaccin refleja de diversas formas. La mayor parte de los reflejos contribuyen al bienestar del organismo, constituyen una parte importante del repertorio conductual de los nios recien nacidos y en ocasiones esencial para la supervivencia, como el reflejo de oclusin respiratoria.

Pautas de accin modal.


Hay respuetas simples comunes en muchas especies, por el contrario, existen otras especificas de la propia especie. Por ejemplo, la respuesta de succin provocada por objetos situados cerca de la boca es un rasgo caracterstico de los mamferos. A las secuencias de respuestas tpicas de especies particulares, tales como las que aparecen en la alimentacin de cras, se las denomina pautas de accin modal o PAMs.

Estmulos elicitantes de las pautas de accin modal.


Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente el nombre de estmulo seal o estmulo desencadenante. Un estmulo seal o desencadenante es suficiente para elicitar una pauta de accin modal. Sin embargo, una determinada pauta de accin puede estar controlada por varios rasgos del estmulo de forma aditiva. Adems, el estmulo que elicita con mayor efectividad la pauta de accin no tiene por qu ser el que ocurra con mayor probabilidad en condiciones naturales.
Son secuencias de conducta especficas de algunas especies que se desencadenan ante un estmulo determinado (estmulo seal o estmulo desencadenante). Ej: "Bailes de cortejo".

De hecho experimentos realizados con la gaviota arenquera, demostraron que el color, la textura y el tamao parecan controlar la conducta de recuperacin del huevo de forma aditiva. El atractivo del huevo poda resaltarse hacindolo ms verde, ms moteado o ms
20

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

grande. Al optimizar cada una de estas dimensiones se obtena un objeto que era ms efectivo que el natural como elicitador de la pauta de accin. Estos estmulos inusualmente efectivos reciben el nombre de estmulos supranormales.

Imaginemos que el parmetro ms importante es el color azul. As puede suceder que el huevo artificial ms efectivo para iniciar la Pauta de accin modal (PAM) resulta ser muy diferente del huevo real. Un huevo muy azul que no existe en la naturaleza, pero que elicita la PAM con ms fuerza que los de verdad, lo llamamos estmulo supranormal.

La organizacin secuencial de la conducta.


Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos: 1.- Conducta apetitiva a los primeros componentes de la secuencia de comportamiento. Sirve para poner al animal en contacto con el estmulo. Por ejemplo, olfatear la comida antes de comerla. 2.- Conductas consumatoria a los ltimos componentes de la secuencia de comportamiento. Por ejemplo, tragar la comida. Son normalmente ms estereotipadas (menos variables) que las conductas apetitivas. En secuencias de busqueda de comida: 1.- Modo de bsqueda general. Son conductas apetitivas. El sujeto no sabe dnde buscar comida. Por ejemplo, la ardilla busca un nogal. 2.- Modo de bsqueda focalizada. Tambien conductas apetitiva. El sujeto ya ha localizado espacialmente la fuente de comida, la bsqueda es ahora ms restringida. Por ejemplo, la ardillaha encontrado el nogal y comienza a buscar nueces. 3.- Modo de manipulacin del alimento. Es la conducta consumatoria. Por ejemplo, la ardilla ha obtenido la nuez.

Efectos De La Estimulacin Repetida. (pg. 35 del libro)


Descartes pensaba que una respuesta simple elicitada ocurre automticamente de la misma forma que se presenta el estmulo elicitada. Cada aparicin del estmulo elicitante producir la misma accin refleja. Esto no es as, dado que a menudo aparecen alteraciones en la naturaleza de la conducta elicitada simplemente como resultado de la presentacin repetida del estmulo elicitante.

21

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Atencin visual en los bebs humanos.


Los bebs humanos tienen que aprender muchas cosas sobre el mundo, y una forma es observar el entorno. Las claves visuales elicitan una respuesta de observacin, que puede medirse por el tiempo que los bebs mantienen sus ojos en un objeto antes de mirar a otra parte. En un estudio sobre atencin visual se tomaron dos grupos de bebs de cuatro meses y se les presentaron diferentes estmulos visuales. Los dos patrones similares a tableros de ajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces en intervalos de 10s.

Patrn de tablero 4 x 4

Patrn de tablero 12 x 12

Los resultados muestran que la atencin visual provocada por un estmulo novedoso cambia a medida que el beb se familiariza con el estmulo. Con el patron 4x4 relativamente sencillo, la atencin visual se reduce progresivamente. Con el patrn 12x12 ms complejo, la atencin se increment en el segundo ensayo, pero despus se redujo tambin.

Salivacin y evaluacin del sabor en humanos.


El sabor de la comida elicita la salivacin como respuesta refleja. Esto puede observarse tan claramene en las personas como en los perros de Pavlov. Las personas encuentran el sabor de una comida especfica menos placentera cuanto ms comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la valoracin hednica de una comida familiar. Estos hallazgos , del experimento realizado por Epstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentacin puede reducirse no variando la alimentacin disponible para su consumo.

22

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Respuesta de sobresalto en ratas.


La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies. Consiste en un salto repentino y una contraccin de los msculos de la parte superior del cuerpo, con frecuencia acompaado de una elevacin de los hombros. Davis (1974) estudi la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en un ambiente con un sonido suave de 60dB y al otro, algo ms fuerte, con 80dB. Ambos grupos recibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Los resultados fueron una reaccin de sobresalto cada vez ms dbil para el grupo expuesto a ambiente 60dB y reacciones de sobresalto cada vez ms vigorosas para el grupo expuesto a ambiente 80dB.

Los Conceptos De Habituacin y Sensibilizacin. (pg. 39 del libro)


Los estudios descritos anteriormente Habituacin: La respuesta desciende debido a la estimulacin muestran que la presentacin repetida de repetida. Ej: Acostumbrarse a vivir cerca de un aeropuerto, cuando los primeros das es una tortura, por el ruido. un estmulo elicitante puede provocar tanto disminuciones como incrementos en Sensibilizacin: La respuesta aumenta debido a la estimulacin repetida. Ej: La primera vez que escuch una la respuesta. Las disminuciones de la pera no haba distinguido el sonido de los clarinetes, ahora que ya la he odo muchas veces puedo diferenciar ese sonido tendencia a responder producidas por la claramente. estimulacin repetida recibe el nombre tcnico de efecto de habituacin. Los incrementos de la tendencia a responder se llaman efecto de sensibilizacin.

Adaptabilidad y generalidad de la habituacin y la sensibilizacin.


Estamos continuamente bombardeados por estimulos. Si tuviesemos que responder a todos nuestra conducta sera desorganizada y catica. Los fenmenos de habituacin y sensibilizacin son el producto final de procesos que ayudan a organizar y focalizar la conducta en el catico mundo de estmulos en el que los organismos viven.
Habituacin y sensibilizacin son tiles y necesarias porque ayudan a hacer caso a ciertos estmulos relevantes y a ignorar los estmulos irrelevantes. De lo contrario, nos moveramos en un maremgnum estimular poco informativo.

23

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Diferencias entre habituacin y adaptacin sensorial y fatiga.


La habituacin no es el nico efecto que da lugar a una disminucin en la respuesta. La adaptacin sensorial ocurre en los rganos sensoriales (una cegera temporal al pasar de la oscuridad a una luz) y la fatiga de la respuesta tiene lugar en los msculos efectores. Por el contrario, la habituacin y la sensibilizacin ocurren en el sistema nervioso. En la habituacin, el rganismo deja de responder a un estmulo aunque mantiene la capacidad de percibirlo y de realizar los movimientos musculares requeridos por la respuesta. La respuesta no tiene lugar debido a los cambios en el sistema nervioso bloquean la transmisin del impulso nervioso de la neuronas motoras. En los estudios sobre habituacin, la adaptacin sensorial puede descartarse ya que existe evidencia de que la habituacin es especfica de la respuesta. La fatiga tambin puede descartarse como causa de la habituacin por medio de evidencias que muestra que la habituacin es especfica del estmulo.

Adaptacin sensorial: prdida de sensibilidad de ls organos sensoriales ( ej: deslumbrarse por una luz muy fuerte). Cmo distinguirla de la Habituacin? La adaptacin sensorial... 1. No se debe a una estimulacin repetida, como la Habituacin, sino a una estimulacin demasiado potente. 2. No sucede en el sistema nervioso central, como la habituacin, sino en los rganos sensoriales. No es por tanto una forma de aprendizaje. 3. No es especfica de la respuesta. Si los rganos sensoriales estn afectados, todas las respuestas disminuirn porque los estmulos no son bien captados por los sentidos. Por el contrario, en la habituacin, slo desciende una respuesta, otras respuestas diferentes pueden ser ejecutadas con normalidad. 4. Es un tipo de efecto muy transitorio.

Fatiga: Reduccin de la respuesta producida por el cansancio de los msculos involucrados en ella. En qu se parece y en qu se distingue de la Habituacin? 1. La fatiga s puede ser consecuencia de una estimulacin repetida, como la Habituacin. Ejecutar una misma respuesta continuamente produce fatiga. 2. Sin embargo, la fatiga no sucede en el sistema nervioso, no es aprendizaje, sino en los msculos que ejecutaran la respuesta. Un brazo cansado no puede ejecutar la respuesta. 3. La fatiga no es especfica del estimulo, como s lo es la Habituacin. En el caso de la Habituacin, un cambio en el estmulo devuelve la respuesta normal. Sin embargo, un msculo fatigado no puede volver a ejecutar la respuesta por haber cambiado el estmulo presentado. 4. Igualmente es un cambio muy transitorio: slo hace falta descansar un rato.

24

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Teora de proceso dual de la habituacin y la sensibilidad.


La teora del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estmulo son producto de procesos neuronales diferentes: Proceso de habituacin, rovoca una disminucin de la tendencia a responder y proceso de sensibilizacin, produce un incremento en la tendencia a responder. Estos procesos no son exlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual depende de qu proceso sea ms fuerte. En base investigaciones neuropsicolgica, los procesos de habituacin y sensibilizacin tienen lugar en diferentes partes de sistema nervioso. La habituacin tiene lugar en el sistema E-R, que consiste en el camino neural ms corto que conecta los rganos sensoriales activos por el estmulo elicitante y los msculos involucrados en la produccin de la respuesta elicitada ( como el arco reflejo). Cada presentacin de un estmulo elicitante activa el sistema E-R y causa un incremento en la habituacin.

La teora del proceso dual integra los dos procesos de habituacin y sensibilizacin. Los dos procesos suceden al mismo tiempo: la conducta observada es el resultado neto de los dos. Quin es ms fuerte?

Los procesos de sensibilizacin tienen lugar en el sistema de estado. Este determina la tendencia general de un organismo a responder, mientras el sistema E-R permite al animal dar la respuesta especfica al estmulo relevante. Los cambios de conducta que tienen lugar por la repeticin de un estmulo refleja la accin combinada de los sistemas E-R y de estado.
Los dos procesos (habituacin y sensibilizacin) tienen lugar en distintas partes del SN. El proceso de habituacin tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentacin de un estmulo activa el sistema E-R aumentando la habituacin. El proceso de sensibilizacin tiene lugar en el sistema de estado (determina la tendencia a responder). Slo se activa ante la presentacin repetida de estmulos excitadores (por tanto, no est activo todo el tiempo). Se puede modificar esa tendencia mediante drogas o estados emocionales ( ej: el miedo). La conducta observada ser el resultado de la combinacin de los dos procesos, por lo tanto depende de cul de los dos sea ms fuerte en un momento dado.

Aplicaciones de la teora del proceso dual. En los ejemplos de habituacin y sensibilizacin, la exposicin repentida al patrn ajedrez 4x4 produjo una disminucin de respuesta visual de los bebs, posiblemente no provoc mucha activacin del sistema E-R, proceso de habituacin. El patrn ajedrz 12x12, ms complejo, produjo mayor activacin y
25

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

activ, no slo el sistema E-R, sino tambin el sistema estado. Produjo un incremento en la atencin visual despus del primera presentacin. Sin embargo, el proceso de sensibilizacin no fue lo suficientemente fuerte para contrarestar completamente los efectos de la habituacin. Como resultado, despues de varios ensayos, la atencin visual tambien declino en respuesta al estimulo 12x12. La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicacin diferente de la teora del proceso dual. Cuando se someti a prueba con ruido ambiental relativamente suave (60 dB), no haba nada que las activara. Por tanto, podemos asumir que los procedimientos experimentales no produjeron cambios en el sistema estado. La presentacin repetida de tono elicitador activaba tan slo el sistema E-R, lo que dio lugar a la habituacin de la respuesta de sobresalto. El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB. Sucesivas presentaciones del tono aparecieron reacciones de sobresalto ms enrgicas. Dado que en ambos grupos se utiliz el mismo tono, la diferencia en los resultados no puede ser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intenso increment el nivel de activacin o la tendencia a respuesta. Esta sensibilizacin del sistema de estado fue la causa del incremento en la reaccin de sobresalto al tono en el segundo grupo. Implicaciones de la teora del proceso dual. El sistema E-R se activa siempre que un estmulo elicita una respuesta, mientras que el sistema de estado slo interviene en circunstancias especiales.

Caractersticas de la habituacin y la sensibilizacin. (pg. 45 del libro)


Curso temporal.
Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas de aprendizaje. Curso temporal de la sensibilizacin por lo general tienen efectos temporales y su duracin depende de la intensidad de los estmulos. Los estmulos ms intensos producen mayores incrementos en la tendencia a responder y una sensibilizacin ms persistentes. Curso temporal de la habituacin. La persistencia es variable. En la habituacin se distingue entre habituacin a corto plazo (se disipa en segundos o minutos) y habituacin a

26

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

largo plazo (persiste durante muchos das). La recuperacin espontnea es la principal


caracterstica del efecto de habituacin a corto plazo.

Especificidad del estmulo.


Especificidad del estmulo en la habituacin. La habituacin es especfica del estmulo que ha sido presentado repetidamente. Una respuesta a un estmulo previamente habituada puede manifestarse plenamente alterando alguna caracterstica importante del estmulo. Ejemplo, despus de habituarse al sabor del limn, la presentacin de la lima recupera la respuesta totalmente. Aunque la habituacin es especfica de un estmulo, puede darse cierta generalizacin. Si nos hemos habituado a un determinado sonido del reloj, es posible que tampoco respondamos al sonido de otro reloj que es similar al original. Este fenmeno recibe el nombre de generalizacin del estmulo de la habituacin. A medida que los estmulos se hacen progresivamente diferente, el organismo mostrar una menor habituacin o supresin de la respuesta ante dicho estmulo. Especificidad del estmulo en la sensibilizacin. La sensibilizacin no es especfica del estmulo.Si una animal se sensibiliza por alguna razn, su reactividad se increment para toda una variedad de estmulos.
Especialidad del estmulo: - Habituacin: Muy especfica del estmulo (cambiamos el estmulo y la respuesta). - Sensibilizacin: No especfica del estmulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestin de drogas), est hipersensible para casi cualquier estmulo que vaya a presentarse.

Efecto de un estmulo externo intenso.


La respuesta habituada tambin puede restablecerse sensibilizando al organismo con la exposicin de un estmulo externo. Este fenmeno recibe el nombre de deshabituacin.

Un estmulo intenso puede producir en el animal un estado de sensibilizacin que recupera la respuesta anteriormente habituadas: Deshabituacin.

27

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Aplicacin a las emociones y la conducta motivada. (pg. 49 del libro)


La exposicin de los cambios producidos por la repeticin de un estmulo se ha limitado hasta ahora a respuestas relativamente sencillas. Los estmulos tambin pueden provocar emociones complejas, tales como amor, miedo, euforia, terror o satisfaccin.

Reacciones emocionales y sus efectos posteriores.


Solomon y Corbit (1.074) destacaron dos rasgos llamativos. Las reacciones emocionales intensas a menudo constas de dos fase: - Primero, tiene lugar durante la presentacin del estmulo elicitante, y - Segundo, la opuesta se observa cuando el estmulo desaparece.
R.L. Solomon

Por ejemplo, el efecto psicoactivo del alcohol. Una persona se vuelve alegre y relajada, y experiementa sensaciones de cracter generalmente agradable cuando toma una un vaso de vino. Estas reacciones reflejan el efecto sedante inicial del alcohol. Por el contrario, tras tomar varias bebidas ocurre algo bastante distino. Una vez que el efecto sedante del alcohol se ha disipado, es probable que la persona se vuelva irritable y que experimente dolor de cabeza y nuseas. El efecto sedante y placentero del alcohol da paso a la sensaciones molestas de la resaca. Cuanto ms bebemos ms alegres o sedados quedamos y ms intensa es la resaca posteriormente.

Reaccin emocional "positiva": Euforia y relajacin.

Reaccin emocional "negativa": Irritabilidad, agresividad.

Las reacciones emocionales cambian con la experiencia. La reaccin primaria se hace ms dbil y su postefecto se hace ms fuerte. La habituacin de la Tolerancia a las drogas: primera reaccin a la droga se llama tolerancia a la droga, lo que habituacin a la emocin primaria que producen. hace referencia a la disminucin en la efectividad a una droga con las exposiciones repetidas. Solomon y Corbit (1974) destacaron que se producen patrones de reaccin emocional similares con otros estmulos emocionales. El amor y el apego, por ejemplo, la habituacin primaria va acompaada de un fortalecimiento del postefecto afectivo.
28

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

La teora del proceso oponente.


La teora del proceso oponente de la motivacin se diseo para explicar estos tres rasgos

caractersticos de las reacciones emocionales: 1. Las reacciones emocinales son bifsicas; a una reaccin primaria sigue un postefecto opuesto. 2. La reaccin primaria se debilita con la estimulacin repetida. 3. El debilitamiento de la reaccion primaria va acompaado por un fortalecimiento del postefecto.
Esta teora asume que hay que mantener el equilibro (homeostasis) emocional. Toda emocin primaria, activa un proceso oponente de signo contrario para compensarla. El porceso oponente empieza siendo ms dbil que el proceso primario (ejemplo, felicidad) pero tambin aumenta de fuerza ms rpido que el proceso primario. Por lo tanto, con la estimulacin repetida, el proceso oponente se va haciendo ms fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sera Habituacin..

Mecanismos oponentes durante la exposicin inicial al estmulo. La figura 2.16 muestra cmo los procesos primario y oponente determinan la respuesta iniciales de un organismo ante un estmulo emocional activador. Cuando el estmulo se presenta por primera vez (panel inferior) el proceso a tiene lugar sin la oposicin del proceso b. Esto permite que la reaccin emocional primaria alcance su nivel ms alto. Despus se activa el proceso b y comienza a oponerse al proceso a. Sin embargo, en la primera presentacin del estmulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras est presente el estmulo elicitante. Cuando el estmulo se retira, el proceso a se detiene rpidamente, pero el proceso b Figura 2.16 permanece por algn tiempo. En ese momento, no hay nada que se oponga al proceso b, y la respuesta emocional caracterstica del proceso oponente se hace evidente por primera vez. Estas emociones son por lo general opuestas a las que se observan durante la presentacin del estmulo.

29

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Mecanismos oponentes tras la exposicin prolongada al estmulo. La figura 2.17 muestra cmo funcionan los procesos primarios y oponentes tras la exposicin prolongada al estmulo. Un estmulo familiar no elicita reacciones emocionales fuertes, pero el postefecto afectivo tiende a ser ms fuerte cuendo termina un estmulo familiar. La teora del proceso oponente explica este resultado asumiendo que el proceso b fortalece con la exposicin prolongada al estmulo. El fortalecimiento del proceso b se refleja en varias de sus caractersticas: se activa antes tras la apricin del estmulo, su intensidad mxima se hace mayor y tarda ms tiempo en decaer tras la desaparicin del estmulo. Por el contrario, se Figura 2.17 asume que el proceso a pertenece inalterado. Por tanto, tras la presentacin repetida de un estmulo, la respuesta emocional primaria queda compensada de forma ms efectiva por el proceso oponente. Este fortalecimiento del proceso oponente reduce la intensidad de las respuestas emocionales primarias observadas durante la presentacin del estmulo emocional activador. Tambin da lugar a un postefecto emocional intenso cuando el estmulo se retira. Motivacin y postefecto oponente. Si los efectos placenteros iniciales de una droga psicoactiva desaparecen en los consumidores habituales por qu continan tomando la droga? Por qu se hacen adictos?. La teora del proceso oponente suguiere que la adiccin a las drogas es principalmente un intento de reducir la aversin producida por el postefecto afectivo de las drogas. Hay dos formas de reducir los postefectos oponetes aversivos. Esperar a que se disipen ( "pasar el mono" , puede tardad mucho tiempo y puede ser muy duro) o tomando de nuevo la droga para reducir ms rpidamente los postefectos oponentes. Quedan atrapados, no por el placer directo que obtienen de la droga, sino de la necesidad de reducir los efectos de la retirada. Valoracin general de la teora del proceso oponente. La teora del proceso oponente result muy atractiva cuando se present, ya que abarca un amplio rango de situaciones y proporciona una interesante explicacin de la tolerancia a las drogas, as como la dependencia y la adiccin. An est pendiente de probar de forma emprica muchas de sus predicciones en varias situaciones.

30

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

Adiccin a las drogas y proceso oponente Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (eufora, "colocn") y tambin un proceso oponente negativo ("bajn", resaca, "mono") que le sigue despus. 1 . Nada ms tomar la droga, el proceso primario gana ("colocn"). 2. Al retirar la droga, el proceso oponente permanece un tiempo ("bajn"). Con la estimulacin repetida, se va haciendo ms fuerte el proceso oponente (habituacin=tolerancia a la droga). El usuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativos cada vez ms. A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera de reducir su duracin es volver a tomar la droga para reiniciar el proceso primario. As se explica la adiccin. El adicto no acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.

Variaciones en la conducta dirigida a metas.


Responder para escapar de la molestia producida por la retirada de un estmulo es slo uno de los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe el nombre tcnico de reforzador. Las situaciones en la que los organismos responden repetidamente para obtener un reforzador muestran muchas de las propiedades comunes de la habituacin y la sensibilizacin. Ejemplo: El acto de encender un lector de disco ppara escuchar una cancin particular. Es menos problable que encedndamos el lectos si el resultado es siempre la misma cancin (habituacin), pero esta prdida de inters es especifica de esa cancin repetida (especificidad del estmulo). Adems, recuperaremos nuestro interes en la cancin origianl si no la escuchamos durante unos das ( recuperacin espontnea). Nuestro inters por la cancin conocida tambien puede establecerse por la exposicin a estmulos novedosos, tales como la excitacin de encontrarnos con un amigo (sensibilizacin) La habituacin y la sensibilizacin son frecuentes con reforzadores sensoriales como pueden ser las piezas musicales. Tambin tienen lugar fenmenos similares a la habituacin y la sensibilizacin con objetos meta consumibles, como la comida y el agua. La exposicin repetida a la comida, por ejemplo, provocar un descenso de la conducta dirigida a la alimentacin. La disminucin de la conducta dirigida a alimentos normalmente puede atribuirse a la reduccin del hambre o saciedad, pero tambin pueden estar involucrados los mecanismos generales de la habituacin.

31

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

TERMINOS CLAVE
Adaptacin sensorial Reduccin temporal en la sensibilidad de los rganos sensoriales provocada por la estimulacin repetida o excesiva. Arco reflejo Estructura neural que consiste en una neurona aferente (sensorial), una interneurona y una neurona eferente (motora) y que permite que un estmulo pueda elicitar una respuesta refleja. Conducta apetitiva Conducta que tiene lugar al principio de una secuencia natual de conducta y que sirve para poner al organismo en contacto con un estmulo desencadenante. (Vase tambin Estmulo supranormal Estmulo seal artificial-mente agrandado o exagerado que elicita una respuesta inusualmente vigorosa.

Fatiga Disminucin temporal de la conducta causada por el uso repetido o excesivo de los msculos involucrados en la conducta. Interneural Neurona de la mdula espinal situada entre la neurona aferente (sensorial) y la neurona eferente (motora) en el arco reflejo. Modo de bsqueda focalizada Segundo componente de la secuencia de conducta de alimentacin, tras la bsqueda general, en el que el organismo pone en marcha una conducta centada en la localizacin de un estmulo particular que indica la presencia de alimento. La bsqueda focalizada es una forma de conducta apetitiva ms directamente relacionada con el alimento que la busqueda general. Modo de bsqueda general Primer compnente de la secuencia de conducta de alimentacin, en la que el organismo pone en marcaha una conducta motora sin direccin fija. La bsqueda general es una forma de conducta apetitiva. Modo de manipulacin del alimento ltimo componente de la secuencia de conducta de alimentacin en el que el organismo manipula y consume el alimento. Es similar a lo que los etlogos llaman conducta consumatoria. Neurona aferente Neurona que transmite mensajes de los rganos de los sentidos al sistema nervioso central. Tambin recibe el nombre de neurona sensorial. Neurona eferente Neurona que transmite los impulsos a los msculos. Tambin llamada neurona motora. Neurona motora Lo mismo que neurona eferente. Neurona sensorial Lo mismo que neurona aferente.

modo de bsqueda general y modo de bsqueda focalizada.)

Concucta consumatoria Conducta que lleva a consumar o completar una secuencia natural de conducta. La respusta consumatorias son, por lo general, patrones de accin modal especficos de la especie. (Vase tambin modo de manipulacin del alimento.) Deshabituacin Recuperacin de una respuesta habituada como resultado de la presentacin de un estmulo externo e intenso. Efecto de habituacin Disminucin progresiva en el vigor de la conducta elicitada que puede tener lugar con la presentacin repetida del estmulo elicitante. Efecto de sensibilizacin Incremento en el vigor de la conducta elicitada que puede resultar de la presentacin repetida del estmulo elicitante o de la exposicin a un estmulo externo intenso. Estmulo desencadenante Lo mismo que estmulo seal. Estmulo seal Rasgo especfico de un objeto o animal que elicita una pauta de accin modal en otros organismos. Tambin llamado estmulo desencadenante.

32

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Capitulo 2: Conducta elicitada, habituacin y sensibilizacin
Juan Carlos Cabrera 2009/2010

PAM Abreviatura de pauta de accin modal. Pauta de accin modal Patrn de respuesta exhibido de forma similar por la mayora de los miembros de una misma especie. Las pautas de accin modal se utilizan como unidades bsicas de conducta en las investigaciones etolgicas de comportamiento. Abreviatura PAM. Proceso a Lo mismo que proceso primario en la teora de proceso oponente de la motivacin. Proceso b Lo mismo que proceso oponente en la teora de proceso oponente de la motivacin. Proceso de habituacin Mecanismo neural activado por la repeticin de un estmulo que reduce la magnitud de las respuestas elicitadas por ese estmulo. Proceso de sensibilizacin Mecanismo neural que incrementa la magnitud de las respuestas elicitadas por un estmulo. Proceso oponente Mecanismo compensatorio que tiene lugar en respuesta al proceso primario elicitado por eventos biolgicamente significativos. El proceso oponente provoca cambios fisiolgicos y conductuales opuestos a los que provova el proceso primario. Tambin llamado proceso b. Proceso primario Primer proceso elicitado por un evento biolgicamente significativo. Tambin llamado proceso a.

Recuperacin espontnea Recuperacin de una respuesta habituada o de una respuesta exinguida tras un perodo de descanso. Reforzador Estmulo cuya administracin inmediatamente posterior a una respuesa incrementa la probabilidad futura de dicha respuesta. Sistema de estado Estructuras neurales que determinan el nivel general de responsividad o tendencia a responder del organismo.

Sistema E-R Ruta neural ms corta que conecta los rganos sensoriales estimulados por un estmulo elicitante con los msculos involucrados en la produccin de respuesta elicitada. Tolerancia a las drogas Reduccin en la efectividad de una droga como resultado del uso repetido de la droga.

33

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera - 2009/2010

Los primeros aos del acondicionamiento clsico


Los descubrimientos de Vul'fson y Snarskii El paradigma de condicionamiento clsico

Situaciones experimentales
Condicionamiento del miedo. Condicionamiento del parpadeo. Seguimiento del signo. Aprendizaje de aversin al sabor.

Procedimientos de condicionamiento pavloviano excitatorio


Procedimientos tpicos de condicionamiento pavloviano. Medida de las respuestas condicionadas. Procedimientos de control en el condicionamiento clsico. Eficacia de los procedimientos tpicos de condicionamiento.

Condicionamiento pavloviano inhibitorio


Procedimientos de condicionamiento inhibitorio. Mediacin de la inhibicin condicionada.

Predominio del condicionamiento clsico

35

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

El condicionamiento clsico es el mecanismo ms simple por el cual los organismos pueden aprender acerca de las relaciones entre estmulos y cambiar su conducta en conformidad con la misma. Permite a los seres humanos y a los dems animales aprovecharse de la secuencia ordenada de eventos de su ambiente y aprender qu estmulos tienden a ir con qu evento.

Los Primeros aos del condicionamiento clsico

(pgina 60 del libro)

Comenzaron con el trabajo del fisilogo ruso Ivan P. Pavlov. Los descubrimientos de Edwin B. Twitmyer sobre el condicionamiento clsico, que realiz en su tesis doctoral, en el que no investig sistemticamente las implicaciones y sus hallazgos no despertaron gran atencin. Como una estensin ms de los estudios que Pavlov realiz sobre la digestin, su equipo tnico descubri que los perro secretaban jugos gstricos en respuesta de la mera visin de la comida o la persona que normalmente se las suministraba. Sus tcnicos del laboratorio lo llamaban "secreciones psqicas" .

Los descubrimientos de Vul'fson y Snarskii


Los primeros estudios sistemticos sobre el condicionamiento clsico fueron realizados por S. G. Vul'fson y A. T. Snarskii en el laboratorio de Pavlov. Vul'fson estudi la respuesta salival de los perros con productos naturales. Despus de que los perros hubieran experimentado la sensacin provocada por estas sustancias en sus bocas, la mera visin de la misma era suficiente para provocar salivacin. Snarskii extendi estas observaciones a sustancias artificiales. El aprendizaje de objeto, requiere asociar diferentes caractersticas de un mismo objeto.

El paradigma de condicionamiento clsico


El procedimiento bsico de Pavlov para el estudio de la salivacin condicionada conlleva dos estmulos: un tono o luz que no provoca salivacin al principio y un alimento o solucin cida situada en la boca que provoca una fuerta salivacin. EC o Estmulo condicionado sera la luz. EI o Estmulo incondicionado sera el alimento. RC o Respuesta condicionada sera la respuesta provocada por la Luz. RI o Respuesta incondicionada sera la salivacin provocada por el alimento.
37

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

38

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Situaciones experimentales
Condicionamiento del miedo.

(pgina 63 del libro)

Watson y Rayner (1920) condicionaron la respuesta de miedo en un nio de 9 meses, Albert, a la presentacin inofensiva de una rata blanca de laboratorio. Albert se alarmaba cuando se haca sonar un fuerte sonido, as que cada vez que le presentaba la rata se golpeaba una barra de acero. Despus de cinco ensayos, Albert mostr una reaccin de miedo intenso ante la rata. Este miedo se generaliz rpidamente a otros objetos peludos. Desde el estudio de Albert, los experimentos se realizan sobre John Broadus Watson todo con ratas de laboratorio. El EI aversivo (odioso o (1878-1958) desagradable) utilizado en estos estudios es una breve descarga elctrica administrada directamente en las patas del animal mediante un rejilla metlica, con una intensidad y duracin que no provoque dao tisular (de los tejidos u organos). El EC puede ser un tono o una luz. La respuesta de miedo de las ratas es quedarse quietas, as se utiliza una tcnica popular de medida indirecta del miedo condicionado como es el procedimiento de respuesta emocional condicionada o supresin condicionada (REC) diseada por Estes y Skinner (1941). Consiste en primero ensear al sujeto (rata) a presionar una barra varias veces para obtener alimento como recompensa de forma regular. Despus comienza la segunda fase que consiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle una breve exposicin a la descarga. Espaciando los ensayos entre 15 o 20 minutos. La supresin condicionada puede ser completa, de modo que las ratas no presionen en absoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresin es especfica de del EC y cuando desaparece, los animales vuelven rpidamente a su conducta para obtener comida. Para medir cuantitativamente la suprecin condicionada se calcula una razn de supresin.
Razn de supresin = Respuesta durante EC Respuesta durante el EC + Respuesta durante el pre EC

La razn de supresin adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el numerador de la frmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el EC, la razn tiene un valor de 0,5.

39

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Algunos investigadores prefieren el procedimiento de supresin condicionada del lameteo porque requiere menos entrenamiento para hacer que las ratas beban del tubo que para que presionen una palanca y obtener comida. En el procedimiento de supresin del lameteo, se registra el tiempo que el animal tarda en completar un total de 5 segundos de lameteo como medida de la supresin de la respuesta.

Condicionamiento del parpadeo.


El reflejo palpebal es un reflejo discreto ( moderado, sin exceso, que no destaca ). Un soplo suave en un ojo hace que se parpadee. Si el aire est precedido de un tono breve, es problable que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplo de aire. En un experimento se tom dos grupos de nios de 5 meses de edad y se realizadon dos ensayos . A uno de estos grupos se emparej un tono (EC) que terminaba con un ligero soplo de aire en el ojo. Al otro el tono y el soplo nunca ocurrian juntos. En el primer ensayo la tasa de parpadeo no influyo en ninguno de los grupos, sin embargo, en el segundo ensayo, en el primer grupo la tasa fue significativamente superior al segundo grupo, debido en parte a la asociacin EC-EI que comenzaron a aprender en la primera sesin. Este experimento demostro varios aspectos importantes del aprendizaje: Primero, el condicionamiento clsico requiere del emparejamiento del EC y el EI. Segundo, el aprendizaje inicial puede no ser directamente observable. El interes por el condicionamiento palpebral en humanos se debe al hecho de que se han realizado los progresos sutanciales en la compresin de los sustratos neurobiolgicos de este tipo de aprendizaje. Las investigaciones neurobiolgicas sobre el condicionamiento palpebral se ha llevado a cabo principalmente con conejos dmesticos y fue desarrollado por Gormezano.

40

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

El condicionamiento palpebral y la bsquea del engrama. Cuando un organismo aprende algo, el resultado de este aprendizaje debe almacenarse en el cerebro. De algn modo, la red de neuronas que constituyen el sistema nervioso central (SNC) es capaz de codificar la relacin entre evento biolgicamente significativos y de utilizar esta informacin para dirigir la conducta en curso. Esta memoria biolgica se denomina engrama. Segn el punto de vista tradicional, el engrama de una respuesta condicionada concreta se almacena en regiones localizadas del cerebro. Richard Thompson y sus colegas, despus de casi cuatro dcadas buscando el engrama, reconoci que requerira un sistema conductual claramente definido en el que estuvieran precisamente especificados tanto las condiciones para el aprendizaje como el resultado motor. Estas consideraciones le llevaron a estudiar los mecanismos que subyacen al condicionamiento palpebral. La bsqueda del engrama comenz por el hipocampo. Personas con daos en esta regin revelaron perdida de habilidad en recordar conscientemente un evento reciente. Colocando una serie de electrodos a animales en el hipocampo revelaron que las clulas reflejaban el aprendizaje por una asociacin EC-EI. La ablacin del hipocampo, incluso la eliminacin de todas las estructuras cerebrales por encima del cerebro medio, no eliminaba la capacidad del animal para adquirir y retener una respuesta condicionada de parpadeo. Esto sugirie que el circuito esencial para el condicionamiento palpebral se sita en las estructuras inferiores del tronco del encfalo y el cerebelo. Los experimentos posteriores mostraron claramente que la adquiscin de una respuesta condicionada del parpadeo bien ajustada depende de un circuito neuronal situado en el cerebelo. La respuesta incondicionada elicitada por un soplo de aire en el ojo est mediada por neuronas que se proyectan sobre una regin del tronco del encfalo conocida como ncleo trigeminal. Desde all, las neuronas siguen dos rutas, una directa y otra a travs de la formacin reticular, hasta llegar al ncleo craneal motor, donde se organiza la salida conductual. Para definir este recorrido, se utilizan tres tcnicas bsicas. La primera consista en tomar registros electrofisiolgicos para verificar que las neuronas de ese circuito intervienen el la resusta EI. La segunda tcnica consista en desactivar el circuito neuronal, ya fuera permanentemente (eliminando las clulas) o temporalmente (por medio de drogas o frio), para mostrar que el circuito tiene un papel esencial en la respuesta incondincionada. Si el circuito es necesario, la alteracin de sus funciones debera eliminar la salida conductual. Finalmente, se estimul el circuito de forma artificial para mostrar que la actividad de dicho circuito era suficiente par producir la salida conductual. Las mismas tcnicas (registro elctrico, desactivacin y estimulacin) se utilizaron para definir el reorrido neuronal que media en la adquisicin y ejecucin de la respuesta condicionada.La entrada EC se trasmite hasta una regin del tronco del encfalo conocida como ncleo pontino. Desde all, al cerebelo por medio de fibras musgosas. La seal del EI llega al cerebelo a travs de fibras trepadoras. Estas dos seales se encuentran en el crtex 41

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

cerebeloso donde la convergencia de actividades produce una modificacin sinptica que altera la salida neuronal del cerebelo. Bsicamente, las fibras ascendentes actuan como maestras, seleccionando un subconjunto de conexiones para su modificacin. Este cambio definelas propiedades del estmulo (las caractersticas del EC) que sern responsables de una salida motora concreta. Esta salida est mediada por neuronas que se proyectan desde el ncleo interpositus al ncleo rojo, y finalmente, al ncleo craneal motor. A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el ncleo interpositus. Las neuronas de dicho ncleo se proyectan hacia atrs hasta el circuito del EI e inhiben la seal del mismo en la oliva inferior. Esto proporciona una retroalimentacin negativa que reduce la efectividad del EI. Muchos investigadores creen que fenmeno como el bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamiento palpebral esto podra suceder debido a que la entrada del EI est inhibida en la oliva inferior. Esta idea se ve apoyada por un experimento de Kim y colaboradores (1998), que mostr que la eliminacin de esta fuente de inhibicin eliminaba el efecto de bloqueo. Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, s interviene en formas ms complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que se inserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fcilmente un parpadeo condicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si se retira el hipocampo. Se observa un patrn de resultados similar en los pacientes amnsicos que han sufrido dao en el hipocampo. Estos pacientes no pueden recordar concientemente la relacin EC-EI. En ausncia de esta memoria esplcita, son incapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado, incluso si los pacientes no pueden recordar conscientemente la relacin EC-EI de una sesin a la siguiente. Curiosamente, la alteracin de conciencia en un individuo normal debilita la apreciacin de la relacin EC-EI con un procedimiento de huella. De nuevo, los sujetos que no pueden dar informacin explcita sobre la relacin, son incapaces de aprender.

-J.W.Grau

Seguimiento del signo.


Uno de los paradigmas experimentales que ha contribuido significativamente a la concepcin actual del condicionamiento pavloviano es el paradigma de seguimiento del signo o automoldeamiento que consiste en el movimiento hacia un estmulo que seala la disponibilidad de un reforzador, como comida, y posible contacto con el mismo. Experimentos con palomas en un laboratorio mediante la presentacin de un estimulo visual discreto y bien localizado (una tecla luminosa) justo antes de cada administracin automtica de alimentos, las palomas en vez de utilizar el estmulo visual para predecir cuando dirigirse al comedero, picoteaban la tecla aunque no era necesario para tener acceso a la comida. Demostrando que el seguimiento del signo es una herramienta til para el estudio del aprendizaje asociativo. El aprendizaje tiene lugar de forma rpida cuando EC se presenta justo antes del EI. Las palomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro. El segimiento del signo slo es posible en situaciones en las que el EC tiene una localizacin precisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximacin a la fuente y s el acercamiento al comedero. El EC tiene que ser de una modalidad y configuracin apropiada.

42

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Otro factor importante es la relacin entre la cantidad de tiempo que el sujeto pasa en el contexto experimental y la duracin de cada presentacin del EC. Se obtienen mayores niveles de seguimiento del signo con mayores exposiciones al contexto experimental en relacin a la duracin EC.

Aprendizaje de aversin al sabor.


El simple acto de comer proporciona numerosas oportunidades de aprendizaje de la asociacin. La experiencia de aprendizaje de aversin tpica consiste en ingerir una comida con un sabor muy distinto y posteriormente enfermar. Este emparejamiento, saborenfermedad, puede dar lugar a una aversin condicionada al alimento en un nico ensayo, y el aprendizaje puede tener lugar incluso si la enfermedad se manifiesta con varias horas de retraso con respecto a la ingestin de la comida. Otro hallazgo interesante es que el 20% de las personas que enfermaron estaban seguras de que no lo provoc la comida. Lo que indica que el aprendizaje de aversin al sabor puede ser independiente de los procesos de pensamiento racional y que puede ser contrario a las conclusiones de una persona sobre la causa de su enfermedad. Personas con malestar gstrico producidos por tratamientos mdicos, como en quimioterapia del cncer que suele producir nuseas, pueden adquieren aversiones a los alimentos ingeridos justo antes de las sesiones, contribuyendo a la falta de apetito, a la supresin de la ingesta de alimento o anorexia. El desarrollo de tumores, depresiones severas y la anorexia nerviosa, entre otras, pueden contribuir a incrementar la probabilidad de aprender aversin al sabor.
La aversin al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposicin a radiacin) similar a otros ejemplos de condicionamiento clsico, y sigue las mismas leyes de aprendizaje en muchos aspectos. Tambin tiene caracteristicas especiales: Primero, puede aprenderse con un solo ensayo aversin al sabor por el emparejamiento del sabor y la enfermedad.

Segundo,

puede darse despus de varias horas de la exposicin al nuevo sabor. Probablemente sea un aprendizaje demorado de la aversin al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con efecto retardado.

43

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Procedimientos de Condicionamiento Pavloviano Excitatorio(pgina 74 del libro)


Procedimientos tpicos de condicionamiento pavloviano.
Uno de los factores crticos que determinan el curso del condicionamiento clsico es la ordenacin temporal del EC y el EI. Pequeas variaciones en la forma de emparejarlos pueden tener importantes efectos en la intensidad de la RC. A continuacin se muestran cinco procedimientos comunes de condicionamiento clsico.
La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estmulo aparece y desaparece. Cada configuracin EC y EI representa un nico ensayo de condicionamiento.

Tiempo
Inicio Final

EC Condicionamiento de demora corta EI

Procedimiento de condicionamiento clsico en el que el estmulo condicionado aparece poco antes del estmulo incondicionado en cada ensayo de condicionamiento.

EC Condicionamiento de huella EI

Procedimiento de condicionamiento clsico en el que el estmulo incondicionado se presenta poco despus de que haya terminado el estmulo condicionado.

EC Condicionamiento de demora larga EI

Similar al procedimiento de condicionamiento de demora corta, en que el EC comienza antes que el EI, sin embargo, EI se demora ms tiempo (5-10 minutos).

EC Condicionamiento simultaneo EI

Procedimiento de condicionamiento clsico en el que el estmulo condicionado y el incondicionado se presenta simultneamente en cada ensayo condicionado.

EC Condicionamiento hacia atrs EI


44

Procedimiento de condicionamiento clsico en el que el estmulo condicionado se presenta en todos los ensayos despus del estmulo incondicionado.

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Un experimento tpico de condicionamiento clsico, los episodios EC-EI se repiten varias veces a lo largo de la sesin de entrenamiento. El tiempo entre el final de un ensayo y el comienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del EC y el comienzo del EI en un mismo ensayo se llama intervalo entre estmulos o intervalo EC-EI.

Medida de las respuestas condicionadas.


Para poder medir el condicionamiento, en cualquiera de los procedimientos anteriores, hay que realizar un ensayo de prueba, consistente en la presentacin del EC aislado (sin el EI) y observar la respuesta del EC sin la contaminacin procedente de la respuesta provocada por el EI. Estos ensayos pueden introducirse periodicamente a lo largo del curso del entrenamiento para hacer un seguimiento del proceso de aprendizaje. La conducta EC puede cuantificarse: Por la magnitud de la respuesta condicionada (Pavlov midi en nmero de gotas de saliva elicitada por un EC). Por la probabilidad de la respuesta (en estudios de condicionamiento palpebral, el porcentaje de ensayos en los que el EC provoca una respuesta condicionada). Por latencia de la respuesta (es la cantidad de tiempo que pasa entre el principio del EC y la aparicin de la respuesta condicionada). En procedimientos de demora y huella, el EC aparece de forma aislada al principio de cada ensayo, por lo que puede utilizarse como medida del aprendizaje al no estar contaminada por el EI. Por el contrario, ensayos de condicionamiento simultneo y hacia atrs la respuesta durante el EC puede reflejar presencia del EI o su presentacin reciente. Por tanto, los ensayos de prueba resultan cruciales para evaluar el aprendizaje en estas dos.

Procedimientos de control en el condicionamiento clsico.


Un ensayo de prueba vlido no es suficiente para tener evidencias concluyentes de condicionamiento clsico. En los estudios de habituacin y sensibilizacin tan slo eran de inters los efectos de exposicin previa al un estmulo. El procedimiento de comparacin o control consista en la ausencia de exposicin al estmulo. Cuando el estudio es la forma en la que se asocian los EC y EI, los procedimientos de control son ms complicados. Una asociacin EC-EI implica que dos eventos se han conectado de alguna forma. Despus EC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo ms que una familiaridad. Para concluir que se ha establecido asociacin, debemos asegurarnos de

45

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

que el cambio conductual observado no podra haberse producido por la mera presentacin de EC o del EI por separado. El incremento en la respuesta podra resultar de la sensibilizacin y no por un proceso asociativo. La presentacin de un estmulo activador, como la comida a un animal hambriento, puede incrementar la conducta provocada por un estmulo menos efectivo, tal como un tono, sin que se haya establecido ninguna asociacin entre los dos estmulos. Por tanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC y el EI podra ser, en realidad, el resultado de una mera exposicin al EI. Los casos en los que la mera exposicin al EI da lugar a respuestas similares a la respuesta condicionada reciben el nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante el EC representa una asociacin entre EC-EI, en lugar de sensibilizacin debido a la exposicin a los EC y EI, se requieren procedimientos de control. Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en el que los estmulos condicionado e incondicionado se pesentan en momentos aleatorios uno respecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizaje asociado. Un procedimiento ms til es el denominado control desemparejado explcito, que consiste en la presentacin de los estmulos condicionados e incondicionado en diferentes ensayos, pero con el suficiente espacio temporal para evitar que se asocien.

Eficacia de los procedimientos tpicos de condicionamiento.


En general, se ha observado poco condicionamiento en los procedimientos de condicionamiento simultneo, en los que el intervalo EC-EI es cero. Una ligera demora de la presentacin EI tras el EC a menudo facilitaba la Respuesta Condicionada. Sin embargo, si el intervalo se incrementaba ms, la RC disminua. Incluso en el procedimiento de aversin al sabor, donde el aprendizaje es posible con intervalos de 1 2 horas, la RC disminuye a medida que se aumente el intervalo. Se consolida la idea de que el condicionamiento es ms efectivo cuando el EC es una buena seal de que EI aparecer pronto. El valor de la seal es mejor en el procedimiento de demora corta, en el que el EI tiene lugar poco despus de la aparicin del EC. El valor de la seal EC disminuye a medida que se incrementa el intervalo EC-EI. Tambin el EC es mal predictor del EI en los procedimientos simultneo y de huella. El procedimiento simultneo se presenta el EC junto con EI y por tanto EC no seala la paricin del EI. En el intervalo de huella el EC va seguido por el intervalo de huella en lugar del EI.

46

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

El condicionamiento hacia atrs produce resultadoa ambiguos. Algunos han observado condicionamientos excitatorio y otros de tipo inhibitorio, mientras que otros encontraron excitatorios e inhibitorio. Nuevas tendencias emergentes sobre los procedimientos de demora, simultneo, de huella y hacia atrs, conceptualizan que todos ellos producen un aprendizaje slido y una respuesta condicionada vigorosa, pero lo que los sujetos aprenden es direrente en cada caso. En vez de aprender una mera asociacin EC-EI, se asume que tambin se aprende cundo aparece el EI en relacin al EC, denominadose tal fenmeno hiptesis de la codificacin temporal. La idea es que puede obtenerse diferentes tipos de RC dependiendo de la informacin temporal acerca del EI que proporciona el EC.

Condicionamiento Pavloviano Inhibitorio

(pgina 79 del libro)

La exposicin a estmulos aversivos impredecibles es muy perturbador y produce lceras de estmago y otros sintomas fisiolgicos del estrs. Otra fuente de estrs es el ataque de pnico (sensacin repentina de miedo o incomodidad, acompaada de sntomas fsicos -por ejemplo, taquicardia- y una sensacin de desastre inminente). Cuando son frecuentes se dice que el individuo sufre de un trastorno de pnico y a veces estas personas pueden predecirlos. En un estudio con estos individuos se midieron la ansiedad general de los sujetos antes y despus de cada tipo de ataque (predecibles e impredecibles). Antes de los ataques los Niveles de ansiedad general de individuos con trastorno de pnico niveles de ansiedad eran similares, antes y despus de ataques de pnico previstos e imprevistos. despus del ataque de pnico la ansiedad se incrementaba si este era imprevisto y disminua tras un ataque previsto. Demostrando que son preferibles los ataque cuando son predecibles. Las seales que predicen la ausencia de un estmulo aversivo son estmulos condicionados inhibitorios.

47

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Procedimientos de condicionamiento inhibitorio


La inhibicin condicionada tiene un requisito importante, y es que, para que la ausencia de EI sea significativa, este debe ocurrir peridicamente en la situacin. Procedimiento estandar inhibicin condicionada. de

Procedimiento estndar de inhibicin condicionada. En algunos ensayos (Tipo A) el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta junto con el EC- y se omite el EI. El procedimiento resulta efectivo para condicionar propiedades inhibitorias al EC-.

Se requiere dos estimulos condicionados y dos tipos de ensayo de condicionamiento, uno para el condicionamiento excitatorio y otro para el condicionamiento inhibitorio.

Ensayo Tipo A (condicionamiento exitatorio): Siempre que aparece el EI va anunciado por el estimulo condicionado EC+, conviertiendose as por asociacin en una seal del EI y sirve para proporcionar el contexto excitatorio necesario para el desarrollo de la inhibicin condicionada. Ensayo B (condicionamiento inhibitorio): El EC- se presenta en el contexto excitatorio proporcionado por el EC+, pero no se empareja con el EI. Esto convierte al EC- en un inhibidor condicionado. A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que el animal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidos de la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais. Ejemplo: Un semforo rojo en un cruce transitado es una seal (EC+) de un peligro potencial (EI). Sin embargo, si un agente de polica indica con su silbato (EC-) que debemos cruzar, a pesar de la luz roja, es poco probable que tengamos un accidente y el peligro sealado por el semforo queda bloqueado o inhibido por silbato. Contingencia o correlacin negativa entre el EC y el EI. Otro procedimiento para producir inhibicin condicionada que no requiere un estmulo excitatorio EC+ explcito; en lugar de eso, se utiliza un nico EC- que est negativamente correlacionado con el EI. Una correlacin o contingencia negativa indica que el EI es menos probable tras el EC que en otro momento.
48

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

El EC seala una reduccin en la probabilidad de que aparezca el EI. Como por ejemplo, Los nios que se meten con un compaero en clase y dejan de hacerlo en presencia del profesor. El profesor funciona como EC- que seala un perodo libre de acoso, o ausencia EI. En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequea. Es mucho ms probable que el EI aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y el EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentacin del EI no puede predecirse. El EI tiene lugar de forma probabilstica, a diferencia del procedimiento estndar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presenta el EC- junto con el EC+. As podemos predecir el momento preciso de la aparicin del EI, y tambin permite predecir cundo no va a aparecer, posibilitando la codificacin temporal de la ausencia del EI.

Medicin de la inhibicin.
Los estmulos inhibitorios elicitan reacciones opuestas a los estmulos condicionados excitatorios. Si los estmulos condicionados excitatorios provocan salivacin, los estmulos inhibitorios provocan la supresin de la salivacin. Sistema de respuesta bidireccionales. La identificacin de tendencias de respuesta opuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direcciones opuestas con respecto a una lnea base de ejecucin normal. Por ejemplo, una paloma puede acercarse a una tecla luminosa asociada con la presentacin subsiguiente de comida o cuando se utiliza un procedimiento inhibitorio, alejarse de la luz. Una limitacin es que este mtodo funciona slo con respuestas que pueden ir en direcciones opuestas. Otra es que esta tcnica puede mostrar slo el efecto neto de la excitacin y la inhibicin. El sujeto se aproxima a EC si excitacin es mayor a la inhibicin y se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Esto invalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatorias e inhibitorias) La prueba del estmulo compuesto o sumacin. Cuando la conducta no es bidireccional el procedimiento ms aceptado por los investigadores para la medicin de la inhibicin condicionada es la prueba de sumacin o del estmulo compuesto. La prueba requiere observar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio.

49

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Experimento de lameteo con ratas de laboratorio:

Prueba del estmulo compuesto de la inhibicin en un experimento de supresin del lameteo. Los estmulos A y B se condicionaron como estmulos excitatorios mediante la presentacin de cada uno de ellos por separado junto con la descarga (A+ y B+). El estmulo X se condicion como inhibidor presentndolo junto con el estmulo A sin la descarga (AX-). El estmulo Y era un estmulo de control que no haba intervenido en ningn condicionamiento excitatorio o inhibitorio. A era una luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.

El procedimiento de prueba del estmulo compuesto para la inhibicin condicionada sugiere que la presentacin de un inhibidor condicionado o de una seal de seguridad puede reducir los efectos estresantes de una experiencia aversiva. La prueba de retraso en la adquisicin. Si un estmulo inhibe de forma activa una respuesta particular, entonces debera ser especialmente difcil de condicionar ese estmulo para que provoque la conducta.

50

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Retomando el experimento anterior, en una cmara experimental diferente a las utilizadas anteriormente para realizar el entrenamiento inhibitorio, Cole y sus colegas tomaron el estmulo X (que haba sido condicionado como inhibidor) y el estmulo Y ( que no haba utilizado con anterioridad en el procedimiento de condicionamiento ) y realizadon una prueba de retraso en la adquisicin emparejando tres veces cada uno de estos estmulos con una descarga. Tras los tres ensayos sometiern a prueba para ver cul provocaba una mayor supresin de la conducta de beber. El tiempo empleado en completar un total de 5 segundos de ingestin de agua fue mayor en presencia del estmulo de control Y que en presencia del estmulo X. El entrenamiento inhibitorio inicial de X retras la adquisicin de propiedades excitatorias de miedo condicionado. La inhibicin condicionada puede ser difcil de distinguir de otros procesos conductuales. La mejor estrategia es utilizar ms de una prueba y asegurarse de que las diferentes pruebas sealan la misma conclusin. La estrategia dual ( utilizacin tanto la prueba de estmulo compuesto como de la del retraso en la adquisicin) ha gozado de popularidad desde que lo propuso Rescorla (1969).

PREDOMINIO DEL CONDICIONAMIENTO CLSICO

(pgina 86 del libro)

El condicionamiento clsico se estudia normalmente en situaciones de laboratorio, aunque tambin ocurre en una gran variedad de situaciones fuera de este. Aparece con mayor probabiliad cuando un evento predice a otro regularmente y con una demora corta entre el EC y el EI. Un rea de investigacin particularmente interesante es cmo las personas llegan a considerar que un evento es la causa de otro, denominado juicios de causalidad humanos. Los estudios sobre causalidad se parecen a los estudios sobre condicionamiento pavloviano en que ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en el grado en que esos dos eventos estn relacionados. Los mecanismos asociativos pavlovianos no se limitan a los perros de Pavlov, sino que pueden tener un importante papel en los juicios de causalidad informales que realizamos en el curso de nuestra vida cotidiana. El condicionamiento pavloviano puede dar lugar al condicionamiento de preferencias y aversiones alimenticias, adquisicin de miedo (ansiedad, fobias y trastornos del pnico), tolerancia y adicin a las drogas ... El condicionamiento pavloviano tambin interviene en las respuestas de los nios y de las madres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debe mantener al beb en una postura determinada, que proporcione estmulos tctiles especiales tanto para la madre como para el nio. Los estmulos tctiles que percibe el nio pueden condicionarse y elicitar respuestas de orientacin y succin. Los estmulos tctiles
51

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo de secrecin de lecha cuando el nio llora o cuando llega lahora habitual de amamantamiento. Todos estos estmulos preceden de forma regular a la succin del beb y por tanto pueden condicionarse a la estimulacin propia de la succin y adquirir la capacidad de provocar la secrecin de lecha como respuesta condicionada. Las respuestas anticipatorias de orientacin y succin y la respuesta anticipatoriade secrecin de leche hace que la lactancia sea ms satisfactoria tanto para la madre como para el nio. El condicionamiento pavloviano tambin es importante en el aprendizaje acerca de situaciones sexuales. Estudios realizados con animales machos y como estmulo condicionado la visin de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acaban aproximandose a los estmulos que sealan la disponibilidad de un compaero sexual. La exposicin a un EC sexual realizan la respuesta copulatoria ms rpidamente, compiten mejor con otros machos por el acceso a una hembra, muestran ms conducta de cortejo, liberan una mayor cantidad de esperma y muestran un incremento en los niveles de testosterona y hormona luteinizante. Incluso incrementan el nmero de cras en algunas especies de peces y codornices estudiadas.

COMENTARIOS FINALES En este Captulo se ha continuado el estudio sobre la conducta elicitada desplazando la atencin de la habituacin y la sensibilizacin al condicionamiento clsico, ms complejo, ya que est mediada por mecanismos asociativos. El condicionamiento clsico es una de las principales tcnicas para investigar cmo se aprenden las asociaciones y pueden intervenir en muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado, el aprendizaje puede tener lugar de manera rpida o lenta. Con algunos procedimientos, se aprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibir una respuesta particular en presencia del estmulo condicionado. El condicionamiento exitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirve para mejorar la efectifidad con la que nos enfrentamos a eventos biolgicamente significativos.

52

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

TRMINOS CLAVE
Aprendizaje de objeto Aprendizaje de asociaciones entre diferente elementos de un objeto. Automoldeamiento Lo mismo que seguimiento del

Ensayo de condicionamiento Episodio de entrenamiento compuesto por la presentacin de un estmulo condicionado con ( o sin) un estmulo incondicionado. Ensayo de prueba Ensayo en el que se presenta el estmulo condicionado sin el estmulo incondicionado. Esto permite medir la respuesta condicionada en ausencia de la respuesta incondicionada. Estmulo condicional o condicionado Estmulo que inicialmente no provoca una respuesta particular, pero que adquiere la capacidad de hacerlo como resultado del desarrollo de una asociacin con un estmulo incondicionado. Abreviatura EC. Estimulo incondicional o incondicionado Estmulo que elicita una respuesta particular sin necesidad de entrenamiento. Abreviatura EI. Hiptesis de la codificacin temporal Idea segn la cual el condicionamiento pavloviano lleva, no slo al aprendizaje de que el EI ocurre, sino tambin de cundo ocurre en relacin al EC. El EC representa ( o codifica) la disposicin temporal del EI. Intervalo de huella Intervalo entre el final del estmulo condicionado y el principio del estmulo incondicionado en los ensayos de condicionamiento de huella. Intervalo EC-EI estmulos. Lo mismo que intervalo entre

signo.
Condicionamiento de demora corta Procedimiento de condicionamiento clsico en el que el estmulo condicionado aparece poco antes del estmulo incondicionado en cada ensayo de condicionamiento. Condicionamiento de huella Procedimiento de condicionamiento clsico en el que el estmulo incondicionado se presenta poco despus de que haya terminado el estmulo condicionado. Condicionamiento hacia atrs Procedimiento de condicionamiento clsico en el que el estmulo condicionado se presente en todos los ensayos despus del estmulo incondicionado. Condicionamiento simultneo Procedimiento de condicionamiento clsico en elque el estmulo condicionado y el incondicionado se presentan simultneamente en cada ensayo de condicionamiento. Control aleatorio Procedimiento en el que los estmulos condicionado e incondicionado se rpresentan en momentos aleatorios uno con respecto a otro. Control desemparejado explcito Procedimiento en el que se presentan tanto el estmulo condicionado como el incondicionado, pero con el suficiente tiempo entre ellos como para que no se asocien el uno del otro. EC Abreviatura de estmulo condicionado. EI Abreviatura de estmulo incondicionado.

Intervalo entre ensayos Cantidad de tiempo que pasa entre dos ensayos consecutivos. Intervalo entre estmulos Cantidad de tiempo que pasa entre el comienzo del estmulo condicionado (EC) y el comienzo del estmulo incondicionado (EI) durante un ensayo de condicionamiento clsico. Tambin llamado intervalo EC-EI. Latencia Tiempo transcurrido entreel comienzo de un estmulo (o el comienzo de un ensayo) y la respuesta que se da a ese etmulo.

53

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 3: Condicionamiento clsico: fundamentos
Juan Carlos Cabrera

Magnitud de la respuesta Medida del tamao, vigor o extensin de una respuesta. Probabiliad de una respuesta Probabilidad de que se realice una respuesta, normalmente representada en trminos de porcentaje de ensayos en los que tiene lugar la respuesta. Prueba de retraso en la adquisicin Procedimiento de prueba que identifica un inhibidor condicionado si ese estmulo tarda ms tiempo en adquirir propiedades exitatorias que un estmulo de comparacin. Prueba de sumacin Lo mismo que prueba del estmulo compuesto. Prueba del estmulo compuesto Procedimoento de prueba que sirve para identiricar un inhibidor condiconado si dicho estmulo reduce a respuesta elicitada por un estmulo condicionado excitatorio. Tambin llamado prueba de sumacin. Pseudocondicionamiento Incremento en la respuesta que puede provocar un estmulo cuyas presentaciones estn entremezcladas con las presentaciones del estmulo condicionado (EC) sin que se establezca una asociacin entre el estmulo y el EI. RC Abreviatura de respuesta condicionada. REC Abreviatura de respuesta emocional condicionada. Respuesta condicional o condicionada Respuesta que se realiza ante el estmulo condicionado como resultado del condicionamiento clsico. Abreviatura

Respuesta emocional condicionada Supresin de una conducta instrumental positivamente reforzada (por ejemplo, presin de una palanca para obtener alimento) provacada por la presentacin de un estmulo que se ha asociado con un estmulo aversivo. Abreviatura REC. Tambin llamada supresin condicionada. Respuesta incondicional o incondicionada Respuesta que provoca un estmulo sin necesidad de entrenamiento previo. RI Abreviatura de respuesta incondicionada. Seguimiento del signo Movimiento hacia un estmulo que seala la disponibilidad de un reforzador positivo, como comida, y posible contacto con el mismo. Tambien llamada automoldeamiento. Supresin condicionada del lameteo Similar a la respuesta emocional condicionada (REC) o procedimiento de supresin condicionada. Sin embargo, en lugar de utilizar la presin de la palanca para obtener la comida como conducta a suprimir por el miedo condicionado, la lnea de base es el lameteo de un tubo con agua por parte de ratas sedientas. La presentacin de un EC condicionado al miedo ralentiza la tasa de lameteo. Supresin condicionada emocional condicionada. Lo mismo que respuesta

RC.

54

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera 2009/2010

A qu deben su eficacia los estmulos condicionados e incondicionados?


Respuestas iniciales a los estmulos. La novedad de los estmulos condicionados e incondicionados. Intensidad y saliencia del EC y del EI. Relevancia o pertinencia EC-EI. El conceto de fuerza biolgica.

Qu determina la naturaleza de la respuesta condicionada?


El modelo de sustitucin del estmulo. Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo. El EC como determinante de la forma de la RC. Conducta condicionada y sistemas de conducta. Aprendizaje E-R frente a aprendizaje E-E.

Cmo se asocian los estmulos condicionado e incondicionado?


El efecto de bloqueo. El modelo de Rescola y Wagner. Otros modelos de condicionamiento clsicos.

Comentarios finales

55

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

A qu deben su eficiacia incondicionados? (pgina 91 del libro)

los

estmulos

condicionados

Esta es quiz la pregunta ms importante en relacin al condicionamiento clsico. Planteada originalmente por Pavlov y tambin en la actualidad est recabando cada vez ms la atencin de los investigadores.

Respuestas iniciales a los estmulos.


Segn defini Pavlov los trminos condicionado e incondicionado: un estmulo condicionado (EC) inicialmente no provoca la respuesta condicionada, pero adquiere la capacidad de hacerlo como resultado del desarrollo de una asociacin con el estmulo incondicionado (EI). Por el contrario, el EI elicita eficazmente la respuesta en custin desde el principio, sin ningn entrenamiento previo. La comparacin de los ECs y de los EIs son relativas, pues en un evento particular puede servir de EC respecto a un estmulo y de EI respecto a otro. Una exposicin salina en un experimento de aversin al sabor actua como EC y la droga que produce el malestar como EI; mientras que en un experimento de seguimiento del signo la exposicin salina se podra considerar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EI depende de su relacin con otros estmulos de la situacin.

La novedad de los estmulos condicionados e incondicionados.


Tanto si el estmulo condicionado como el incondicionado es familiar, el aprendizaje se desarrolla con mayor lentitud que si el EC y el EI son novedosos. Los estudios sobre el papel de la novedad de los estmulos en el condicionamiento clsico suelen realizarse en dos fases. Primero se expone repetidamente y de forma aislada al sujeto al estmulo que posteriormente va a utilizarse como EC y despus se empareja con un EI segn el condicionamiento clsico. La familiarizacin que se produce por la exposicin incial retrasa el condicionamiento posterior de dicho estmulo. Este fenmeno se denomina efecto de preexposicin al EC o efecto de inhibicin latente. La habituacin y efecto de preexposicin al EC sirven para limitar la cantidad de procesamiento y atencin a los estmulos que se sabe carecen de consecuencias. El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizados con un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC

57

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

ms lentamente que los participantes para los cuales el EI es novedoso. Este resultado se denomina efecto de preexposicion al EI. Dos son las explicaciones por parte de los investigadores de los efectos de preexposicion al EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de los estmulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en la que los participantes recuerdan lo sucedido en fase de experimento alterando la respuesta condicionada. Los mecanismos que reduzcan el recuerdo de preexposicin en el momento de la prueba fortalecen la respuesta condicionada.

Intensidad y saliencia del EC y del EI.


Otra variable importante para el condicionamiento clsico es la intensidad de los estmulos condicionados e incondicionados. La respuesta es ms fuerte cuanto ms intenso sean estos. Un estmulo puede adquirir saliencia o significacin aumentando su intensidad, lo que hace que despierte mayor atencin. Por ejemplo, una rata presta ms atencin a la sal si sufre un deficit nutricional de sal.
Objeto utilizados como EC en los estudios sobre condicionamiento sexual con codornices macho para sealar la oportunidad de copula. El objeto de la izda. es "arbitrario" est hecho de un material lanudo. El objeto de la derecha inlcuye una cabeza y algunas plumas del cuello de un ejemplar de hembra disecado, de modo que contenga alguna de las claves que proporciona la hembra.

Estudios sobre condicionamiento sexual de la codorniz macho domstica, muestran que se observa una respuesta sexual condicionada ms intensa utilizando un EC que incluya algunas de las caractersticas estimulares de la hembra de codoniz.

Relevancia o pertinencia EC-EI.


El aprendizaje depende de la relevancia o adecuacin del EC con respecto al EI que se administra. El sabor se asocia fcilmente al malestar y las claves audiovisuales se asocian al dolor perifrico.
condicionamiento Gustativo + audiovisual Gustativo + audiovisual Descarga Malestar

El experimento se emparejaron un estimulo audiovisual y un estmulo gustativo, presentados simultaneamente, con una descarga o con una sensacin de malestar, dependiendo del grupo. Despus los sujetos se pusieron a prueba con los estmulos gustativos y audiovisuales por separado. Las ratas condicionadas con una sensacin de malestar adquirieron una mayor aversin a las claves gustativas que las audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversin a las claves audiovisuales que a las gustativas.

58

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Se demostr con ratas recien nacidas que la experiencia con sabores o con la enfermedad (o con las claves audiovisuales y el dao perifrico) no es necesaria para que se d el efecto de relevancia del estmulo. Ms bien, el fenmeno parece reflejar una predisposicin gentica para la asociacin selectiva de ciertas combinaciones de estmulos condicionados e incondicionados. Se ha documentado otras situaciones del efecto de relevancia del estmulo de aversin al sabor en palomas que asocian la comida mejor con claves visuales que con auditivas y una descarga ms efectivas con las auditivas. En cuanto a efectos de relevancia del estmulo en la adquisicin del miedo en monos, estos parecen que tienen una predisposicin para aprender a temer a las serpientes de juguete que si lo hacen a flores de plstico. Esta selectividad de estmulos en el aprendizaje de miedos tambin se muestran en las personas, cuando participantes en estudios, han asociado fotografas de serpientes y araas con una descarga con mayor facilidad que fotografas de flores y casas.
Los procedimiento de condicionamiento aversivo resultan ms efectivos a la hora de eliminar el tabaquismo si se combinan con otras tcnicas de modificacin conductual. La inhalacin rpida, por ejemplo, puede combinarse con un entrenamiento en autoobservacin o autoadministracin. Primero se pide al sujeto que mantenga un egistro preciso del nmero de cigarrillos que fuma, as como del momento, lugar y circunstancia en las que lo hace. Una vez conocidas la frecuencia y las circunstancias en las que fuma, se proponen dos objetivos con los que se pretende reducir gradualmente el consumo de tabaco: reducir el nmero total de cigarrillos fumados al da y reducir el nmero de situaciones en las que se permite fumar. Esta combinacin de objetivos permita restringir la conducta de fumar. El cumplimiento puede alentarse utilizando un sistema de contratos. Por ejemplo, la persona puede depositar una cantidad de dinero al comienzo del tratamiento y recuperar posiciones de este depsito cada vez que logre un objetivo.

Aproximaciones conductuales al control del tabaquismo

Se han desarrollado diversos procedimientos de condiciona-miento aversivo para que las personas dejen de fumar (Hall, Hall y Ginsberg, 1990). Los primeros intentos consistieron en una terapia aversiva en la que el acto de fumar se emparejaba con el dolor producido por una descarga elctrica. Tcnicas ms recientes se basan en los hallazgos que indican que el condicionamiento de la aversin es ms efectivo si el estmulo aversivo es relevante en relacin a la situacin. En estos procedimientos, suele utilizarse el propio acto de fumar como fuente de la estimulacin aversiva. Un procedimiento utilizado frecuentemente es el de inhalacin rpida (USDHHS, 1996), en el ue se pide al sujeto que inhale tabaco cada 6 segundos durante un periodo de tiempo hasta que surja nuseas o mareos. Esta forma de fumar es aversiva y permite condicionar una aversin al tabaco.

El concepto de fuerza biolgica Pavlov sugiri que para que un estmulo se condicionara deba tener una fuerza biolgica menor que la del estmulo incondicionado con el que se emparejaba. El concepto de "menor fuerza biolgica" se refera a que inicialmente el EC deba elicitar menos respuestas y ms dbiles que el EI.

59

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Condicionamiento de orden superior. Un estmulo puede hacer de EI tras haber sido fuertemente condicionado. Un tono emparejado repetidamente con la comida, elicitar la salivacin, as como seguimiento del signo. El concepto de fuerza biolgica dice que este tono debera ser efectivo para condicionar una luz.

El trmino orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono previamente condicionado sera el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estmulo, por ejemplo, un olor, se tratara de condicionamiento de tercer orden.

El condicionamiento de segundo orden es similar al procedimiento estandar para la inhibicin condicionada, sin embargo, parece ser el nmero de ensayos no EI es el factor crtico. Con pocos ensayos no reforzados tiene lugar condicionamiento excitatorio de segundo orden. Con un entrenamiento ms extenso, se desarrolla inhibicin condicionada. Con el condicionamiento de orden superior, el condicionamiento clsico puede acontecer sin un EI primario. El nico requisito es que estn disponibles estmulos previamente condicionados. El condicionamiento de segundo orden tambin resulta interesante como tcnica para confirmar la aparicin de condicionamiento de primer orden, que a veces no provoca directamente una respuesta condicionada, pero que el EC de primer orden puede elicitar la respuesta condicionada si es sometido a un condicionamiento de segundo orden.

Condicionamiento de orden superior del miedo


Los miedos irracionales se desarrollan muchas veces por medio del condicionamiento de oren superior. Por ejemplo, Woldpe (1990) describe el caso de una mujer que inicialmente tena miedo a las multitudes. Aunque se desconoce cmo se condicion este miedo, las multitudes haban adquirido la capacidad de elicitar miedo. Para evitar el surgimiento del miedo, la mujer iba al cine slo en el momento del da en el que haba poca gente. En una de tales visitas, el cine se llen repentinamente de estudiantes. La mujer qued muy afectada por esta experiencia y asoci los cines con las multitudes. As pues, como consecuencia

del condicionamiento de orden superior, un estmulo condicionado al miedo (las multitudes) haba condicionado elmiedo a otros estmulos (cines) que previamente resultaban inocuos. El aspecto destacable de esta experiencia es que se adquiri aversin a los estmulos del cine sin que estas claves se hubieran emparejado directamente con un estmulo incondicionado aversivo. Despus de esta terrible experiencia con el cine, la mujer evitaba ir al cine incluso cuando era poco probable que se encontrara con mucha gente. Adems, el miedo a los cines recin adquirido se generaliz a otros lugares pblicos, tales como restaurantes, iglesias y edificios pblicos, que tambin evitaba incluso si estaban vacos.

60

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Contracondicionamiento. Dos estmulos pueden quedar asociados aunque ambos eliciten inicialmente respuesta intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese estmulo con un EI que provoca una reaccin opuesta. Por ejemplo, un animal puede condicionarse para aproximarse a un estmulo que anteriormente evitaba. Precondicionamiento sensorial. Tambin pueden aprenderse asociaciones entre dos estmulos que tan slo elicitan una dbil respuesta de orientacin antes de condicionamiento. Por ejemplo, el emparejamiento del sabor de vainilla y canela quedan asociados el uno del otro en los pasteles. Una aversin a la canela por medio de envenenamiento, nos llevar a rechazar tambin pasteles con sabor a vainilla.

Qu determina la naturaleza de la respuesta condicionada?


(pg. 100 del libro)

El modelo de sustitucin del estmulo


Segn el modelo de sustitucin del estmulo de Pavlov, el EC adquiere la capacidad de funcionar de forma similar a como el EI lo haca previamente, asumiendo, que el EC activa los circuitos neuronales que previamente activaba slo el EI y elicita respuetas similares a EI. Pavlov sugiri que el condicionamiento da lugar al establecimiento de nuevos enlaces neuronales durante los emparejamientos reptidos de EC y EI, desarrollando una nueva conexin entre los circuitos que previamente activaba el EC y los que previamente activaba el EI. Establecida la conexin EC se convierte en un sustituto del EI El EI como factor determinante de la RC. EC diferentes elicitan respuetan condicionadas diferentes. La comida elicita salivacin y aproximacin; las descargas elicitan aversin y alejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los Ecs condicionados con diferentes EIs deberan provocar diferentes tipos de RC. El experimento con palomas de Jenkins y Moore (1973) compararon el condicionamiento pavloviano utilizando como EI comida y agua . Para comer las palomas picotean rpido y bruco hacia el grano y abren el pico justo antes de tomar contacto con l. Para el beber introducen el pico casi cerrado en el agua y bajo ella abren periodicamente para succionar. Las respuestas incondicionadas de comer y beber son diferentes.

61

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

El EC fue la iluminacin de una tecla durante 8 segundos y se emparej tanto para la presentacin del grano de cereal como con la disposibilidad de agua. La forma de RC se pareca a la forma de la respuesta incondicionada: El EC condicionado con la comida provocaba el picoteo relacionado con la comida y el EC condicionado con agua provocaba los picoteos relacionados con la bebida.

Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo.


Walter Cannon introdujo el concepto homeostasis para referirse a los mecanismos fisiolgicos que mantienen los aspectos crticos del cuerpo dentro de los lmites aceptables, Estos mecanismo funcionaban por procesos de retroalimentacin negativa que servan para contrarestar las alteraciones una vez que estas ya haban provocado una desviacin de los niveles optimos. Esto puede resultar ineficiente, especialmente si el proceso de compensacin o correccin tarda en activarse. Dworking (1993) sealo que las alteraciones en la homeosteasis pueden compensarse ms activamente si pueden anticiparse. El condicionamiento pavloviano proporciona los medio necesarios para tal anticipacin. Las respuetas homeostticas condicionadas se han examinado ms extensamente en relacin a la forma en que los organismos respondem a la administracin de drogas psicoactivas. Suelen provocar alteraciones fisiolgicas que afectan a la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian con la alteracin fisiolgica inducida por la droga pueden llegar a elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias. El modelo de condicionamiento de tolerancia a las drogas: Se considera que se ha desarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismas tiene un efecto cada vez menor. Tradicionalmente se ha considerado esta tolerancia como debida a procesos farmacolgicos. Shepard Siegel, en contraste ha propuesto un modelo basado en el condicionamiento clsico, utilizando el concepto de homeostasis aprendida. El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a las respuestas compensatorias condicionadas a los estmulos del entorno que se emparejan con la administracin de la droga. Una importante prediccin del modelo es que la tolerancia a la droga se ver atenuada si los sujetos reciben la droga en condiciones novedosas o en ausencia de las claves que normalmente predicen su consumo. Tambin predice que varios factores que atenan el desarrollo de las respuestas condicionadas (como la preexposicin al EC) tambin deberan atenuar el desarrollo de la tolerancia a la droga

62

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

El EC como determinante de la forma de la RC


La forma de la RC tambin esta influenciada por la naturaleza del EC. Timberlake y Grant (1975) utilizaron comida como EI, el EC fue la presentacin de otra rata justo antes de la administracin de comida, el EC no porvoco conductas de roer y morder, elicito respuestas de orientacin, aproximacin y olfateo, asi como contactos de tipo social.

Conducta condicionada y sistemas de conducta


Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo tareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a los depredadores, reproducirse y cuidad sus cras. Cada sistema consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes, dispuestos con determinado orden espacial y secuencial. La teora de los sistemas de conducta asume que la presentacin del EI en un porcedimiento de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Los estmulos condicionados con comida elictan componentes del sistema de alimentacin y los estmulos condicionados sexuales elicitan componentes del sistema de conducta sexual. Una prediccin de la teora de los sitemas de conducta es que la forma de la RC depender del intervalo EC-EI que se utilice. Este intervalo determina el lugar en que se incorporara el EC dentro de la secuencia de respuestas del sistema de conducta. La teora es claramente compatible con el hecho de que la forma de la RC est determinada por: La naturaleza del (EI) estmulo incondicionado y la naturaleza del (EC) estmulo condicionado.

Aprendizaje E-R frente a aprendizaje E-E


Historicamente la conducta condicionada se vea como una conducta elicitada directamente por el EC. De acuerdo con la teora del aprendizaje E-R, establece una nueva conexin estmulo-respueta entre el EC y la RC. La teora del aprendizaje E-E los sujetos aprenden una asociacin estimulo-estimulo entre el EC y el EI. Los sujetos responden al EC, no porque este elicite directamente una RC, sino porque el EC activa una representacin del EI. La presentacin del EC hace que el sujeto piense en el EI y esta es la causa de la conducta condicionada. Un mtodo de investigacin importante para decidir entre aprendizaje E-R y E-E es la de la devaluacin del EI.
63

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Cmo se asocian los estmulos condicionados e incondicionados ?


(pg. 109 del libro)

El efecto de bloqueo
Conlleva una secuencia de suscesos similar. Primero se asocia EC (estmulo A) y el EI. Una vez que el ECA esta bien condicionado, se aade el segundo estmulo (estmulo B) al estmulo A y se presentan los dos juntos en los ensayos de condicionamiento. El hallazgo bsico es que el condicionamiento previo de A, bloquea el desarrollo de la RC al estmulo B.

Figura 4.13. Esquema del procedimiento de bloqueo.


En la fase 1, el estmulo A se condiciona con el EI para el grupo experimental, mientras que el grupo de control recibe presentaciones desemparejadas de A y el EI. En la fase 2, ambos grupos reciben ensayos de condicionamiento en los que el estmulo A se presenta a la vez que el estmulo B y se empareja con el EI. que el menor

Este efecto se ha convertido en un Una prueba posterior con el estmulo B aislado muestra fenmeno clave del condicionamiento grupo experimental produce una respuesta condicionada clsico porque puso en duda el ante el estmulo B que el grupo de control. presupuesto de que la contigidad temporal fuese suficiente para el aprendizaje.

Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizaje de forma efectiva el EI deba ser inesperado o sorprendente.

El modelo de Rescorla y Wagner


Rescola Wagner asumieron que la sorpresividad, y por tanto le efectividad, de un EI depende de lo diferente que el EI sea en comparacin con lo que el sujeto espera. Asumen que la expectativa del EI est relacionada con las propiedades condicionadas o asociativas del estmulo que precede al EI. Una RC intensa indica una fuerta expectativa de que el EI aprecer (condicionamiento excitatorio o incremento de la fuerza asociativa); una RC dbil indica una baja expectativa del EI (condicionamiento inhibitorio o disminucin de la fuerza asociativa).

Ecuacin bsica :

V = k ( V )

: astona de aprendizaje V : valor asociativo de los estmulos k : constante relacionada con la saliencia del EC y del EI.

64

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Aplicacin del efecto de bloqueo. El modelo de Rescorla y Wagner predicen claramente el efecto bloqueo. Como se muestra en la Figura 4.13, el grupo experimental de diseo de bloqueo recibe primero un condicionamiento extenso del estmulo A, de forma que adquiere una expectativa de que el EI ocurrir siempre que se presente el estmulo A. Cuando finaliza la fase 1, VA es igual a la asntota de aprendizaje o (V A = ) . En la fase 2, el estmulo B se presenta junto con el estmulo A, y ambos van seguido del EI. De acuerdo con el modelo Rescorla-Wagner, no habr condicinamiento del estmulo B en la Fase 2, ya que el EI es perfectamente predecible por la presencia del estmulo A: ( V A+B ) = 0 El grupo de control recibe un tratamiento idntico en la Fase 2, pero para ellos la presencia del estmulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupo de control y produce nuevo aprendizaje. Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la importancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones es que, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reduciran a pesar de que siga habiendo emparejamientos con el EI.
Fase 1 A EI [A + B] B EI EI Fase 2

el EI 1

Prdida de valor asociativo a pesar de las presentacin continuada del EI. Los estmulos A y B se condicionan separadamente hasta llegar a la asntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los estmulos A y B se presentan simultneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeo al principio de la Fase 2, las propiedades condicinadas de los estmulos A y B se reducen hasta que la presentacin simultnea de los dos ECs deja de producir un exceso de expectativas.

Inhibicin condicionada. La aplicacin del modelo de Rescorla y Wagner a este procedimiento requiere que se consideren separadamente los ensayos reforzados y los no reforzados. Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias. El condicionamiento excitatorio conlleva la adquisicin de una valor asociado positivo, y cesa una vez que el organismo predice el EI perfectamente en cada ensayo. En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido cierto grado de excitacin condicionada (debido a su presentacin en los ensayos reforzados), el organismo esperar que se presente el EI siempre que aparezca el EC+, incluyendo los ensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por lo que se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia del EI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar
65

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valor asociativo positivo, la nica forma es hacer que el valor asociativo del EC- sea negativo. El modelo Rescola-Wagner explica la inhibicin condicionada asumiento que el EC- adquiere un valor asociativo negativo. Extincin de la excitacin de la inhibicin. En un procedimiento de extincin, el estmulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquirido propiedades excitatorias (EC+) habr un exceso de expectativa del EI la primera vez que el EC se presente sin el EI en la fase de extincin. Al continuar con los ensayos del EC solo, la expectativa elicitada por el EC se va acercando a la lnea que representa la ausencia del EI por medio de una reduccin gradual del valor asociativo del EC+ hasta llegar a cero. El modelo de Rescola y Wagner prdice un situacin similar para la extincin de la inhibicin condicionada. Al principio de la extincin, el EC- tiene valor asociativo negativo, esto puede considerarse una prediccin excesivamente baja del EI; el organismo predice un EI con un valor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativas a la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y el EC- termina con una fuerza asociativa igual a cero. Problemas del modelo Rescorla Wagner. 1- Su anlisis de la extincin de la inhibicin es incorrecto. Algunos investigadores han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades inhibitorias. 2- El modelo considera la extincin como lo opuesto a la excitacin, o a la vuelta a un valor asociativo cero, pero la extincin no debera verse como una mera inversin de la adquisicin. La extincin parece incolucrar el aprendizaje de una nueva relacin entre el EC y el EI. 3- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias como inhibitorias, en el modelo no pueden ser ambos. 4- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo, cabria esperar que la presencia del EC previamente condicionado interfiriera en el condicionamiento del EC aadido en la fase 2. Se encontr el resultado opuesto: un efecto de aumento o de contrabloqueo.

66

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Otro modelos de condicionamiento clsico


Modelos atencionales de condicionamiento. Las teoras atencionales difieren en sus supuestos sobre que es lo que determina la saliencia del EC en un ensayo. Pearce y Hall (1980) asumen que el grado de atencin que un animal presta al EC en un ensayo determinado depende del grado en el que el EI haya sido sorprendente en el ensayo anterior, y por tanto an tiene mucho que aprender y prestarn ms atencin al EC en el siguiente ensayo. Por el contario, si un EC iba seguido de un EI esperado en el ensayo anterior, el sujeto prestar menos atencin a ese EC en el siguiente ensayo, asumiendo que un EI esperado reduce la saliencia o la atencin dedicada al EC. Una caracteristica importante de la teoras atenciaonales es que asumen que la sorpresividad del EI en un ensao determinado altera el grado de atencian dedicado al EC en los ensayos siguientes. Esta es una diferencia importante con Rescorla Wagner que asumen que la sorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo. El supuesto de que el EI presentado en un ensayo slo afecta a lo que se aprende en el siguiente ensayo ha permitido explicar ciertos hallazgos, pero tambin tienen dificultades con otros, como los del experimento de bloqueo en el primer ensayo de la Fase 2 del experimento de bloqueo. Factores temporales y respuesta condicionada. Ni el modelo de Rescola y Wagner ni los modelos modificacin del EC fueron diseados para explicar los efectos del tiempo sobre el condicionamiento, pese a que el tiempo es un factor crtico. Una variable temporal importante es el intervalo EC-EI. La respuesta condicionada es inversamente proporcional al intervalo EC-EI o duracin del EC. Por encima de un punto ptimo los procedimientos con intervalos EC-EI ms largos porducen menos respuetas. Otra variable temporal imporante es el intervalo entre ensayos. En general en ensayos ms separados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervalo entre ensayos y la duracin del EC interactan a la hora de determinar la respuesta. Numerosos ensayos han mostrado que el factor crtico es la duracin relativa de estas dos variables temporales, ms que el valor absoluto de las mismas. Se han ofrecido varias interpretaciones sobre por qu la respuesta conidiconada esta tan fuertemente determinada por la razn IEE/DE (intervalo entre ensayos/duracin del ensayo). Una de las primeras explicaciones fue la hiptesis de espera relativo, que supone que un EC proporciona informacin acerca de la aparicin del EI slo si el sujeto tiene que pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto experimental.

67

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Cuando la Razn IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo de espera en el contexto. En este caso, el EC proporciona poca informacin adicional sobre el momento de aparicin del EI y no se desarrollara mucha respuesta condicionada. Por el contrario, cuando la razn IEE/ED es alta, el tiempo de espera ante el EC es mucho menor que el tiempo de espera en el contexto. Esto hace que el EC aporte informacin sobre el momento que aparece el EI, y la respuesta condicionada ser mas fuerte. La hiptesis del comparador. R.Miller. Se parece a la hiptesis del tiempo de espera relativo, en que asume que la respuestas condicionadas depende no slo de la asociacin entre el EC y EI, sino tambin de todas las posibles asociaciones que puedan establecerse en claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante el entreanmiento con el eC critico es especialmente importante. Otra restriccin del modelo del comparador es que slo permite asociaciones excitatorias con el EI. El modelo asume que el que la RC refleje excitacin o inhibicin est determinado por la fuerza relativa de la excitacin condicionada al EC en comparacin con la excitacin condicionada a las claves contextuales presentes durante el entrenamiento del EC. La hiptesis hace ms hincapi en las asociaciones que en el tiempo. Asume que los sujetos apenden tres asociaciones en el curso del condicionamiento: 1 Une el EC crtico con el EI. 2 Une el EC critico cocn las claves contextuales de comparacin . 3 Une los estmulos de comparacin y el EI. Cuando se presenta el Ec este activa la representacin del EI tanto directamente (asoc 1) como indirectamente (asoc 2 y3). La comparacin de las activaciones directa y indirecta del EI determina el grado de respuesta excitatoria o inhibitoria que tendr lugar. Esta hiptesis no indica cmo se establecen las asociaciones, es una teora de la ejecucin. Un importante corolario es que la comparacin entre asociaciones EC-EI y el contexto-EI se realiza en el momento de la prueba. Predice que la extincin de la asociacin contexto EI despus del entrenamiento del EC potenciara la respuesta al EC crtico. Principal contribucin ha sido su nfasis en que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecucin ms que en el aprendizaje, onsidera el efecto bloqueo como un fallo en la ejecucin, Predice que la extincin del estimulo bloqueador elevara la RC al EC bloqueado Tambien se ha puesto a prueba en estudios sobre inhibicin condicionada. El modelo le atribuye la inhibicin condicionada a situaciones en las que se asocia el EC crtico con el EI es ms dbil que la asociacin de las claves contextuales con el EI. En este caso, las claves

68

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

contextuales son estmulos que proporcionan el contexto excitatorio necesario para el condicionamiento inhibitorio. Curiosamente predice que la extincin de estos estmulos condicionados excitatorios tras el condidionamiento inhibitorio reducira la respuesta inhibitoria. Por tanto, la hipotesis del comparador es la nica que predice que la extincin de la inhibicin condicionada se logra de forma ptima, no presentando el EC- aislado, sino extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-. El modelo predice tambin que incrementar el valor excitatorio de las claves contextuales tras el tratamiento (Asoc. 3) reducir la respuesta condicionada del EC crtico. No se ha conseguido confirmar esta prediccin. Una de sus principales contribuciones ha sido su nfasis en que la diferencias en la respuesta condicionada puede reflejar diferencias en la ejecucin ms que en el aprendizaje. El bloqueo lo considera como un mero fallo en la ejecucin ms que en el aprendizaje. Predice que la extincin del estmulo bloqueador tras el entrenamiento elevar la respuesta condicionada al EC bloqueado. Visin general de las alternativas tericas. Cada uno de los modelos que se han descrito hace hincapi en un aspecto diferente del condicionamiento clsico. La hiptesis del tiempo de espera relativo se centre en un pequeo conjunto de fenmenos relacionados con la distribucin temporal de los estmulos condicionados e incondicionados, a pesar de que su antecesora (la teora de la expectativa escalar) tiene un alcance mucho mayor. La hiptesis del comparador tambin es ambiciosa, pero es una teora de la ejecucin ms que del aprendizaje y, por toanto, no explica como se adquieren las asociaciones. Los modelos atencionaes hacen referencia al mismo tipo de fenmeno que el modelo Rescorla-Wagner, pero comparten algunas de sus limitaciones. Todos estos modelos han sido importantes en tanto que han dirigido nuestra atencin a aspectos previamente ignorados del condicionamiento clsico. Ninguno de ellos ha llegado a dominar el estudio del condicionamiento clsico e la misma forma que el modelo RescorlaWagner lo hizo en los setenta.

69

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Comentarios finales

(pg. 122 del libro)

Inicialmente, algunos psiclogos consideraron el condicionamiento clsico como un tipo de aprendizaje relativamente simple y primitivo que intervena slo en la regulacin de respustas glandulares y vecerales como la salivacin. Se asuma que el establecimiento de las asociaciones EC-EI tena lugar automticamente con los emparejamientos del EC y el EI. Debido a la naturaleza simple y automtica del condicionamiento y a que se crea que estaba limitado a las respustas glandulares y vicerales, no se consideraba que fuera importante a la hora de explicar la complejidad y riqueza de la experiencia humana. Claramente, esta visin del condicionamiento clsico resulta insotenible en la actualidad. La investigacin revisada de los Captulos 3 y 4 muestra que el condicionamiento clsico involucra numerosos procesos complejos y est implicado en el control de una gran variedad de respuestas, desde la conducta emocional hasta las respuestas de aproximacin y evitacin. Adems, el aprendizaje no ocurre de forma automtica por el mero emparejamiento de un EC con un EI. Depende de la experiencia previa del organismo con cada uno de estos estmulos, de la presencia de otros estmuos durante los ensayos de condicionamiento y del grado con que el EC y el EI sean mutuamente relevantes. Adems, los procesos de condicionamiento clsico no se limitan a emparejamientos EC-EI. Tambin pueden desarrollarse asociaciones entre dos eventos sin significacin biolgica (precondicionamiento ensorial), en ausencia de un estmulo incondicionado (condicionamiento de orden superior) o en ausencia de un estmulo condicionado convencional (contracondiconamiento). Debido a estas y otras complejidades de los procesos de condicionamiento clsico, es un error ignorar el condiconamiento clsico al tratar de explicar formas complejas de comportamiento. La riqueza de los mecanismos del condicionamiento clsico los convierte en relevantes en relaicn a la riqueza y complejidad de la experiencia humana.

70

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

Trminos clave
Aprendizaje E-E Aprendizaje de una asociacin entre dos estmulos, con el resultado de que la exposicin a uno de los estmulos adquiere la capacidad de activar una representacin o imagen mental del otro estmulo. Tambin llamado aprendizaje estmulo-estmulo. Aprendizaje E-R Aprendizaje de una asociacin entre un estmulo y una respuesta, con el resultado de que el estmulo adquiere la capacidad de provocar la respuesta. Lo mismo que aprendizaje estmulo-respuesta. Aprendizaje estmulo-estmulo Lo mismo que Hiptesis del comparador Idea segn la cual la respuesta condicionada depende de una comparacin entre la fuerza asociativa del estmulo condicionado crtico (EC) y la fuerza asociativa de otras claves presentes durante el condicionamiento del EC crtico. Hipotesis del tiempo de espera relativo Idea segn la cual la respuesta condicionada depende de cunto tiempo tenga que esperar el organismo para el estmulo incondicionado (EI) en presencia del estmulo condicionado (EC), en comparacin con el tiempo que tenga que esperar para el EI en la situacin experimental independientemente del EC. Homeostasis Concepto introducido por Walter Cannon para referirse a los mecanismos fisiolgicos que permiten mantener los aspectos corporales crticos (tales como los niveles e azcar en sangre o la temperatura) dentro de ciertos lmites. El nivel homeosttico suele lograrse mediante la accin de mecanismos de retroalimentacin negativa que permiten contrarrestar el efecto de los cambios en el nivel homeosttico. Precondicionamiento sensorial Procedimiento en el que un estmulo biolgicamente dbil (EC2) se empareja repetidamente con un estmulo biolgicamente dbil (EC1). Despus, el EC1 se condiciona con un estmulo incondicionado. En un ensayo de prueba posterior, el EC2 tambin Efecto de inhibicin latente Lo mismo que efecto de preexposicion al EC. Efecto de preexposicin al EC Interferencia con el proceso de condicionamiento producida por la exposicin repetida al estmulo condicionado antes de los ensayos de condicionamiento. Tambin llamado efecto de inhibicin latente. Efecto de preexposicin al EI Interferencia con el proceso de condicionamiento producida por la exposicin repetida al estmulo incondicionado antes de los ensayos de condicionamiento.

aprendizaje E-E.
Aprendizaje estmulo-respuesta Lo mismo que

aprendizaje E-R.
Condicionamiento de oren superior Procedimiento en el que se utiliza un estmulo previamente condicionado (EC1) para condicionar un nuevo estmulo (EC2) Contracondicionamiento Procedimiento de condicio-namiento que invierte la respuesta condicionada con anterioridad a un estmulo. Por ejemplo, un animal puee condicionarse para aproximarse aun estmulo que anteriormente evitaba. Devaluacin del EI Reduccin el atractivo de un es-tmulo incondicionado, normalmente obtenida mediante la aversin o la saciedad. Efecto de aumento Facilitacin en el condicionamiento el un estmulo novedoso debido a su condicionamiento junto a un estmulo previamente condicionado. Tambin llamado efecto de contrabloqueo. Efecto bloqueo Interferencia en el condicionamien-to de un nuevo estmulo debida a la presencia de un estmulo previamente condicionado. Efecto de contrabloqueo Lo mismo que

aumentacin.
71

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 4: Condicionamiento clsico: mecanismos
Juan Carlos Cabrera

nunca se haba emparejado directamente con el estmulo incondicionado. Respuesta homeosttica condicionada Respuesta condicionada que se parece a las reacciones homeostticas incondicionadas que elicita un estmulo incondicionado. Saliencia del estmulo Significacin o perceptibilidad de un estmulo para el organismo. En general, el aprendizaje avanza ms rpido con estmulos condicionados e incondicionados ms salientes. Sustitucin del estmulo Idea terica segn la cual el resultado del condicionamiento clsico es que el organismo responde al estmulo condicionado de la misma manera que responda previamente al estmulo incondicionado. Tolerancia a las drogas Reduccin en la efectividad de una droga como resultado del consumo repetido de la misma.

72

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera 2009/2010

Primeras investigaciones sobre el condicionamiento instrumental Aproximaciones modernas al estudio del condicionamiento instrumental - Procedimientos de ensayo discreto - Procedimientos de operante libre Procediminetos de condicionamiento instrumental Elementos fundamentales del condicionamiento instrumental - La respuesta instrumental - El reforzador instrumental - La relacin respuesta-reforzador Contigidad y contingencia: Comentarios finales

73

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

En este captulo se vuelve la vista al anlisis de las situaciones de aprendizaje en las cuales los estmulos a los que un organismo se enfrenta son el resultado directo de su conducta, descrita como dirigida a una meta. La conducta que sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias se denomina conducta instrumental.

Primeras investigaciones sobre el condicionamiento instrumental.


(pgina 125 del libro)

Los anlisis tericos y de laboratorio del condicionamiento instrumental comenzaron formalmentecon el trabajo de thorndike. Su intencin original era estudiar la inteligencia animal. Estudio la cuestin planteada por Darwin sobre que capacidades intelectuales humanas estaban presentes en los animales mediante investigacin emprica, para ello invento una serie de cajas problema donde introduca un gato hambriento con algo de comida fuera de la vista del animal. Su tarea era aprender a salir de la caja y obtener la comida. La cuidadosa aproximacin empirica de Thorndike fue un avance significativo en el estudio de la inteligencia animal. Otra contribucin importante fue la estricta evitacin de interpretaciones antropomrficas de la conducta observada. En lugar de ello, interpreto los resultados de sus estudios como el reflejo del aprendizaje de una asociacin E-R. A medida que la asociacin o conexin entre las claves de la caja y la respuesta con xito se hacia mas fuerte, el gato llegaba a realizar esta de forma ms rpida. La consecuencia de la respuesta exitosa fortaleca la asociacin entre los estimulos de la caja y esa respuesta. Sobre la base de eta investigacin, Thorndike formulo la ley del efecto: si una respuesta en presencia de un estimulo es seguida por un suceso satisfactorio, la asociacin E-R se fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje E-R.

75

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Aproximaciones modernas al estudio del condicionamiento instrumental.

(pgina 125 del libro)

Thorndike utiliz 15 cajas problemas diferentes en sus investigaciones que requeran diferentes manipulaciones para que el gato saliese. Algunas llegaron a ser estndar.

Procedimientos de ensayo discreto


El mtodo es similar al de Thorndike, en el que cada ensayo de entrenamiento acaba con la retirada del animal del aparato, y la respuesta instrumental se realiza slo una vez durante cada ensayo. Similares al mtodo de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en las investigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra. Un laberinto muy utilizado es el de forma de T, diseado para estudiar la conducta de eleccin. La conducta en el laberinto puede cuantificarse midiendo la velocidad de carrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida comn es la latencia, tiempo que tarda el animal en abandonar la caja salida y empezar a desplazarse por el pasadizo, las latencias se hacen mas cortas a medida que progresa el entrenamiento.

Procedimientos de operante libre


Ideado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones. Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fuese representativa de toda la actividad en curso que ocurria de forma natural. La conducta no se divide como si fueran molculas, por eso propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado. La tpica caja bsica de Skinner que utilizada para estudiar la conducta opeante libre, consistia en una pequea cmara que contiene una palanca y un mecanismo que proporciona un reforzador. Una respuesta operante, como presionar una palanca, se defina a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma operante.
76

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Entrenamiento y moldeamiento al comedero. Hay algunos pasos preliminares para establecer la conducta de presin de la palanca. En primer lugar, los animales tienen que aprender cundo esta disponible la comida en el comedero. Esto comprende un condicionamiento clsico. Tras suficientes emparejamientos del sonido del dispensador con la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: el animal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar se llama entrenamiento al comedero. Despus, el organismo esta preparado para aprender la respuesta instrumental requerida. Si la respuesta no es algo que el animal ya realiza, nunca suceder por si mima, para facilitar la adquisicin de una nueva respueta operante, al principio, la comida se entrega si el animal hace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que la respuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza la respuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre la palanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la rata presiona la palanca. Esta secuencia de pasos se denomina moldeamiento. Este incluye dos tcticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta requerida y no reforzamiento de las formas de respuesta ms tempranas. Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo la construccin o sntesis de una nueva unidad conductual a partir de componentes de respuesta preexistentes que ya se encuentran en el repertorio del sujeto. El condicionamiento instrumental puede tambin utilizarse para producir respuestas que no se parecen en nada a lo que el individuo es probable que haga sin entrenamiento. El moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, los procedimientos de moldeamiento no tendran xito. El moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo. La tasa de respuesta como medida de la conducta operante. Los mtodos de operante libre permiten una observacin continua durante largos periodos, proporcionan una ocasin especial para obsevar cambios en la probabilidad de la conducta a lo largo del tiempo. Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente en procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso que la tasa de ocurrencia de una conducta operante (frecuencia por minuto, por ej.) se utilizase como medida de la probabilidad de respuesta.

77

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Procedimientos de condicionamiento instrumental

(pgina 133 del libro)

Una consecuencia placentera se denomina tcnicamente estimulo apetitivo. Una consecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar el estimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuesta y su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar o eliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativo entre la respuesta y su consecuencia: Que el resultado de un procedimiento de condicionamiento sea un aumento o una disminucin de la tasa de respuesta depende tanto de la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia. Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce un estimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da la respuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre la espuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incremento en la tasa de respuesta. Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima un estimulo molesto o aversivo. Produce disminucin en la respuesta instrumental. Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene la presentacion de un suceso ambiental. Un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estimulo aversivo se denomina reforzamiento negativo. Hay dos tipos, escape y evitacin.: En el escape, el estimulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental.La presencia de un estimulo aversivo establece la ocasin para la ocurrencia de la respuesta insrrumental, entonces es reforzada por la terminacin del estimulo aversivo. La evitacin implica la programacin de un estimulo aversivo para ser presentado en algn momento del futuro. En este caso la respuesta instrumental previene la entrega del estimulo aversivo. Entrenamiento de omisin: Incluye una contingencia negativa entre la respuesta instrumental y un suceso ambiental. En este caso la respuesta instrumental previene la presentacin de un estimulo apetitivo o placentero. A menudo es el preferido para disuadir la conducta humana (nio a su habitacin).

78

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Los procedimientos de entrenamiento de omisin se denominan en ocasiones reforzamiento diferencial de otras conductas o RDO. Este termino refleja el hecho de que el individuo recibe un estmulo apetitivo peridicamente a condicin de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento. Implica el reforzamiento de otras conductas. La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo

Elementos fundamentales del condicionamiento instrumental


(pgina 137 del libro)

La esencia de la condcuta instrumental es que esta controlada por sus consecuencias. El condicionamiento instrumental consta de tres elementos claves; una respuesta, una consecuencia (el reforzador) y una relacin o contingencia, entre la respuesta y la consecuencia.

La respuesta instrumental
El resulado de los procedimientos del condicionamiento instrumental depende en parte de la naturaleza de la respuesta que se este condicionando.Algunas respuestas son mas fcilmente condicionables que otras. Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este nfasis alent la creencia de que los procedimientos de condicionamiento instrumental producan repeticiones de la misma respuesta - que producan uniformidad o estereotipia en la conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no pueda verse tambin involucrado en la produccin de respuestas creativas o variables. Los organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer algo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamiento instrumental. (ver ejemplo. Pag 137). Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el termino de pertinencia para explicar los fallos en el entrenamiento del rascado y del bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la historia evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo de respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y competan con las respuestas que requera el investigador.

79

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Sistemas de conducta y limitaciones en el condicionamiento instrumental. De acuerdo con la terora de los sistemas de conducta, cuando un animal est privado de comida y se encuentra en una situacin donde podra encontrarla, su sistema de alimentacin se activa, y se dedica al forrajeo y otras actividades relacionadas con la comida. Sobre este sistema de conducta se superpone un procedimiento de condicionamiento instrumental. La efectividad del procedimiento para el incremento de una respuesta instrumental depender de la compatibilidad de esa respuesta con la organizacin preexistente del sistema de alimentacin. Podemos predecir qu respuestas se incrementarn con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentacin est activado en ausencia de condicionamiento instrumental. Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizar un experimento de condicionamiento clsico. Un EC llega a elicitar componentes del sistema de conducta activado por el EI. Si la deriva instintiva refleja las respuestas del sistema de conducta, las respuestas anlogas a la deriva instintiva deberas ser evidentes en un experimento de condicionamiento clsico. Timberlake y colaboradores comprobaron esta prediccin en ratas utilizando una modificacin de los estudios de manipulacion de monedas llevados a cabo por los Brelands.

El reforzador instrumental
Cantidad y naturaleza del reforzador: En un estudio sistemtico, Hutt(1954) intento aislar los efectos de la cantidad y naturaleza del reforzador alimenticio lquido mediante la variacin sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeron mayor tasa de respuesta. Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la efectividad de un reforzador dependa no slo de sus propiedades sino tambin de cmo ese reforzador se compara con otros que el individuo haya experimentado. La efectividad de un EI en el condicionamiento clsica depende de cmo se compare el EI con las expectativas del individuo basndose en la experiencia previa. Esta es la idea fundamental del modelo Rescorla-Wagner, si el EI es mayor de lo esperado, producir condicionamiento excitatorio, si el EI es menor producir condicionamiento inhibitorio. Los efectos de una cantidad o tipo de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo ha experimentado previamente. Mellgren (1972) Los resultados que obtuvo ilustran el fenmeno de contraste positivo: se refiere a una elevada respuesta por una recompensa favorable, resultado de una experiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere
80

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. Los efectos de contraste tambin se dan si las condiciones de recompensa se modifican una y otra vez con una clave diferente saalando cada condicin de recompensa, estos efectos son ejemplo de contraste conductual simultaneo. Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situacin esta determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. Por razones que no estn totalmente claras, el contraste negativo se ha obtenido de forma ms clara que el contraste positivo.

La relacin respuesta-reforzador
Unas veces existe una fuerte relacin entre la conducta y sus consecuencias (introducir una moneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja al examen y sacar buena nota) y tambin puede ser probabilistica (hacer llamadas de telefono y encontrar a alguien que te ayude). Existen dos tipos de relaciones entre una respuesta y un reforzador: 1.- La relacin temporal , que se refiere al tiempo que transcurre entre la respuesta y el reforzador. Un tipo especial es la contigidad temporal, la cual se refiere a la entrega del reforzador inmediatamente despus de la respuesta. 2.- La relacin causal o contingencia respuesta reforzador, se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador. Los factores temporales y causales son independientes unos de otros. Ambas son independientes unos de otros .
Hay una relacin causal fuerte entre presentar una solicitud de admisin y ser aceptado, pues si no lo solicitas es seguro que no ser aceptado; sin embargo, la relacin temporal entre solicitar y ser admitido es dbil porque puede pasar semanas o meses sin conocer la respuesta a la solicitud despues de haberla presentado.

Efectos de contigidad temporal. El reforzamiento inmediato es preferible al reforzamiento demorado. Los psiclogos del aprendizaje han resaltado que el condicionamiento instrumental requiere porporcionar el reforzador inmediatamente despus de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizaje instrumental puede deteriorarse con demoras tan cortas como 0.5 seg. Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento es demorado tras la realizacin de una respuesta, R1, el organismo no deja de hacer cosas, R2 R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algn tiempo
81

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

despus, el reforzador puede ocurrir despus de alguna otra respuesta por ej. R5. Para asociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestas que realiza durante el intervalo de demora. Hay dos formas de resolver este problema. La primera tcnica, es proporcionar un reforzador secundario o condicionado inmediatamente despus de la respuesta instrumental. Un reforzador condicionado o secundario es un estmulo condicionado que previamente ha sido asociado con el reforzador. Otra tcnica es marcar la respuesta instrumental criterio de alguna manera para hacerla distinguible de otras actividades del organismo.La efectividad del procedimiento de marcado se demostr por primera vez por Lieberman, Mcintosh y Thomas (1979) La contingencia respuesta-reforzador. Los estudios de demora del reforzamiento muestran que no es suficiente una relacin causal perfecta entre la respuesta y el reforzador para producir una respuesta instrumental vigorosa. Incluso con una relacin causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. Se concluy que la contigidad respuesta-reforzador ms que la contingencia era el factor critico que produca el aprendizaje instrumental. No obstante, esta visin ha resultado injustificada por la investigacin posterior. La contingencia respuesta-reforzador es tambin importante. El experimento de supersticin Skinner. Fue un hito en el debate acerca del papel de la contigidad frente a la contingencia en el aprendizaje instrumental. Skinner situ palomas en cmaras experimentales independientes y mont el equipo para entregar una cantidad de de comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo. Las palomas parecan estar respondiendo como si la conducta controlara la entrega del reforzador. Skinner denomin a esto conducta supersticiosa. La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio. Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador, un segundo emparejamiento accidental aumenta an ms la probabilidad de la respuesta, de esta froma cada emparejamientno ayuda a estampar una respuesta particular.

1- Reinterpretacion del experimento de supersticin: la afirmacion de Skinner ha sido


puesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaron observaciones ms extensas, definieron y midieron la ocurrencia de muchas respuestas, algunas respuesta ocurran de modo predominante hacia el final del intervalo entre reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del reforzador y disminuan a medida que se acercaba el tiempo de la siguiente comida; respuestas de interin.

82

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Las acciones que eran respuestas terminales y las que eran respuestas de interin no variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento accidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que las presentaciones periodicas de un reforzador producen regularidades en la conducta.

2-Explicacin de la periodicidad de las respuestas de interin y terminales. Staddon y


Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie que reflejan la anticipacin de la comida a medida que el tiempo se encuentra ms cerca de la prxima presentacin de comida. En contraste, entendieron las respuestas de interin como una manifestacin de otras fuentes de motivacin que eran mas importantes al comienzo del intervalo entre comidas, cuando la presentacin de comida era improbable. Los investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las respuestas terminales y de interin se consideran diferentes manifestaciones del mismo sistema motivacional. La teora de sistema de conducta, el sistema de alimentacin est activado en animales privados de comida a los que se les proporciona peridicamente pequeas cantidades de comida. Justo despus de la entrega de comida se asume que el organismo realiza respuetas de bsqueda focalizada poscomida, que involucra actividades cercana a la comida. En medio del intervalo entre entregas ocurren respuestas de bsqueda general, que aleja al suejto de la comida. En el momento de la prxima entrega de comida ocurre la respuesta de bsqueda focalizada. Congruente con la teora de los sistemas de conducta, la distribucin de las actividades se desarrollan con la entrega periodica de un reforzador depende de la naturaleza de ese reforzador. Por ejemplo, se desarrollan diferentes patrones de conductas con presentaciones de comida o agua, debido a que activan diferentes patrones de forrajeo. Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Los estudio acerca de los efectos de control sobre reforzadores han proporcionado la evidencia mas amplia de la sensibilidad de la conducta a las contingencias respuesta-reforzador. La mayora de la investigacin se ha centrado en los efectos de control sobre la estimulacin aversiva, esa se origino con los estudios pioneros de Seligman, Overmier y Maier, quienes investigaron los efectos de la exposicin a una descarga incontrolable en el aprendizaje posterior de escape-evitacin en perros. El hallazgo ms importante fue que la exposicin a una descarga incontrolable dificultaba el aprendizaje posterior: Efecto de indefensin aprendida.

83

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

1 - Diseo tradico: los experimentos sobre indefensin aprendida se realizan normalmente


utilizando este diseo, incluye dos fases: exposicin, un grupo de ratas (E escape) es expuesto a descargas periodicas que puede fianlizar mediante la realizacin de un respuesta de escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo E y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer grupo (C confinado), no recibe descargas durante la fase de exposicin pero esta confinado en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los tres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que los efectos de la estimulacin aversiva durante la fase de exposicin dependen de si la descarga es o no es escapable. La exposicin a una descarga incontrolable (grupo A) produce una severa interrupcin del aprendizaje posterior de escape-evitacion, esto indica que los animales son sensibles a las diferencias procedimentales entre la descarga escapable y la descarga inescapable. La principal diferencia procedimental entre los grupos E y A es la presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo A.
EL DISEO TRIDICO UTILIZADO EN LOS ESTUDIOS DEL EFECTO DE INDEFENSIN APRENDIDA
GRUPO Grupo E Grupo A Grupo C FASE DE EXPOSICIN Descarga escapable Descarga acoplada inescapable Confinado al aparato FASE DE CONDICIONAMIENTO Escape-evitacin Escape-evitacin Escape-evitacin PRUEBA Aprendizaje rpido de evitacin Aprendizaje lento de evitacin Aprendizaje rpido de evitacin .

2- La hiptesis de la indefensin aprendida: la primera explicacin importante estaba


basada en la conclusin de que los animales pueden percibir la contingencia entre su conducta y la entrega de un reforzador. La hiptesis de la indefensin aprendida asume que durante la exposicin a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta. Es ms, llegan a esperar que los reforzadores continuaran siendo independientes de su conducta . Esta expectativa de ausencia de control debilita su habilidad para aprender una nueva respuesta instrumental. Esto ocurre por dos razones , primero, la expectativa de falta de control reduce la motivacin de los sujetos para realizar una respuesta instrumental; segundo, incluso si realizan la respuesta y son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de falta de control hace mas difcil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento. Es importante distinguir la hiptesis de indefensin aprendida del efecto de indefensin aprendida . El efecto de indefensin aprendida es el patrn de resultados obtenidio con el diseo tradico, este ha sido reproducido en numerosos estudios y es un hallazgo bien

84

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

establecido. En contraste, desde que se propuso, la hiptesis de indefensin aprendida ha sido una explicacin sugestiva y controvertida del efecto de indefensin aprendida. 3- Dficit de actividad: El dficit de aprendizaje observado en el grupo A era resultado de que aprendan a ser inactivos durante la fase de exposicin. Congruente con esta hiptesis, en algunas situaciones la descarga inescapable produce una disminucin en el movimiento motor, y a esto se deberan los posteriores dficits de actuacin. Hay tambin situaciones en las cuales los efectos del aprendizaje probablemente no son debidos a la supresin del movimiento causada por la descarga inescapable. Por tanto, la hiptesis de la inactividad aprendida no puede explicar todos los ejemplos de efectos de indefensin aprendida. 4- Dficit atencional: Que la descarga provoque que los animales presten menos atencin a sus acciones. Si un animal no presta atencin a su conducta, tendr dificultad para asociar sus acciones con los reforzadores en el escape.-evitacion o en otras formas de condicionamiento instrumental. Maier, Jackson y Tomie (1987) probaron esta hiptesis de dficit atencional con ratas, razonaron que la atencion reducida a la conducta instrumental tambin poda ser aliviada mediante la introduccin de una clave externa de retroalimentacin de la respuesta o estmulo de marcado. 5- Relaciones estimulares en el condicionamiento de escape: Resulta evidente que el condicionamiento de escape resulta mas complejo de lo que se pensaba anteriormente. El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminacin de un estimulo aversivo. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentacin de la respuesta. Algunos de estos estimulos producidos por la respuesta son experimentados al comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan claves de retroalimentacion de la terminacin de la descarga. Otros estimulos producidos por la respuesta son experimentados cuando el animal completa la respuesta, justo despus de que la descarga se haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves de retroalimentacin de la seal de seguridad. Estas son seguidas de forma fiable por el intervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estas claves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo y limitan o inhiben el miedo elicitado por las claves contextuales de la cmara experimental. Estas seales de seguridad no existen para los animales que estn acoplados a la descarga inescapable porque, para ellos, los periodos de descarga no descarga no son predecibles. Centrarse en los factores estimulares del condicionamiento de escapeen lugar de las contingencias respuesta-reforzador no ha permitido todava el desarrollo de una explicacin comprensiva de todos los resultados con el diseo tradico.
85

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Contiguidad y contingencia: comentarios finales

(pagina 156 del libro)

Como se ha descrito, los organismos son sensibles a la contigidad tanto como a la contingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dos aspectos de la relacin entre la respuesta y el reforzador actan en conjunto para producir el aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en la respuesta instrumental. La relacin causal, o contingencia, asegura que el reforzador es entregado slo tras la ocurrencia de la respuesta instrumental especificada. La relacin de congigidad asegura que otras actividades no se interpongan entre la respuesta especificada y el reforzador para interferir en el condicionamiento de la respuesta crtica.

Trminos clave
Castigo Procedimiento de condicionamiento instrumental en el cual hay una contingencia positiva entre la respuesta instrumental y un estmulo aversivo. Si el sujeto realiza la respuesta instrumental, recibe el estmulo aversivo; si el sujeto no realiza la respuesta instrumental, no recibe el estmulo aversivo. Conducta instrumental Actividad que ocurre debido a su efectividad para producir una consecuencia particular o reforzador. Conducta supersticiosa Conducta que se incrementa en frecuencia debido a emparejamientos accidentales de la entrega de un reforzador con ocurrencia de la conducta. Contigidad Ocurrencia simultnea ( o casi simultnea) de dos eventos, como una respuesta y un reforzador. Tambin denominada contigidad temporal. Contigidad temporal Lo mismo que contigidad. Contingencia respuesta-reforzador Relacin causal entre una respuesta y un reforzador, medida en trminos de la probabilidad de ser reforzado por realizar la respuesta en comparacin con la probabilidad de ser reforzado en ausencia de la respuesta.

(pagina 160 del libro)

Contraste conductual simultneo Efectos de contraste conductual (contraste positivo y negativo) que estn producidos por frecuentes cambios entre una condicin de recompensa favorable y una desfavorable, con cada condicin de recompensa asociada a su propio estmulo distintivo. Contraste negativo Respuesta menor a un reforzador desfavorable tras una experiencia previa con un reforzador ms deseado que en ausencia de esa experiencia previa. Contraste negativo Respuesta mayor a un estmulo favorable tras una experiencia previa con un reforzador menos deseado que en ausencia de esa experiencia previa. Deriva instintiva Deriva gradual de la conducta instrumental que se aleja de las respuestas requeridas para el reforzamiento hacia respuestas tpicas de la especie o instintivas relacionadas con el reforzador y con otros estmulos de la situacin experimental. Efecto de indefensin aprendida Interferencia en el aprendizaje de nuevas respuestas instrumentales como resultado de la exposicin a estimulacin aversiva inescapable e inevitable.

86

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Entrenamiento al comedero Estadio preliminar del condicionamiento instrumental en el cual un estmulo es repetidamente emparejado con el reforzador a fin de capacitar al sujeto para aprender a ir a recoger el reforzador cuando se presenta. El sonido del mecanismo de la entrega de comida, por ejemplo, puede ser repetidamente emparejado con la comida, por lo que el animal aprender a ir al cuenco de comida cuando sta se entregue. Entrenamiento de omisin Procedimiento de conicionamiento instrumental en el cual la respuesta instrumental previene la presentacin de un estmulo refonzante. ( Vase tambin reforzamiento diferencial de otras conductas) Escape Procedimiento de condicionamiento instrumental en el cual la respuesta intrumental finaliza un estmulo aversivo ( Vase tambien reforzamiento negativo.) Estmulo apetitivo Estmulo placentero o satisfactorio que puede utilizarse para reforzar positivamente una respuesta instrumental. Estmulo aversivo Estmulo displacentero o molesto que puede ser utilizado para castigar una respuesta instrumental. Evitacin Procedimiento de condicionamiento instrumental en el cual la respuesta instrumental previene la administracin de un estmulo aversivo. Hiptesis de la indefensin aprendida Idea terica que asume que durante la exposicin a estimulacin aversiva inescapable e inevitable, los sujetos aprenden que su conducta no controla los eventos ambientales. Latencia Tiempo entre el inicio de un ensayo (o el inicio de un estmulo) y la respuesta instrumental. Ley del efecto Regla dela conducta instrumental, propueta por Thorndike, que establece que si una respuesta en presencia de un estmulo es seguida por un evento satisfactorio, la asociacin entre el estmulo y la respuesta se fortalecer; si la respuesta es seguida por un evento molesto, la asociacin se debilitar.

Mtodo de ensayo discreto Mtodo de condicionamiento instrumental en el cual el sujeto puede realizar la respuesta instrumental slo durante perodos especficos normalmente determinados bien por el emplazamiento del sujeto en una cmara experimental o por lapresentacin de un estmulo. Mtodo de operante libre Mtodo de condicionamiento instrumental que permite la ejecucin repetida de la respuesta instrumental sin que el sujeto sea retirado de la cmara experimental. (Comprese con el mtodo de ensayo discreto). Moldeamiento Reforzamiento de aproximaciones sucesivas a la respuesta instrumental deseada. Pertinencia La idea terica, originalmente propuesta por Thorndike, de que la historia evolutiva de un organismo hace que ciertas respuestas encajen o se correspondan con ciertos reforzadores. La pertinencia facilita el aprendizaje. Procedimiento de marcado Procedimiento en el cual la respuesta instrumental es inmediatamente seguida por un evento distintivo (el sujeto es recogido, o se presenta un destello de una luz) que hace que la respuesta instrumental sea ms fcil de memorizar y ayuda a superar los efectos perjudiciales del reforzamiento demorado. Reforzador condicionado Estmulo que se convierte en un reforzador efectivo debido a su asociacin con un reforzador primario o incondicionado. Tambin denominado reforzador secundario. Reforzador secundario condicionado. Lo mismo que reforzador

Reforzamiento accidental Caso en cual la entrega de un reforzador coincide con una respuesta particular incluso si esta respuesta no es responsable de la presentacin del reforzador. Tambin denominado reforzamiento adventicio. Reforzamiento adventicio Lo mismo

que

reforzamiento accidental.

87

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 5: Condicionamiento clsico: Fundamentos
Juan Carlos Cabrera

Reforzamiento diferencial de otras conductas Procedimiento de condicionamiento instrumental en el cual un reforzador positivo es peridicamente entregado slo si el sujeto no realiza una respuesta particular. Abreviado RDO. RDO Abreviacin de reforzamiento diferencial de otras conductas.

Respuesta de nterin Respuesta que aumenta en frecuencia despus de la entrega de un reforzador peridico y que disminuye a medida que se aproxima el siguiente reforzador. Respuesta operante Respuesta que se define por el efecto que produce en el ambiente. Los ejemplos incluyen presionar una palanca y abrir una puerta. Cualquier secuencia de movimientos que emuje la palanca hasta abajo o abra la puerta constituye un ejemplo de esa operante particular. Respuesta terminal Respuesta que es ms probable al final del intervalo entre sucesivos reforzadores que estn presentes a intervalos fijos. Velocidad de la carrera Rapidez (en metros por segundo, por ejemplo) con que se mueve un animal por un corredor.

Reforzamiento negativo Procedimiento de condicionamiento instrumental en el cual hay una contingencia negativa entre la respuesta instrumental y un estmulo aversivo. Si la respuesta intrumental es realizada, el estmulo aversivo finaliza o se previene; si la respuesta instrumental no se realiza, se presenta el estmulo aversivo. Reforzamiento positivo Procedimiento de condicionamiento instrumental en el cual hay una contingencia positiva entre la respuesta intrumental y un estmulo reforzante. Si el sujeto realiza la respuesta, recibe el estmulo reforzante; si el sujeto no realiza la respuesta, no recibe elestmulo reforzante.

88

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera 2009/2010

Programas simples de reforzamiento intermitente - Programa de razn - Programas de intervalo - Comparacin de los programas de razn y de intervalo - Programas de reforzamiento de tasas de respuesta Conducta de eleccin: programas concurrentes - Medidas de la conducta de eleccin - La ley de la igualacin - Mecanismos de la ley de la igualacin Eleccin con compromiso - Programas concurrentes encadenados - Estudios de "autocontrol" Comentarios finales

89

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Un programa de reforzamiento es un programa, o regla, que En la vida real, no siempre que damos una respuesta, aparecer un determina cmo y cundo la ocurrencia de una respuesta ira reforzador. seguida de un reforzador. Este puede establecerse de El programa de reforzamiento infinidad de formas. Los programas de reforzamiento que determina cundo la ocurrencia de la respuesta va a ir seguida incluyen relaciones similares entre los estmulos, las de un reforzador respuestas y los reforzadores, normalmente producen patrones de conducta similares. Los programas de reforzamiento influyen tanto en la forma de aprender una respuesta instrumental como en la forma en que se mantiene el reforzamiento. Zeiler (1984) denomin a los programas de reforzamiento el gigante durmiente del anlisis de la conducta.

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE

(pgina 154 del libro)

Los programas que organizan y dirigen la ejecucin instrumental se activan de diferentes formas por los distintos programas de reforzamiento. En los programas "simples", un slo factor determina qu ocurrencia de la respuesta instrumental se refuerza.

Programas de razn
La caracterstica definitoria de un programa de razn es que el reforzamiento depende slo del nmero de respuestas que el organismo realiza. Un programa de razn slo requiere contar el nmero de respuestas que ha ocurrido y entregar el reforzador cad vez que se alcance el nmero requerido. Si este nmero es uno, cada ocurrencia e la respuesta instrumental provacar la entrega de reforzador. Este tipo de programa se denomina tcnicamente reforzamiento continuo (abreviado RFC). Las situaciones en las que la respuesta se refuerza slo alguna vez, reforzamiento parcial o intermitente. Razn fija. Por ejemplo, la entrega de un reforzador despus de cada dcima respuesta de presin de palanca en un estudio con ratas de laboratorio. En un programa como ste, hay una razn fija entre el nmero de respuestas que la rata realiza y el nmero de reforzadores que consigue. Esto convierte al procedimiento en un programa de razn fija. El procedimiento podra denominarse programa de reforzamiento de razn fija (RF 10).

91

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Un programa de reforzamiento continuo constituye tambin un programa de razn fija. Es una razn fija de una respuesta por reforzador, en la que los organismos suelen responder con una tasa de respuesta constante pero moderada.

Programa de reforzamiento continuo: Cada respuesta correcta es reforzada. Programa de reforzamento parcial o intermitente: No todas las respuestas correctas son reforzadas y pueden ser de varios tipos.

Se da un patrn de respuesta diferente cuando se trata de un programa de razn intermitente de razn fija. El patrn tpico de los programas de razn fija es que se da una tasa constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar el nmero requerido de respuestas. Estas se muestran con claridad en un registro acumulativo de la conducta. Un registro acumulativo es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. Muestra el nmero total (o acumulativo ) de respuestas que han ocurrido hasta un momento determinado en el tiempo. El registro acumulativo proporciona una representacin visual completa de cuando y con que frecuencia responde el sujeto durante la sesin. La tasa cero de respuesta que se observa justo despus del reforzamiento se llama pausa posreforzamiento. La tasa alta y estable que completa cada requerimiento de la razn se llama carrera de la razn. Si el requerimiento de la razn se incrementa un poco ( de una RF 120 a un RF 150), la tasa de respuesta puede permanecer igual durante la carrera de razn. Con mayores requerimientos de tasa, tienden a ocurrir pausas posreforzamiento ms largas. Si el requerimiento de la razn sufre un aumento sbito y significativo (de RF 120 a RF 500) es probable que el animal realice una pausa periodica cada vez que complete la razn requerida, este efecto se llama tensin de la razn. En casos exremos, la tensin de la razn puede ser tan grande que el animal deje de responder. La longitud de la pausa posreforzamiento esta controlada por el requerimiento de la razn subsiguiente, por tanto podra recibir el nombre de pausa pre-razn.
92

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Razn variable. Es un procedimiento en el que se necesita un nmero de respuestas distinto para la entrega de cada recompensa. El valor numrico del programa de razn variable (RV) indica el nmero medio de respuestas requerido para conseguir el reforzador. Debido a que el nmero de respuestas necesario para conseguir el reforzamiento no es predecible, las pausas predecibles en la tasa de respuesta son menos probables con estos programas RV que con los programas de RF. Los organismos suelen responder con una tasa claramente estable en los programa RV. Aunque pueden darse pausas posreforzamiento en los programas de razn variable, estas son mas largas y prominentes en los programas de razn fija. La tasa global de respuesta en los programas de RF y RV es similar siempre y cuando, como promedio, se requieran nmeros similares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse en un patrn de pausa-carrera con los programa de RF, mientras que se observa un patrn ms estable con los de RV.
Programa de RAZN: El reforzador se otorga en funcin del nmero de respuestas. Razn Fija (RF): El nmero de respuestas necesarias para obtener un reforzador es siempre el mismo. Ejemplo: RF5 = Cada 5 respuestas, me dan un premio. El programa de RF1 es un programa de reforzamiento continuo. Produce pausas post-reforzamiento. Razn variable (RV): El nmero de respuestas necesarias para obtener un reforzador va variando. Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.

Programas de intervalo
Las respuestas son reforzadas slo si ocurren cuando ha transcurrido una cierta cantidad de tiempo. Intervalo fijo: el tiempo no varia de una ocasin a la siguiente. Se dan en situaciones donde se requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que el tiempo para la disponibilidad del prximo reforzador se acerca, la tasa de respuesta aumenta, este aumento de la tasa de respuesta se manifiesta como una aceleracin del registro acumulativo al final del IF, este se denomina por consenso festn de intervalo fijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejan una habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un punto de luz que crecia a medida que el tiempo pasaba. L introduccin de este estimulo reloj incremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cerca del final del ciclo IF.
93

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Un programa IF no garantiza que el reforzador se proporcionara en algn momento a lo largo del intervalo, el intervalo slo determina cundo el reforzador esta disponible, no cuando se entrega. Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido un intervalo variable desde la administracin del reforzador previo. Se hallan en situaciones donde se requiere una cantidad de tiempo impredecible para preparar o dispensar el reforzador. El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener el reforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalo variable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausas regulares. Programas de intervalo y espera limitada: Con los programas fuera de laboratorio, es mas comn que los reforzadores estn disponibles durante tiempo limitado. Este tipo de restriccin en cuanto al tiempo que permanece el reforzador disponible se llama espera limitada. Las restricciones de la espera limitada pueden aadirse tanto a los programas de intervalo fijo como a los de intervalo variable

Programa de INTERVALO: El reforzador se otorga en funcin del tiempo que ha transcurrido desde el ltimo reforzador (Pero todava hay que responder al menos 1 vez para obtener el reforzador Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo. Ejemplo: IF5 = Cada 5 segundos, el reforzador est disponible (cada cinco segundos, si respondo me dan un premio. Produce pausas post-reforzamiento y aceleracin pre-reforzamiento (Patrn festoneado) Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando. Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador est disponible.

94

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Comparacion de los programas de razn e intervalo


Hay similitudes entre los patrones de respuesta, tanto los programas RF como los IF producen una pausa posreforzamiento despus de la administracin del reforzador. Producen altas tasas de respuesta justo antes de la administracin del siguiente reforzador. Por el contrario, los programas de RV y de IV mantienen tasas estables de respuesta, sin pausas predecibles. Los programas de intervalo y de razn activan diferentes cambios neuroqumicos en el cerebro. La conducta mantenida por programas de intervalo esta mediada por el sentido temporal del organismo, en los programas de razn no. La primera evidencia sobre las diferencias entre programas de intervalo y de razn fue proporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro. Reforzamiento diferencial del tiempo interrespuesta. Por qu los programas de razn son Los programas que ms respuestas producen capaces de producir tasas ms altas de respuesta son los de RAZN, porque en los de intervalo el reforzador se obtiene por esperar al momento que los programas de intervalo? El factor critico es idneo, no por dar un nmero determinado de respuestas. el espaciamiento entre respuestas que se da justo antes del reforzamiento. El intervalo entre una Cul produce ms respuestas? respuesta y la siguiente se denomina tiempo Los programas fijos producen menos interrespuesta o TIR. Si se refuerzan TIRs cortos, respuestas que los variables porque son ms predecibles. Adems son ms faciles de extinguir ser mas probable que el sujeto realice TIRs (tema 9). cortos, si se refuerzan TIRs largos ser mas De modo que el programa ms efectivo probable que el sujeto realice TIRs largos. En un para crear respuestas es el de razn variable ( Ejemplo: mquina tragaperras, por eso programa de razn , no hay restricciones acerca de son tan adictivas y peligrosas) cuando cuentan las respuestas para conseguir el reforzador, esto es no se espera mucho entre las respuestas. Los programas de intervalo favorecen TIRs largos.
Cul produce ms respuesta?

95

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Programas de reforzamiento de tasas de respuesta.


Requieren especficamente que el organismo responda a una tasa particular de respuesta. El reforzamiento de una respuesta particular depende de cuan pronto ocurra tras la respuesta precedente. Reforzamiento diferencial de tasa altas (RDA): una respuesta se refuerza slo si ocurren antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Reforzamiento diferencial de tasas bajas (RDB): una respuesta se refuerza slo si ocurre despus de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa.

Adems de las respuestas independientes, tambin podemos reforzar la tasa de respuesta (la velocidad a la que se dan las respuestas). Ejemplo: quiero que un animal d cmo mnimo 12 respuestas por minuto. Entonces le doy el reforzador slo si produce una respuesta en los 5 segundos siguientes a la anterior respuesta. Si responde cada 5 segundos o menos, tiene una tasa de 12 respuestas por minuto, lo que yo quera. Si tarda ms de 5 segundos en responder, no es reforzado aunque responda. Eso har que se vuelva ms rpido en el futuro.

CONDUCTA DE ELECCIN: PROGRAMAS RECURRENTES

(pgina 154 del libro)

Histricamente se estudio con laberintos en forma de T. Las aproximaciones recientes al Si te dejan elegir, qu prefieres hacer? estudio de la conducta de eleccin utilizan En los programas concurrentes se deja elegir al animal entre dos programas de reforzamiento cajas de Skinner equipadas con dos manipulandos (dos botones). En el experimento tpico, responder en cada tecla es reforzado segn algn programa de reforzamiento. Los dos programas funcionan al mismo tiempo (o concurrentemente) y el sujeto es libre de cambiar de una tecla a otra, este tipo de procedimiento se llama programa concurrente, permite una medicion continua de la eleccin porque el organismo es libre para cambiar de una tecla a otra en cualquier momento.

96

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Medidas de la conducta de eleccin


La conducta de eleccin de un organismo en un programa concurrente se refleja en la distribucin de su conducta entre dos respuestas alternativas. Una tcnica comn de medicin es calcular la tasa relativa de respuestas de cada alternativa. RA / (RA+RB) La forma en que un individuo distribuye su conducta entre dos alternativas esta muy influida por el programa de reforzamiento que funciona para cada respuesta. La tasa relativa de reforzamiento para cada alternativa de respuesta puede calcularse de una manera semejante a la tasa relativa de respuesta. rA/(rA+rB)

Para saber qu programa prefiere seguir la paloma, recurriremos a la tasa relativa de respuestas.

Tasa relativa de respuestas de tecla A

RA R A + RB

Si la paloma no tiene ninguna preferencia en especial, la tasa relativa se queda en 0,5. Para saber que programa administra ms reforzadores a la paloma, recurriremos a la tasa relativa de reforzamiento.

Tasa relativa de reforzamiento de tecla A

rA rA + rB

Si la paloma recibe reforzadores con la misma frecuncia en cada lado, la tasa relativa se queda en 0,5.

La ley de la igualacin
Herrnstein (1961) estudio la distribucin de las respuestas en varios programas Ley de la igualacin (Herrnstein) concurrentes IV-IV en los cuales la tasa total La tasa de respuesta = tasa de reforzamiento mxima de reforzamiento que las palomas RA rA podan obtener estaba fijada en 40 por hora. = R A + R B r A + rB Dependiendo del valor exacto de cada programa de IV, se podan obtener diferentes O sea, que la paloma responde ms en el programa proporciones de los 40 reforzadores y no que ms reforzadores le proporciona. haba restricciones acerca de cual tecla Si te dejan escoger entre pasar una tarde en el cine o paseando con un amigo, escogers probablemente la podan picotear. Los sujetos distribuyeron sus actividad ms reforzante. respuestas de una manera altamente predecible, la tasa relativa de respuesta en una alternativa dada, estaba siempre muy cercana a igualar la tasa relativa de reforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualacin. RA/(RA+RB)=rA/(rA+rB) o RA/RB=rA/rB; las tasas relativas de respuesta se igualan con las tasas relativas de reforzamiento. RA/RB= rA/rB

97

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Infraigualacion, supraigualacion y sesgo de respuesta. La tasa relativas de respuesta no siempre se igualan con las tasas relativas de reforzamiento. Para acomodarlo aadieron dos parametros, b y s a la ecuacin: RA/RB=b(rA/rB)S , donde s representa la sensibilidad de la conducta de eleccin a las tasas relativas de reforzamiento para las alternativas de respuesta. Cuando ocurre una igualacion perfecta s=1.0.
Infraigualacin, supraigualacin y sesgo de respuesta A veces la ley de igualacin no se cumple, y en esos casos se cumple esta norma: EL parmetro s es la sensibilidad de la s conducta de elecin a las tasas de rA RA reforzamiento (Cuto me afecta la tasa = b r RB de reforzamiento de este programa). B Una buena comida es reforzante, pero si no me gusta el pescado a lo mejor no eligira ese men (sensibilidad). El parmetro b es el sesgo (bias) de respuesta. Es una preferencia por uno de los dos programas en particular, incluso aunque proporcione la misma tasa de reforzamiento que el otro (por ejemplo, la respuesta en s puede ser ms cmoda). Ir al ginmasio podra ser ms reforzante que ver la televisin, porque

produce un bneficio a largo plazo, pero como la respuesta es costosa, Un tipo de desviacin de la puede que prefiramos quedarnos en casa (sesgo de respuesta) iguala-cin perfecta incluye una sensi-bilidad reducida de la conducta de eleccin a las tasas relativas de reforzamiento: infraigualacin y pueden acomodarse mediante la ecuacin de arriba dotando al exponente s de un valor menor que 1.0, indicando la sensibilidad reducida a la tasa relativa de reforzamiento.

En otros ejemplos, la tasa relativa de respuesta es mas sensible a la tasa relativa de reforzamiento de lo que se predice para una igualacin perfecta: supraigualacin, dotando al exponente s un valor mayor que uno, indicando el aumento de la sensibilidad de este factor. Es ms probable que las elecciones muestren sensibilidad reducida a las tasas relativas de reforzamiento que sensibilidad reducida a las mismas. El parmetro de sensibilidad puede estar influido por nmerosas variables, le especie, esfuerzo dificultad, etc. El parmetro b de la ecuacin representa el sesgo de respuesta, estos influyen en la eleccin cuando las alternativas de respuesta son diferentes, tambin es importante cuando el reforzador proporcionado para las dos respuestas es diferente. En ausencia de sesgos b=1.0.
Infraigualacin: El animal tiene una tasa de respuesta menor que la tasa de reforzamiento (recibe muchos reforzadores, pero no responde mucho), es como si los reforzadores obtenidos no produjeran mucha efecto en su eleccin. El parmetro sensibilidad (s) es <1. Supraigualacin: El animal responde ms de lo que le correspondera en funcin de su tasa de reforzamiento. El parmetro sensibilidad (s) es >1. En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unos poquitos bastaran para que el animal prefiera ese programa a otro.

98

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

La ley de la igualacin y el valor del reforzador: Se ha encontrado que la tasa relativa de respuesta es una funcin de la cantidad relativa de reforzador, asi como de la demora relativa del reforzamiento. Tambin estn determinadas por la palatabilidad de los reforzadores. La ley de la igualacin y los programas simples de reforzamiento Herrnstein (1970) apunt que incluso las La ley de la igualacin tambin puede aplicarse a programas sencillos de reforzamiento (no a la eleccin situaciones de respuesta nica pueden en programas concurrentes) involucrar eleccin, entre realizar la respuesta Realizar cualquier conducta supone una eleccin especificada (presin de palanca) y ocuparse en (elegimos realizar esa conducta en vez de hacer otras posibles actividades (acicalarse). En un cualquier otra cosa). Si una conducta no me refuerza ms que cualquier otra alternativa, si no es atractiva, es programa simple, el sujeto recibe no slo poco probable que la realice. reforzamiento explcito por realizar una respuesta operante especfica, sino tambin recompenss intrnsecas de las otras actividades que puede realizar. Por tanto, el reforzamiento total incluye las recompensas extrnsecas programadas tanto como las fuentes del reforzamiento no programadas. Este tipo de anlisis permite la aplicacion de la ley de la igualacin. Si sustituimos los valores de la ecuacin de la ley de igualacin, podemos adaptarla as situaciones de respuesta nica: RA representa la tasa de respuesta operante especificada por el programa. RO representa la tasa de otras actividades del animal. rA es la tasa de reforzamiento explicito programado. rO es la tasa de reforzamiento intrnseco por las otras actividades. k es una constante que el investigador utiliza cuando presupone que (RA+RO) es una constante que no guarda relacin con el reforzador utilizado.

RA =

krA rA + rO

Esta ecuacin predice que la tasa de respuesta (RA) estar directamente relacionada con la tasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otra implicacin, de particular inters clnico, es que la tasa de respuesta disminuir a medida que aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuacin proporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de su tasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes de reforzamiento. La presuposicin de que (RA+RO) es constante para unas situacin instrumental esta puesto en cuestin con estudios recientes que varian el reforzador pero no la respuesta instrumental.
99

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Mecanismos de la ley de la igualacin


La ley de la igualacin describe como los organismos distribuyen sus respuestas en una situacion de eleccin pero no explica que mecanismos son responsables de esta distribucin de respuestas. Est establecida en funcion de las tasas de respuestas y de reforzamiento promediada sobre la duracin total de las sesiones experimentales. Ignora cuando se realizan las respuestas individuales. Igualmente las teoras molares de la igualacin ignoran que podra ocurrir al nivel de las respuestas individuales. Las teroras molares explican agregados de respuestas y se relacionan con la distribucin total de respuestas y reforzadores en las situaciones de eleccin. Las teoras moleculares se centran en lo que ocurre al nivel de las respuestas individuales y consideran la relacin de igualacin como el resultado neto de estas elecciones individuales. Otras teoras proporcionan. caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedio entre ellas ; el mejoramiento. Igualacin y maximizacin de las tasas de reforzamiento: las explicaciones ms investigadas de la conducta de eleccion estn basadas en la idea de que los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la mayor cantidad posible de reforzamiento. 1 Maximizacion molecular: los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese momento. Shimp (1966.1969) propuso una primera versin de la ley de igualacin molecular. Cuando dos programas A y B, funcionando simultneamente, el sujeto cambia del programa A al B a medida que la probabilidad de reforzamiento aumenta para el programa B. Supuso que la relacin de igualacin es un subproducto de una alternancia prudente cuando la probabilidad de reforzamiento en la tecla de respuesta alternativa es mayor que la probabilidad de reforzamiento en la tecla de respuesta actual. Estudios detallados de las pautas de alternancia entre respuestas no siempre apoyaron la teora de maximizacin molecular propuesta por Shimp. Algunos estudios han mostrado que la igualacin es posible en ausencia de una maximizacin momentnea. Sin embargo, aproximaciones ms recientes a los anlisis moleculares de la conducta de eleccin han tenido mas xito. 2 maximizacin molar: presuponen que el organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga. Se centran en agregados de conducta sobre algn perodo ms que en las respuestas de eleccin individual.

100

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Fue originalmente formulada para explicar la eleccion en programas concurrentes construidos con programas de razn, en estos programas, los animales raramente cambian de una alternativa a otra, en su lugar, responden exclusivamente en el componente de razn que requiere el menor nmero de respuestas, de esta forma maximiza su tasa de reforzamiento con el mnimo esfuerzo. La maximizacin molar predice de forma precisa los resultados de los procedimientos de eleccin, pero ciertos hallazgos presentan dificultades; como en los resultados de los programas concurrentes de reforzamiento IV-IV, en los cuales los organismos pueden conseguir casi todas las recompensas disponibles en ambos programas, siempre y cuadno prueben de forma ocasional cada alternativa. La teora no puede explicar por qu la conducta de eleccin se distribuye de forma tan cercana a la relacin de igualacin. Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas, para el mximo beneficio en un programa concurrente RV-IV, los sujetos deberan concentrara sus respuestas en la alternativa de razn variable y responder solo ocasionalmente en el componente de intervalo variable, esto no sucede, los animales favorecen el componente RV pero no de forma tan fuerte como predice la teora 3 Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que esta entre la escala temporal de las teoras molar y molecular. El termino mejoramiento se refiere a hacer algo mejor. No se refiere a elegir la mejor alternativa en ese momento (maximizacin molecular), o hacer que a largo plazo algo sea tan bueno como pueda (maximizacin molar), sino a hacer que la situacion sea mejor a cmo esa situacin ha sido en el pasado reciente. Los beneficios estn circunscritos a una situacin limitada - no en su totalidad o a largo plazo. La teora asume que los organismos cambian de una alternativa a otra para mejorar la tasa local de reforzamiento. Puede demostrarse matemticamente que cuando los sujetos distribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cada alternativa, se estn comportando de acuerdo con la ley de igualacin. Por tanto, el mecanismo de mejoramiento da como resultado la igualacin. De acuerdo con esta teora, la paloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasa local ms alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa local de reforzamiento conseguida en las dos alternativas.
Qu determina los cambios de un programa a otro? Teoras de la maximizacin molecular: El animal hace un cambio de programa para obtener un reforzador determinado. Teora de la maximizacin molar: El animal hace los cambios precisos para obtener el mximo de reforzadores a la larga. Teora del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa local de reforzamiento en el programa A: Nmero de reforzadores obtenidos durante el tiempo que se ha dedicado al programa A. La alternancia de programas contina hasta que las tasas locales se igualan. 101

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

ELECCION CON COMPROMISO


Una vez que se tome una decisin, no se puede cambiar.

(pgina 182 del libro)

Programas concurrentes encadenados


La tcnica bsica en este area de investigacin es el programa concurrente encadenado de reforzamiento, este consta de dos fases; eslabn de eleccin; se permite al participante elegir entre dos programas alternativos de respuesta. La oportunidad para el reforzamiento sucede slo despus de que la eleccin inicial haya sido realizada y la paloma se encuentra en el eslabn terminal; otra caracterstica importante de este programa es que una vez que el participante ha realizado la eleccin, esta comprometido con esta hasta el final del programa. Por tanto los programas concurrentes encadenados implican eleccin con compromiso. Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV, esta est guiada por el hecho de que ocasionalmente un programa de RV proporciona reforzamiento por un nmero relativamente pequeo de respuestas. La consecuencia de responder durante el eslabon inicial de un programa concurrente no es el reforzador primario (comido), es pasar a uno de los eslabones terminales, la consecuencia inmediata de una respuesta en un eslabon inicial es un estmulo que esta asociado con el eslabn terminal elegido. Como este estimulo esta presente cuando se proporciona el reforzador primario, el estimulo del eslabn terminal se convierte en reforzador condicionado . Por tanto, se puede caracterizar un programa concurrente como aquel en que las respuestas al eslabn inicial se refuerzan por la presentacin de un reforzador condicionado. Las diferencias en el valor de reforzador condicionado determinaran entonces la tasa relativa de cada respuesta de eleccin en el eslabon inicial.
102

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Estudios de autocontrol
El autocontrol es a menudo cuestin de elegir una recompensa grande demorada sobre una recompensa pequea inmediata.

Explicaciones del autocontrol: El valor de un reforzador se reduce en funcin de cuanto tiempo se tiene que esperar para obtenerlo, funcion descontadora de valor. El consenso actual es que el valor (V) de un reforzador esta directamente relacionado con la magnitud de la recompensa (M) e inversamente relacionado con la demora de la recompensa (D), de acuerdo con la formula: V=M/(1+KD) donde K es el parmetro de la tasa descontadora, esta ecuacin se llama funcin del decaimiento hiperblico, de acuerdo con esta ecuacin, si el reforzadro es entregado sin demora (D=0), el valor del reforzador est directamente relacionado con su magnitud. Cuanto ms se demora el reforzador, menor es su valor.

Las funciones descontadoras y los problemas de autocontrol en la adiccin a las drogas. Madden, Petry, Badger y bickel (1997) advirtieron que el abuso de sustancias frecuentemente revela una serie de elecciones impulsivas. Los adictos elegirn la recompensa relativamente pequea y rpida de la intoxicacin de la droga a riesgo de consecuencias negativas ms demoradas de problemas interpersonales. Este tipo de elecciones sugieren que se descuenta el valor (o amenaza) de las consecuencias a largo plazo. Si esto es cierto, entonces los adictos deberan mostrar funciones de descuento de la recompensa mas acusadas que otros individuos. Madden y colaboradores (1997) comprobaron esta prediccin con un grupo de pacientes dependientes de la herona apuntados aun programa de desintoxicacion y otro grupo de no dependientes igualados en edad, genero, educacin y CI. Ver ej libro pag 187. Un hallazgo significativo fue que la funciones descontadoras de la recompensa eran mucho ms acusadas para los adictos a la herona. Esto indica una falta de control.

103

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener esos reforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente a una recompensa pequea inmediata, es a menudo una estrategia sensible. De hecho, algunos han sugerido que el autocontrol es un componente crtico de la socializacin y del ajuste emocional. Entrenar a las personas con recompensas demoradas parace tener efectos generalizados en incrementar su tolerancia a la recompensa demorada. En un estudio de eleccin, realizados con nios de una escuela elemental, a los que se les pregunt si queran conseguir 2 cntimos inmediatamente o 3 al final del da, se les realizadon tres sesiones de entrenamiento con una recompensa imediata o demorada. Durante cada sesin de entrenamiento, se presentaron varios roblemas: uno inclua contar objetos en una carta, otro era una rarea pictrica, y el tercero era una tarea de emparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta era reforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas tenian como resultado 3 cntimos que se situaban en un cuanco y seran entregados al final de da. Se midi la preferencia por la recompensa pequea inmediata frente a la ms grande demorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el entrenamiento con la recompensa demorada increment la preferencia por la recompensa ms grande demorada durante el postest. Por tanto, el entrenamiento con reforzamiento demorado produca autocontrol generalizado.

Comentarios finales

(pgina 189 del libro)

El principio bsico del condicionamiento instrumental es muy simplie: el reforzamiento aumenta (y el castigo disminuye) la probabilidad futura de una respuesta instrumental. Sin embargo, como se ha descrito, el anlisis experimental de la conducta instrumental puede ser bastante intrincado. Muchos aspectos importantes de la conducta instrumental est determinados por el programa de reforzamiento. Hay numerosos programas por los cuales las respuestas pueden ser reforzadas. El reforzamiento puede depender de cuntas respuestas han ocurrido, el paso del tiempo, o la tasa de respuesta. Es ms, puede estar disponible ms de un programa de reforzamiento al mismo tiempo. El patrn de conducta instrumental, as como las elecciones entre varias alternativas de respuestas, estn fuertemente determinados por el programa de reforzamiento en curso. Estos hallazgos han permitido conocer bastante sobre cmo el reforzamiento controla la conducta en diversas circunstancias y han alentado muchas aplicaciones importantes de los principios del reforzamiento a la conducta humana.

104

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera

TRMINOS CLAVE
Carrera de razn Tasa de respuesta alta y estable que se observa tras la pausa posreforzamiento en los programas de reforzamiento de razn fija. La carrera de la razn finaliza cuando se ha llevado a cabo el nmero necesario de respuestas y el sujeto es reforzado. Espera limitada Restriccin en cunto tiempo permanece disponible el reforzamiento. Para que una respuesta sea reforzada, debe ocurrir durante el periodo de espera limitada. Festn del intervalo fijo Incremento gradual de la tasa de respuesta que ocurre entre reforzamientos sucesivos en un programa de intervalo fijo. Funcin descontadora del valor Funcin matemtica que describe cmo disminuye el valor del reforzador en funcin del tiempo que el sujeto tiene que esperar para la administracin del reforzador. Infraigualacin Sensibilidad menor de la predicha por una igualacin perfecta a la tasa relativa de reforzamiento. Ley de la igualacin Regla de la conducta instrumental, propuesta por R.J.Herrnstein, que establece que la tasa relativa de respuesta en una alternativa de respuesta particular es igual a la tasa relativa de reforzamiento para esa alternativa de respuesta. Mejoramiento Mecanismo para alcanzar la igualacin respondiendo para mejorar las tasas locales de reforzamiento en las alternativas de respuesta. Pausa posreforzamiento Pausa en el responder que sucede normalmente tras la administracin del reforzador en los programas de reforzamiento de razn fija e intervalo fijo. Programa concurrente Procedimiento de reforzamiento complejo en el cual el participante puede elegir cualquiera de dos o ms programas de reforzamiento simples que estn disponibles simultneamente. Los programas concurrentes permiten la medida de la eleccin entre alternativas de programas simples. Programa concurrente encadenado Procedimiento de reforzamiento complejo en el que se permite al participante elegir cul de varios programas simples de reforzamiento funcionar. Una vez realizada la eleccin, las alternativas rechazadas no estn disponibles durante algn tiempo. Programa de intervalo Programa de reforzamiento por el que una respuesta es reforzada slo si ocurre despus de una cantidad de tiempo establecida desde el ltimo reforzamiento. Programa de intervalo fijo Programa de reforzamiento en el cual el reforzador se entrega por la primera respuesta que ocurre despus de una cantidad fija de tiempo desde el ltimo reforzador. Abreviado IF. Programa de intervalo variable Programa de reforzamiento en el que el reforzamiento se proporciona por la primera respuesta que ocurre tras una cantidad de tiempo variable desde el ltimo reforzador. Abreviado IV. Programa de razn Programa de reforzamiento en el que el reforzamiento depende slo del nmero de respuestas que realiza el sujeto, independientemente de cundo sucedan. Programa de razn fija Programa de reforzamiento en el cual debe ocurrir un nmero fijo de respuestas para que la prxima respuesta sea reforzada. Abreviado RF.

105

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 6: Programas de Reforzamiento y Conducta de Eleccin
Juan Carlos Cabrera Programa de razn variable Programa de reforzamiento en el que el nmero de respuestas necesarias para producir reforzamiento vara de ensayo a ensayo. El valor del programa se refiere al nmero medio de respuestas necesarias para el reforzamiento. Abreviado RV. Programa de reforzamiento Programa, o regla, que determina cmo y cundo la ocurrencia de una respuesta ir seguida por la adaministracin de un reforzador. Programa de tasa de respuesta Programa de reforzamiento en el que la respuesta se refuerz dependiendo de lo pronto que sta se realiza tras la ocurrencia previa de la conducta. Reforzamiento continuo Programa de reforzamiento en el cual cada ocurrencia de la respuesta instrumental produce el reforzador. Abreviado RFC. Reforzamiento diferencial de tasas altas Programa de reforzamiento en el cual una respuesta es reforzada slo si ocurre antes de que haya transcurrido una cantidad especifica de tiempo despus de la respuesta precedente. Abreviado RDA. Reforzamiento diferencial de tasas bajas Programa de reforzamiento en el cual una respuesta es reforzada slo si ocurre despues de que haya transcurrido una cantidad especificada de tiempo despues de la respuesta precedente. Abreviado RDB. Reforzamiento intermitente Programa de reforzamiento por el que slo algunas de las ocurrencias de la respuesta instrumental son reforzadas. La respuesta instrumental es reforzada ocasionalmente, o de forma intermitente. Tambin denominado reforzamiento parcial. Reforzamiento parcial Lo mismo que reforzamiento intermitente. Registro acumulativo Una representacin grfica de cmo se repite una respuesta a lo largo del tiempo, con el paso del tiempo representado por la distancia horizontal (o eje x) y el total o nmero acumulativo de respuestas que ha ocurrido hasta un momento determinado representado por la distancia vertical (o eje y). Supraigualacin Sensibilidad mayor de la predicha por una igualacin perfecta a la tasa relativa de reforzamiento. Tensin de la razn Deterioro en la respuesta que sucede cuando el requerimiento de respuesta de una razn fija se incrementa demasiado rpido. Tiempo interrespuesta o TIR Intervalo entre una respuesta y la siguiente. Los TIRs pueden ser diferencialmente reforzados de la misma manera que otros aspectos de la conducta, como la fuerza dela respuesta o la variabilidad.

106

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera 2009/2010

La -

estructura asociativa del condiconamiento intrumental La asociacin E-R y la ley del efecto. Expectativa de recompensa y la asociacin E-C Relaciones R-C y E(R-C) en el condicionamiento instrumental

Regulacin conductual - Antecedentes de la regulacin conductual - Regulacin conductual y el punto de deleite conductual - Conceptos econmicos y dstribucin de respuesta - Problemas con las aproximaciones de regulacin conductual - Contribuciones de la regulacin conductual Comentarios finales

107

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con el trabajo de Skinner y se centra en como la conducta esta regulada en vista de las limitaciones o restricciones creadas por los procedimientos de condicionamiento instrumental. Las teoras de la regulacin conductual describen los efectos del reforzamiento dentro del amplio contexto del repertorio conductual de un organismo utilizando conceptos de varias areas de investigacin, incluyendo la economa conductual y la ecologa conductual. La aproximacin asociacionista se centra en los mecanismos moleculares y no se preocupa de la meta a largo plazo o la funcin de la conducta instrumental. Por el contrario, la aproximacin de la regulacin conductual se centra n los aspectos molares de la conducta y considera los efectos del condicionamiento instrumental como manifestaciones de procesos de maximizacin u optimizacin. La motivacin de la respuesta instrumental ha sido considerada desde dos perspectivas radicalmente distintas. La primera se origino con Thorndike e incluye el analisis de la estructura asociativa del condicionamiento instrumental , radica en el concepto de asociaciones y es compatible con con la tradicin teorica del condicionamiento pavloviano. Toma una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la aproximacin asociativa examina el aprendizaje onstrumental en preparaciones conucutales aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos, la aproximacin asociativa proporciona un marco conveniente para estudiar los mecanismos neurales del condicionamiento instrumental. La aproximacin alternativa a los procesos motivacionales en el aprendizaje instrumental es la regulacin conductual. Se desarrolla dentro de la tradicin skinneriana e incluye la consideracin del condicionamiento instrumental en el contexto ms amplio de las multiples cosas que el organismo esta haciendo. Esta interesada en como un procedimiento de condicionamiento instrumental establece los limites al flujo de actividades de un organismo y las consecuencias conductuales de estas restricciones: considera la motivacin de la conducta instrumental desde un punto de vista ms molar, las metas y como los organismos sacan provecho de la complejidad de su ambiente y de sus multiples opciones conductuales para alcanzar sus metas.
Dos perspectivas de motivacin de la respuesta instrumental: Estructura asociativa del condicionamiento instrumental Concepto de asociacin pavloviado (perspectiva molecularrespuestas especificas) Regulacin conductural: influencia Skinneriana. Contexto ms amplio que la conducta aislada. Se centra en cmo un procedimiento instrumental establece lmites a las actividades naturales de un organismo y las consecuencias de dichas restricciones (perspectiva molar)

109

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

La estructura asociativa del condicionamiento instrumental

(pgina 192 del libro)

Eduard Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye algo ms que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia de estmulos particulares. Deben considerarse tres sucesos en el anlisis del condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la consecuencia de la respuesta instrumental o reforzador (C). Skinner tambin suscribi la nocin de tres sucesos y describi el condicionamiento instrumental es trminos de una contingencia de tres trminos que incluia E R y C .

La asociacin E-R ya la Ley del efecto

Thorndike La respuesta ocurre en presencia de ciertos estmulos particulares.

La asociacin E-R fue postulada por Thorndike Recordemos la ley del efecto: La presencia de seales o estmulos que sealan acontecimientos significativos como la clave del aprendizaje instrumental en (por ejemplo, la disponibilidad de recompensa si su ley del efecto; el papel del reforzador o de llevamos a cabo una respuesta determinada) controla nuestra expectativa de recompensa. la consecuencia de la respuesta es establecer o "estampar" una asociacin entre las claves contextuales E y la respuesta instrumental. Pens que una vez establecida esta asociacion E-R sera, de forma nica, responsable de la ocurrencia de la respuesta instrumental. Por tanto, el mpetu bsico o motivacin para la respuesta instrumental era la activacin de la asociacin E-R mediante la exposicin del sujeto a los estmulos en presencia de los cuales la respuesta instrumental fue previamente reforzada. La ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, que el reforzador en si mismo no es una parte o no participa en esta asociacin. Esta presuncion es bastante contraintuitiva.

Expectativa de recompensa y la asociacin E-C


Cualesquiera que sean los estmulos, el reforzamiento de la respuesta instrumental producira inevitablemente un emparejamiento entre E y el reforzador o consecuencia de la respuesta (C). Estos emparejamientos proporcionan el potencial para el condicionamiento clsico y el establecimiento de una asociacin entre E y C.

Clark Hull

Dos tipos distintos de aprendizaje: 1. Aprendizaje pavloviano E-C (expectativa de recompensa) Activa un estado emocional 2. Aprendizaje instrumental E-R.

Una de las explicaciones ms tempranas e influyentes del papel del condicionamiento clsico en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y ms tarde elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental. La respuesta instrumental llega a ser instigada o motivada por dos factores. En primer lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacion con E-R. En segundo lugar, la actividad instrumental tambin llega a realizarse en respuesta

110

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

a la expectativa de recompensa debido al establecimiento de una asociacin R-C: la forma concreta en que la asociacin R-C llega a motivar la conducta instrumental ha sido tema de considerable debate e investigacin experimental. Una formulacion especialmente influyente fue la teoria moderna de los dos procesos /Rescorla y Salomon,1967) La teora moderna de los dos procesos. Asume que hay dos tipos de distintos de aprendizaje, el condicionamiento pavloviano y el instrumental, adems, estos dos procesos estn relacionados de una forma especial. Durante el curso de un condicionamiento instrumental, los estmulos (E) -en presencia de los cuales de refuerza la respuesta instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a travs de condicionamiento pavloviano para establecer una asociacin E-C. A travs de la asociacin E-C, el estmulo E llega a motivar la conducta instrumental mediante la activacin de un estado emocional central. La naturaleza de ese estado emocional o motivacin depender de la naturaleza del reforzador. Por ejemplo, en un procedimiento de condicionamiento instrumental en el que la resuesta sea reforzada por la presentacin de comina ( u otro reforzadors apetitivos), la asociacin E-C activa la expectativa de comida (Mowrer la llamo "esperanza"). Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta instrumental, entonces la presentacin de un estmulo condicionado pavloviano debera alterar el curso de la respuesta instrumentalmente reforzada. La implicacin bsica de la teora moderna de los dos procesos es que la tasa de una respuesta instrumental ser modificada por la presentacin de un estmulo clsicamente condicionado. la presentacin de un EC+ clsicamente condicionado con comida durante la ejecucin de una respuesta reforzada con comida debera aumentar la esperanza que fue creada por la contingencia instrumental e incrementar la respuesta. Resultados consecuentes con la teora moderna de los dos procesos. Utiliza normalmente un diseo experimental llamado experimento de transferencia de control, consta de tres fases: Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algn programa de reforzamiento positivo o negativo. Fase 2: Condicionamiento clsico, en el cual se asocia un EC explicito con la presencia o ausencia de un EI. Es necesario durante esta fase no est presente el condicionamiento instrumental. Fase 3: Fase de transferencia crtica. Los participantes pueden realizar la respuesta instrumental y se presenta periodicamente el EC de la fase 2 para observar su efecto en la tasa de conducta instrumental.

111

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Interacciones de respuesta en los experimentos de transferencia de control. Los estmulos condicionados clsicamente elicitan no slo elicitan estados emocionales, sino tambin respuestas concretas que puede influir sobre la conducta que habamos condicionado. Por ejemplo, si el estmulo condicionado provoca una conducta de quedarse quieto y la conducta instrumental que se ha aprendido y reforzado es dar saltos, la presencia del EC disminuir,interferir. Esto hace ver que no es slo el estado emocional lo que influye en la conducta reforzada. Estados emocionales centrales condicionados o expectativas especificas de recompensa? La teora moderna de los dos procesos asume que el condicionamiento clsico media la conducta instrumental a traves del condicionamiento de estados emocionales centrales como la esperanza (en el caso de reforzamiento positivo) o el miedo (en el caso del reforzamiento negativo). En ciertas circunstancias los animales adquieren expectativas especificas del reforzador en lugar de un estado emocional ms general de esperanza durante el condicionamiento instrumental y clsico. El aprendizaje de expectativa especifica de recompensa es una alternativa imporante a la teora de los dos procesos para explicar ciertos tipos de resultados. Esta basada en la asuncin de que el condicionamiento instrumental incluye aprendizaje de una asociacin E-C. Las asociaciones E-C parecen ser fundamentales para la motivacin de la conducta instrumental, Berridge (2001) apunto que la asociacin E-C, E llega a ser un estmulo de incentivo; E en si mismo llega a ser atractivo. Esta motivacin adquirida de incentivo contribuye significativamente a la motivacin de la respuesta instrumetnal.
Como resumen: la teora de los dos procesos asume que el condicionamiento clsico media de conducta instrumental a traves del condicionamiento de estados emocionales centrales como la esperanza o el miedo.

Relaciones R-C y E(R-C) en el condicionamiento instrumental


La intuicin sugiere que la conducta instrumental involucra asociaciones R-C, estas no existen en el modelo de los dos procesos. Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida por las teoras de los dos procesos es que E supone que llega a estar asociado directamente con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de condicionamiento clsico. Los emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones pavlovianas. El EC debe tambin proporcionar informacion acerca del EI, o estar de alguna manera relacionado con el EI. Esta condicionalidad en la relacin de E con C es desestimada en la teora de los dos procesos.
Parece difcil creer que toda la motivacin depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellas establece una relacin directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevan una consecuencia determinada, cosa que no refleja la teora de los dos procesos.

112

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el condicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia. La devaluacin del reforzador La importancia de la asociacin R-C se ve con la devaluacin del reforzador. ha sido utilizada para DEVALUACIN DEL REFORZADOR determinar si la repuesta Fase 1: Entrenamiento de dos conductas con IV1 con reforzadores dintintos. Fase 2: Devaluacin del reforzador: Reforzador + LiC1 (condicionamiento de instrumental esta mediada aversin) por una asociacin entre la Fase 3: Posibilidad de realizar las dos conductas aprendidas La conducta cuyo reforzador ha sido condicionado aversivamente disminuye. respuesta y la consecuencia reforzante. La supresin selectiva de respuesta que se obtuvo es difcil de explicar a partir de las asociaciones E-C o E-R que se supone que son aprendidas de acuerdo con la teora de los dos procesos, la devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada separadamente con su propio reforzador. Evidencia del aprendizaje de una relacin jerarquica E-(R-C); los organismos aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C no pueden actuar aisladamente para producir la repuesta instrumental. E no activa R directamente , sino que activa la asociacion R-C. El sujeto llega a pensar en la asociacion RC cuando se encuentra con E, y eso motiva que realice la respuesta instrumental. Skinner (1938) sugiri que E, R y C en el condicionamiento instrumental estn conectados a travs de una relacin condicional E-(R-C).

Regulacin Conductual

(pgina 199 del libro)

La regulacin conductual se centran en cmo las contingencias instrumentales ponen limitaciones a las actividades de un organismo.

Antecedentes de la regulacin conductual


Los tericos estn de acuerdo en que los reforzadores son un tipo especial de estmulos.
especia (comer, beber...) son en s mismas el La teora de la respuesta consumatoria rasgo crtico de los reforzadores. El primer reto a esta idea vino de Fred Sheffield Esta teora considera que las respuestas que formularon la teora de respuesta reforzadoras son especiales porque involucran la consumatoria, esta atribuye el reforzamiento a consumacin o el completamiento de una secuencia institntiva de conducta. La teora estas conductas tpicas de la especie. Se establece asume que las respuestas consumatorias que las respuestas consumatorias tpicas de la (masticar y tragar, por ejemplo) son fundamentalmente diferentes de varias especie son en si mismas el rasgo critico de los respuestas instrumentales potenciales (correr, saltar...) reforzadores. Fue una innovacin radical debido a que traslado la investigacin de los reforzadores desde tipos especiales de estmulos a tipos especiales de respuestas. Se considero que las respuestas reforzadoras eran especiales porque involucraban la consumacin o el Las respuestas consumatorias tpicas de la

113

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con su teora y sugiri que las respuestas reforazdoras son especiales slo debido a que es ms probable que ocurran que las respuestas instrumentales a las que siguen. El principio de Premack: Apunt que Principio de Premack las respuestas incluidas en los Las respuestas incluidas en los reforzadores comnmente reforzadores comnmente utilizados utilizados son actividades que es altamente probable que realicen los animales. eran actividades que es altamente probable que realicen los animales. Las Principio de Premack o "Principio de la probabilidad diferencial" respuestas instrumentales son activi"Dadas dos respuestas de diferente probabilidad, A y B, la dades que normalmente ocurren a una oportunidad para realizar la respuesta de alta probabilidad A despus de la respuesta de baja probabilidad B tendr como baja probabilidad. Propuso que esta resultado el reforzamiento de la respuesta B. (BA refuerza B). La diferencia en las probabilidades de oportunidad para realizar la respuesta B de baja probabilidad despus de la respuesta A de alta probabilidad no dar como respuesta es critica para el reforzaresultado el reforzamiento de la respuesta (A no refuerza A)" miento. Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora. En consecuencia tambin es denominado el principio de la probabilidad diferencial.

El principio de Premack signific un avance importante en el pensamiento cientfico sobre el reforzamiento. Estimul la consideracin de los reforzadores como respuestas ms que como estmulos, y ampli mucho el rango de cosas que los investigadores empezaron a utilizar como reforzadores. Cualquier actividad poda servir como reforzador siempre y cuando fuera ms probable que la respuesta instrumental.
Principio de Premack Una conducta muy probable es una conducta muy preferida. Las conductas probables (preferidas) sirven para reforzar las menos probables y hacer que se repitan ms en el futuro. Respuesta reforzadora: La que se usa para reforzar otra. Respuesta instrumental: La que es reforzada con otra. Principio de Premack Tambin sirve para el castigo... Las conductas poco probables (no preferidas) sirven para castigar la ms probables y hacer que no se repitan tanto en el futuro. La conducta instrumental es la castigada.

114

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

La hiptesis de la privacin de respuesta: En la mayora de los procedimientos de condicionamiento instrumental, la probabilidad momentanea de una respuesta reforzada se mantiene a un nivel alto mediante la restriccin al acceso a la respuesta reforzante. Premack (1965) reconoci la importancia de restringir el acceso a respuesta reforzadora para el condicionamiento instrumental. Caracterizo la privacin de respuesta no slo como una condicin necesaria para el reforzamiento sino como algo adjunto al principio de probabilidad diferencial. La respuesta reforzadora todava tiene que ser una conducta ms probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974) abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la restricicin de la respuesta reforzadora era el factor critico para el reforzamiento instrumental, esta propuesta es denominada Hipotesis de privacin de respuesta, hace explicita la idea radicalmente diferente de que un reforzador es producido por la contingencia instrumental en si misma. Posteriores desarrollos de las teoras de regulacin conductual han establecido como las contingencias instrumentales crean los reforzadores y los efectos del reforzamiento.
Hiptesis de la privacin de la respuesta: Lo importante no es la probabilidad diferencial de las conductas (cules se repitan ms y cules menos), sino el estado de privacin de una determinada conducta. Puede que en el estado natural correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar como respuesta reforzadora.

Regulacin conductual y el punto de deleite conductual


Las teoras de la regulacin conductual asumen que existen mecanismos homeostticos analogos respecto a la conducta. Se propone que los organismos tienen una distribucin de actividades preferida u optima que luchan por mantener frente a los cambios o interrupciones. Se centran en el grado en que la contingencia instrumental respuestareforzador rompe la esabilidad condcutual y empuja al individuo fuera de su distribucin de actividades preferida u optima. El punto de deleite conductual. La teora de la regulacion conductual asume que si los organismos son libres para distribuir sus respuestas entre las alternativas disponibles, lo harn de la forma en que sea mas comodo o en algn sentido optimo para ellos. Esta distribucin de respuestas define el punto de deleite conductual. El punto de identificarse relativa de respuestas de deleite conductual puede mediante la frecuencia ocurrencia de todas las un organismo en una situacin sin restricciones.

115

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Imposicin de una contingencia instrumental. La teora de regulacion conductual establece que los organismos defendern el punto de deleite conductual contra los cambios. Lo interesante es que la lnea de base libre del Imposicin de una contingencia instrumental: punto de deleite conductual no siempre puede Si dejamos al sujeto a su aire, se quedar en el punto de deleite. Eso puede ser malo ( ejemplo: ser restablecida despus de que se haya estudiar poco, fumar mucho...) introducido una contingencia instrumental. Este El terapeuta quiere modificar esa distribucin de conductas haciendo que se apartarten del punto de es a menudo el dilema que impone una deleite. Cmo? Mediante reforzamientos y castigos. contingencia instrumental. No permite volver al punto de deleite. El punto de deleite proporciona la motivacin para la conducta instrumental. La teora de regulacin conductual asume que para volver al punto conductual establecido continua siendo una meta en la distribucin de respuestas. Cuando este meta no puede alcanzarse, la redistribucin de las respuestas entre las conductas instrumental y contingente llega a ser una cuestin de ajuste. La tasa de una respuesta se mantiene lo mas cerca posible del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido. Staddon propuso un modelo de desviacin minima de regulacin conductual para resolver el dilema de las restricciones del programa, la introduccin de una contingencia respuestareforzador provoca que los organismos redistribuyan sus conductas entre las respuestas intrumentales y contingentes de manera que se minimice la desviacin total de las dos respuestas con respecto al punto optimo o de deleite. Explicacin los efectos de reforzamiento. La regulacin conductual incluye la defensa de un punto de deleite conductual frente a restricciones de respuesta impuestas por una contingencia respuesta-reforzador. Esta defensa puede requerir establecerse en algn punto cercano peno no exactamente en el punto de deleite de la lnea base. El aumento en la respuesta instrumental (un efecto de reforzamiento ) es el resultado de mecanismos reguladores de la conducta que funcinan para minimizar las desviaciones del punto de deleite conductual. Una vision sobre las contingencias de reforzamiento en un contexto conductual mas amplio:Las contingencias instrumentales no suceden en un vacio conductual ocurren en el contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto.

116

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Centrarse solo en la respuesta instrumental y sus estmulos antecedentes y consecuentes (esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto conductual mas amplio ya que puede influir de forma significativa en el resultado de los procedimientos particulares de condicionamiento instrumental.

Conceptos economicos y distribucin de respuesta


En las situaciones de condicionamiento instrumental, las restricciones estn proporcionadas por el nmero de respuestas que un organismo es capaz de realizar y el nmero de respuestas requerido para obtener cada reforzador. Demanda del consumidor. La relacin entre el precio de una comodidad y cuanto se obtiene se denomina curva de la demanda. El grado en el cual el precio influye en el consumo se denomina elasticidad de la demanda. El concepto de demanda del consumidor puede utilizarse para analizar el reforzamiento instrumental considerando el numero de respuestas realizadas como anlogo al dinero. EL precio de un reforzador es el tiempo o numero de respuestas requeridas para obtener un reforzador. Por tanto, el precio del reforzador esta determinado por el programa de reforzamiento.

Determinantes en la elasticidad de la demanda. Los conceptos econmicos han ayudado a identificar tres factores principales que influyen en como las restricciones de un programa moldean la redistribucin de la conducta. 1 Disponibilidad de sustitutos: Es el factor que mas influye en la elasticidad de la demanda. La disponibilidad de sustitutos aumenta la sensibilidad del articulo a los precios altos. Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la sesin experimental. La parte de comida que no comen durante la sesin experimental se les da luego en la jaula hogar, esta situacin se denomina una economa abierta, Esto se contrapone con una economa cerrada, en la cual los sujetos no reciben alimentacin

117

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economa abierta que en economas cerradas. 2 Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos. 3 Nivel de ingresos: En estudios de condicionamiento instrumental, el nmero de respuestas o la cantidad de tiempo disponible para responder corresponde a los ingresos. Cuantas ms respuestas o tiempo tengan disponibles los animales, menos estar su conducta influida por los aumentos en el coste del reforzador.

Problemas con las aproximaciones de regulacin conductual


El punto de deleite es una caracterstica 1. El punto de deleite se formula desde un punto de vista molar de la conducta. Se basa en una medida molar (como un conjunto, y a lo largo de un periodo amplio). Sin embargo, est demostrado que es de cada respuesta acumulada a lo largo del importante cmo se alcanza ese punto de deleite bloque temporal amplio. Un punto de deleite (pausas de eleccin en los cambios de conducta a otra) desde un punto de vista ms molecular. molar dado puede alcanzarse de varias formas, de acuerdo con esta aproximacin , 2. El "valor reforzante de una conducta puede cambiar segn si es obligada o no. Por ejemplo, al principio las diferencias en las pautas de respuesta no una conducta A puede ser agradable, pero cuando la deberian tener importancia. Pero la evidencia utilizo para reforzar otra conducta B, estoy imponiendo la conducta A. Cmo s si sigue siendo experimental indica que es importante como tan agradable como al principio? se alcanza el punto de deleite molar. En consecuencia una adecuada caracterizacin del deleite conductual requiere informacin sobre las pautas de eleccin moleculares. Otra dificultad, tal vez ms seria es que las respuestas durante un periodo de lnea base libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se requiere por una contingencia instrumental impuesta. Finalmente, debido a que las aproximaciones no comprenden procesos conductuales molecualres, no dicen nada de cmo los organismos defienden una combinacin favorita de bienes o actividades.

118

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

Contribuciones de la regulacin conductual


1 Nos alej de la consideracin de los reforzadores como tipos especiales de respuestas. Los efectos del reforzamiento se ven como producidos por las restricciones del programa en el devenir de las actividades de un organismo. 2 Los procedimientos de condicionamiento instrumental ya no se considera que estampan o fortalecen la conducta instrumental: en su lugar el condicionamiento instrumental es visto como la creacin de una nueva distribucion, o asignacin de respuestas, la reasignacin de la conducta incluye un aumento en la respuesta instrumental y una disminucin de la respuesta reforzadora. 3 No existe una distincin fundamental entre las respuestas instrumentales y las reforzadoras, se distinguen solo por los papeles asignados a ellas mediante un procedimiento de condicionamiento instrumental.
1. Antes se pensaba en los reforzadores como tipos especiales de estmulos. Desde la aproximacin de la regulacin conductual, la causa del reforzamiento est en la forma en que el flujo libre, natural, de la conducta se ve alterado por las contingencias instrumentales. Una conducta puede ser reforzante. 2. Ahora, el entrenamiento instrumental ya no sirve slo para "fijar" o "eliminar" una conducta, sino que crea una nueva distribucin de conductas en general.

3. Una respuesta reforzadora no tiene nada inherente distinto de una respuesta instrumental: no proporciona ningn beneficio especial, por ejemplo fisiolgico (hacer ejercicio vs. Comer caramelos). Simplemente, el que una conducta sea reforzadora o intrumental va a depender de los papeles que les asigne el terapeuta o experimentador. 4. Ha contribuido a ver el condicionamiento instrumental como un sistema, en vez de cmo elementos aislados. Al cambiar un solo elemento, el sistema entero se ve afectado.

4 Aceptan la idea de que los organismos responden para maximizar sus beneficios. 5 Han proporcionado caminos nuevos y precisos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no puede ser estudiada en un vacio o en un tubo de ensayo conductual. Todas las opciones de respuesta del organismo que se dan en un momento dado deben ser consideradas como un sistema.

Comentarios finales
Los procesos motivacionales en la conducta instrumental se ha enfocado desde dos perspectivs radicalmente diferentes y dos tradicionaes intelectuales: la perspectiva asociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamiento pavloviano, y la perspectiva de la regulacin conductual tiene su origen en el anlisis conductual skinneriano. Estas dos aproximaciones difieren msque se asemejan, haciendo difcil imaginar cmo podran integrarse. Por ejemplo, el concepto fundamental en la

119

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

aproximacin asociacionista (el concepto de una asociacin) es enteramente soslayado por la regulacin conductual. Igualmente, los conceptos crticos de la regulacin conductual(puntos de deleite y restricciones del programa) no tienen correspondencia en la aproximacin asociacionista. La aproximacin asociacionista por s misma lleva un inmediato a la exploracin de los circuitos neurales de condicionamiento instrumental. Por otra parte, es difcil ver cmo la aproximacin de la regulacin conductual podra utilizarse para guiar la investigacin neurofisiolgica. Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambas han contribuido de forma significativa a la compresin de la motivacin de la conducta instrumental. Es evidente que una aproximacin no puede ignorarse a favor de la otra, pero cmo contribuye cada una a la compresin completa de la motivacin instrumental?. Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles de anlisis. La asociacionista involucra un nivel molecular donde el objetivo son los estmulos especficos, las respuestas, y sus conexiones. En contraste, como se ha descrito, la regulacin conductual opera a un nivel molar de agregados de conducta y de contextos conductuales ms amplio en el que operan las contingencias intrumentales. Por tanto, la aproximacin de la regulacin conductual contacta mejor con las complejidades de la ecologa de un organismo. Otra forma de pensar en la relacin entre las dos aproximaciones es que una se relaciona con procesos y la otra est ms relacionada con funciones o metas a largo plazo. La aproximacin asociacionista describe procesos especficos [asociaciones E-R, E-C, R-C y E(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuenta el proposito o funcin a largo plazo del aprendizaje instrumental. ste es el punto de vista de la regulacin conductual y la economa conductual, que asumen que los organismos trabajan para defender una distribucin ptima de actividades. La defensa del punto de deleite conductual se alcanza mediante los procesos molecualres de las asociaciones. Los desarrollos conceptuales en el estudio de la motivacin de la conducta instrumental proporcionan un ejemplo representativo del curso de lainvestigacin cientfica. sta se ha desarrollado desde formulaciones simples estmulo-respuest hasta consideraciones ms comprensivas de la forma en que el repertorio del organismo se restringe mediante las contingencias intrumentales y cmo los organismos resuelven problemas ecolgicos complejos. En ese aspecto del estudio del condicionameinto y el aprendizaje, tal vez ms que en ningn otro, los investigadores se han movido con atrevimiento para explorar nuevas conceiones cuando las viejas ideas no afrontaban con xito los desafios propuestos por los hallazgos empricos.

120

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 7: Condicioamiento instrumental: Mecanismos Motivacionales


Juan Carlos Cabrera

TERMINOS CLAVE
Curva de la demanda Relacin entre la cantidad que se obtiene de una comodidad y su precio. Elasticidad de la demanda Grado en el que el precio influye sobre el consumo u obtencin de una comodidad. Si el precio tiene un efecto importante en el consumo, la elasticidad de la demanda es alta. Si el precio tiene poco efecto sobre el consumo, la elasticiadad de la demanda es baja. Experimento de transferencia de control Experimento que evala los efectos de un estmulo condicionado clsicamente (EC) en la ejecucin de la conducta instrumental. El EC y la respuesta instrumental se condicionan en primer lugar en fases independientes del experimento. Los efectos del EC sobre la respuesta instrumental se determinan entonces en la fase de transferencia. Hiptesis de la privacin de respuesta Explicacin del reforzamiento que defiende que la restriccin el acceso a una respuesta por debajo de su tasa de lnea base de ocurrencia (privacin de respuesta) es suficiente para hacer que la oportunidad de ejecutar esa respuesta acte como un reforzador positivo efectivo. Modelo de desviacin mnima Modelo de conducta instrumental, segn el cual los participantes responden a la contingencia respuestareforzador de manera que los acerque lo mximo posible a su punto de deleite conductual.

(pgina 216 del libro)

Punto de deleite conductual Distribucin preferida de las actividades de un organismo antes de que se introduzca un procedimiento de condicionamiento instrumental que disponga limitaciones en la distribucin de respuesta. Principio de Premack Lo mismo que principio de

probabilidad diferencial.

Principio de probabilidad diferencial Principio que asume que el reforzamiento depende la la probabilidad relativa del organismo de ejecutar la respuesta reforzadora frente a la respuesta instrumental antes de qu se introduzca el procedimiento de condicionamiento intrumental. Cuanta ms diferencia exista entre la probabilidad de la respuesta reforzadora y la instrumental durante las coniciones de lnea de base, mayor ser el efecto reforzante de proporcionar la oportunidad de ejecutar la respuesta reforzadora tras realizar la instrumental. Tambien conocido como principio de Premack. Teora de la respuesta consumatoria Teora que asume que las respuestas consumatorias tpicas de la especia (comer, beber y cosas as) son las caractersticas fundamentales de los reforzadores.

121

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera 2009/2010

Identificacin y medida del control por el estmulo - Respuesta diferencial y discriminacin de estmulos - Generalizacin de estmulos - Los gradientes de generalizacin del estmulo como medida de control por el estmulo. Factores del estmulo y la respuesta en el control por el estmulo - Capacidad sensorial y orientacin. - Facilidad relativa del condicionamiento de varios estmulos. - Tipo de reforzamiento. - Tipo de respuesta instrumental. - Elementos del estmulo frente a claves configuracionales en los estmulos compuestos. Factores de aprendizaje en el control por el estmulo - Entrenamiento en discriminacin de estmulos. - Efectos del entrenamiento en discriminacin sobre el control por el estmulo. - Rango de posibles estmlos discriminativos. - Qu se aprende en el entrenamiento de discriminacin? - Interacciones entre el E+ y el E-: desplazamiento del mximo - Entrenamiento de equivalencia de estmulos Claves contextuales y relaciones condicionales - Control por claves contextuales. - Control por las relaciones condicionales. Comentarios finales

123

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Es tan importante la adecuacin de una respuesta instrumental al contexto estimular en el que se realiza, que la falta de un apropiado control por el estmulo se considera a menudo anormal, desvertirse en privado es aceptable en publico motivo de arresto. El control de la conducta por el estmulo es un aspecto importante de la forma en que los organismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligro los animales tienen que comportarse de forma congruente con las circunstancias cambiantes.

Identificacin y medida del control por el estmulo

(pgina 218 del libro)

Cmo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos estmulos?.

Respuesta diferencial y discriminacin de estmulos


El control por el estmulo de la conducta instrumental se demuestra mediante variaciones en la respuesta (respuesta diferencial) relacionadas con las variaciones en los estmulos. Si un organismo responde de una manera en presencia de un estmulo, y de forma diferente en presencia de otro, se puede decir que su conducta esta bajo el control de esos estmulos. Estas respuestas diferenciales resultan evidentes en el comportamiento de las dos palomas del experimento de Reynolds.
Reynolds (1961) Entrenamiento:

Prueba: Resultados: una paloma picoteaba ms el circulo rojo y para la otra fue el triangulo blanco. Conclusiones: Si un cambio en el estmulo conlleva un cambio

en la conducta, es que ese estmulo controla La respuesta diferencial a dos estmulos tambin en cierta medida esa conducta. indica que las palomas estaban tratando cada Para que un estmulo controle una conducta, el estmulo de forma diferente. Esto se denomina organismo tiene que poder distinguir ese estmulo de otros (diferenciar al estmulo comdiscriminacin de estmulos. Se dice que un puesto del crculo por un lado y del triangulo organismo muestra discriminacin de estmulos si por el otro). responde de forma diferente a dos o ms En esta situacin es difcil predecir qu componente del estmulo original va a tener el conestmulos. La discriminacin de estmulos y el trol. Unas palomas responden ms al crculo, control por el estmulo constituyen dos maneras otras al trangulo. de considerar el mismo fenmeno: una no existe sin la otra. Si un organismo no discrimina entre dos estmulos, su conducta no esta bajo el control de esas claves.

Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pjaro estaba controlada por un estmulo diferente. En ausencia de procedimientos especiales, los investigadores no siempre pueden predecir cual de varios estmulos de aquellos que un organismo experimenta adquirir control sobre su conducta instrumental
125

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Generalizacion de estmulos
Identificar y diferenciar varios estmulos no es algo tan simple. Los estmulos pueden definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se consideran ejemplos del mismo estmulo debido a que comparten la misma funcin. En otros casos, los estmulos se identifican y distinguen partiendo de rasgos fsicos precisos, como la longitud de onda. Los anlisis experimentales del problema han dependido en su mayora del fenmeno de la generalizacin de estmulos, que es lo opuesto a la respuesta diferencial, o discriminacin de estmulos. Se dice que un organismo muestra generalizacin de estmulos si responde manera similar a dos o mas estmulos. Este fenmeno fue observado en primer lugar por Pavlov. En un experimento clsico Guttman y Kalish palomas programa IV picotear con luz amarillenta con longitud de onda 580 nanometros, despus se observa que palomas tambin responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en funcin de la semejanza entre cada estmulo de prueba y el estmulo original de entrenamiento. Este resultado es un ejemplo de lo que se denomina gradiente de generalizacin de estmulo.

Los gradientes de generalizacin del estmulo como medidas del control por el estmulo
Se utilizan a menudo para medir el control por el estmulo porque facilitan informacin acerca del grado de sensibilidad de la conducta de un organismo ante la variacin de un aspecto particular del ambiente. Guttman y Kalish (1956) y el experimento hipottico con las palomas ciegas a los colores indica que lo acusado del gradiente de generalizacin de un estmulo proporciona una medida precisa del grado de control del estmulo. Se obtiene un gradiente de generalizacin plano si el organismo responde de forma similar a todos los estmulos de la prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estmulo que se varia en la prueba de generalizacin no controla la conducta instrumental. Por el contrario, se obtiene un gradiente de generalizacion acusado si el organismo responde en mayor medida a algunos de los estmulos de prueba que a otros. Esta respuesta diferencial evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del estmulo que varia entre los estmulos de prueba.

126

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Si se da una gran cantidad de generalizacin, se dara poca respuesta diferencial. Si la respuesta es altamente diferencial ante los estmulos, se obtendr una minima generalizacin.

Factores del estmulo y la respuesta en el control por el estmulo.

(pgina 222 del libro)

La cuestin principal es la siguiente Qu es lo que determina que una de las muchas caractersticas de una situacin estimular adquiera control sobre la conducta instrumental?.

Capacidad sensorial y orientacin


El factor que determina de forma mas evidente si una caracterstica particular del estmulo llega a controlar la respuesta es la capacidad sensorial y de orientacin del individuo. La presentacin de estmulos con ciertas caractersticas de interes para un organismo no garantiza que otro organismo respondera a las mismas caractersticas. Los sucesos fuera del rango de lo que un organismo puede detectar con sus rganos sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o sean transducidos a algo que el organismo pueda detectar. Las limitaciones en los estmulos que pueden llegar a controlar la conducta dependen tambin de si el individuo llega a tomar contacto con el estmulo.

127

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Facilidad relativa del condicionamiento de varios estmulos


La intensidad con que los organismos aprenden sobre un estmulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situacin. Este fenmeno se llama ensombrecimiento. Pavlov fue el primero en observar que si dos estmulos se presentan al mismo tiempo, la presencia del estmulo que se puede entrenar mas fcilmente puede ocultar el aprendizaje del otro. En general cuanto ms intenso sea el estmulo , ms rpido se condicionara y ensombrecer el aprendizaje del estmulo mas dbil. Pavlov encontr que el estmulo dbil poda llegar a condicionarse (algo ms lentamente ) si se presentaba solo.
Factores del estmulo y la respuesta. 1. Capacidad sensorial del individuo.

2. Facilidad de condicionamiento del estimulo. Unos estmulos se condicionan mejor que otros, por su intensidad, naturaleza...

Tipo de reforzamiento
Es ms probable que ciertos tipos de estmulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. Ciertos hallazgos indican que el control por el estmulo de la conducta instrumen-tal esta determinado en parte por el tipo de reforzamiento utilizado. Es ms probable que los estmulos visuales adquieran control sobre la conducta en situaciones apetitivas que las claves auditivas, mientras que es mas probable que estas adquieran control en situacio-nes aversivas.

Esto est probablemente relacionado con los sistemas de conducta que se activan en los dos casos, la activacin del sistema de alimentacin puede involucrar una sensibilidad incrementada a los estmulos visuales. En contraste los procedimientos de evitacin de la descarga activan el sistema de conducta defensiva. Responder a claves auditivas puede ser particularmente adaptativo para evitar el peligro.

Efectos del tipo de reforzamiento en el control por el estmulo. Se reforz una respuesta de presin de un pedal en palomas en presencia de un estmulo compuesto consistente en un tono y una luz. Con un reforamiento con comida, la luz obtuvo mucho ms control sobre la conducta que el tono. Con un reforzamiento de evitacin de una descarga, el tono adquiri mucho ms control sobre la conducta que la luz (Adaptado de Foree y Lolordo, 1973.)

128

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Tipo de respuesta instrumental


Otro factor que puede determinar que rasgos de un estmulo compuesto obtendrn control sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento. Las respuestas que se diferencian por la localizacin es mas probable que lleguen a estar bajo el control de la caracterstica espacial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable que lleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenmeno se denomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociacin selectiva. El efecto de naturaleza-localizacin no significa que los sujetos no puedan nunca aprender sobre la naturaleza de los sonidos cuando estn involucradas respuestas que se diferencias espacialmente o que nunca puedan aprender acerca de la localizacin de los sonidos en una tarea de hacer/no hacer. Con un emplazamiento oportuno de las fuentes de sonido (uno mucho ms cerca de la respuesta que el otro), los sujetos pueden llegar a responder a las caractersticas de localizacin de sonidos en una tarea de hacer/no hacer.

Elementos del estmulo frente a claves configuracionales en los estmulos compuestos.


En el anlisis anterior sobre el control de la conducta por varios elementos del estmulo, se asumi que los organismos tratan a estos elementos del estmulo como rasgos distintivos y separados del ambiente. Esto se denomina aproximacin elemental del estmulo. Por tanto, en el efecto de naturaleza-localizacin, la naturaleza y la localizacion de un estmulo auditivo se consideran caractersticas separables de las claves auditivas. Se supona que una caracterstica particular del estmulo (la naturaleza del sonido) se perciba de la misma manera independientemente del estatus de la otra caracterstica (la localizacin del sonido). Una alternativa teorica importante presuma que los organismos tratan los estmulos complejos como un todo integral que no se divide en partes o elementos. Esto se denomina aproximacin de la clave configuracional. De acuerdo con la aproximacin de la clave configuracional, los individuos responden a un estmulo compuesto en funcin de la configuracin nica de sus elementos. Se asume que los elementos no se tratan como entidades separadas. Pueden incluso no ser indentificables cuando se presenta el estmulo compuesto, los elementos del estmulo son importantes no en cuanto a su individualidad sino en funcion de cmo contribuyen a la configuracin total de la estimulacin proporcionada por el compuesto. El ensombrecimiento , segn esta teoria, refleja diferentes grados de decremento de la generalizacin desde la fase de entrenamiento a la de prueba para los grupos de ensombrecimiento y de control, (John Pearce, 1987): No hay decremento de la generalizacin para el grupo de control cuando se prueba el estmulo dbil a porque es el mismo estmulo que recibion durante el condicionamiento. Por el contrario, se da un
129

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

considerable decremento de la generalizacin cuando se prueba el estmulo a en el grupo de ensombrecimiento tras el condicionamiento con el compuesto aB. Para el grupo de ensombrecimiento, la respuesta se condiciona al compuesto aB, que es muy diferente de presentar slo a durante la generalizacin, este mayor decremento de la generalizacon es la causa delefecto de ensombrecimiento. En ciertas condiciones, los organismos claramente responden a los estmulos compuestos principalmente en trminos de la configuracin de los elementos que forman el compuesto. Esta teoria es incompatible con varios ejemplos de asociaciones selectivas que se han descrito con anterioridad, no explica por que el control por el, estmulo esta en funcin del tipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusin mas prudente es que los organismos responden a los compuestos estimulares tanto a partir de los elementos del estmulo que forman el compuesto como en funcin de configuraciones estimulares nicas creadas por los elementos del estmulo. En ciertas circunstancias predomina el control elemental, mientras que en otras condiciones predomina el control de las caractersticas configuracionales de los compuestos estimulares. La estructura de una teora unificada de este tipo ha sido descrita recientemente por Wagner y Brandon (2001), estmulos como el sonido de un tono contienen rasgos distintivos (tono, intensidad, localizacin ). Cuando un estmulo se combina con otro se crean nuevos elementos estimulares configuracionales que son nicos para este nueva combinacin estimular. Ademas, algunos de los rasgos individuales de los estmulos originales se pierden en la combinacin. Esto sesga el control por el estmulo a favor de los elementos configuracionales y produce resultados congruentes con la aproximacin de la clave configuracional.

FACTORES ESTMULO

DE

APRENDIZAJE

EN

EL

CONTROL

POR

EL

(pgina 230 del libro)

Los factores del estmulo y la respuesta son los puntos de arranque del control por el estmulo. El que ciertos estmulos lleguen a controlar la conducta a menudo depende de lo que el organismo ha aprendido acerca de esos estmulos. La sugerencia de que la experiencia con los estmulos puede determinar hasta que punto estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el fenmeno dela generalizacin de estmulos. Pavlov sugiri que la generalizacin del estmulo se da porque el aprendizaje sobre el EC llega a transferirse a otros estmulos en funcin de la semejanza fsica de esos estmulos de prueba con el EC original. Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea de que la generalizacin del estmulo reflejase la transferencia del aprendizaje y argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la generalizacin del estmulo ocurre si los organismos no han aprendido a distinguir las diferencias entre los estmulos. Defendian que los animales tenan que aprender a tratar los estmulos como diferentes uno de otro. Consideraban la forma del gradiente de
130

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

generalizacin del estmulo como determinada principalmente por las experiencias previas de aprendizaje del organismo mas que por las propiedades fsicas de los estmulos.

Entrenamiento en discriminacin de estmulos.


Numerosos estudios han demostrado que el control por el estmulo puede alterarse de forma notable por las experiencias de aprendizaje. El procedimiento ms poderoso para situar la conducta bajo el control de un estmulo es el entrenamiento en discriminacin de estimulos. En un procedimiento de discriminacin de estmulos los participantes se exponen al menos a dos estmulos diferentes, pero el reforzamiento por realizar la respuesta instrumental esta disponible solo en presencia de uno de los colores. El estmulo que seala la disponibiliad de reforzamiento se denomina E+ o ED (pronunciado e de). En contraste, el estmulo que seala la falta de reforzamiento se denomina E- o E (pronunciado e delta). Los

adquirido control sobre la condcuta del organismo, se denominan estmulos discriminativos . El E+ es un estmulo discriminativo para la realizacin de la respuesta instrumental, y el E- es un estmulo discriminativo para la supresin de la respuesta. Los procedimientos instrumentales de discriminacin de estmulos se diferencian de los procedimientos de condicionamiento clsico slo en que el reforzador se presenta de forma contingente a la respuesta durante el E+. No es necesario responder para que se den los emparejamientos del EC+ con el EI en el condicionamiento clsico. A diferencia de un EC+, un E+ no seala de que el reforzador ocurrir inevitablemente. Ms bien, el E+ indica que la respuesta instrumental ser reforzada. En un programa mltiple de reforzamiento funcionan diferentes programas de reforzamiento en presencia de diferentes estmulo.

procedimientos de discriminacin de estmulos establecen un control por los estmulos que sealan cuando esta o no disponible el reforzamiento. Cuando E+ y E- han

Efectos del entrenamiento en discrimacion sobre el control por el estmulo


El entrenamiento en discriminacin situa la conducta instrumental bajo el control del E+ y el E-. Los investigadores deben tambin determinar lo acusado del gradiente de generalizacin cuando los participantes responden en presencia de estmulos que varian sistemticamente a partit del E+: Es mas debe determinarse que aspecto del procedimiento

131

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

del entrenamiento en discriminacin es responsable del tipo de gradiente de generalizacin del estmulo que se obtiene. Jenkins y Harrison (1960,1962) examinaron como los estmulos auditivos que diferan en el tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Ungrupo de pajaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no recibia reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servia commo E+ y la ausencia de tono como E-. Para el segundo grupo, el tono de 1000 hz sirvio de nuevo como E+ , pero el E- fue un tono de 950 hz. El tercer grupo de palomas sirvi como grupo de control y no recibi entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podan recxibr reforzamiento por picotear cuando estaban en la cmara experimental. Despues de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteo en presencia de tonos de varia frecuancias para ver con que precisin controlaba el tono dicha conducta. El grupo control respondi de forma casi idntica en presencia de todos los estmulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de losotros procedimientos de entrenameinto produjo un mayor nivel de control estimular por el tono. El gradiente de generalizacin mas acusado y por tanto el control por el estmulo mas fuerte se observo en los pajaros que haban sido entrenados con el tono de 1000 hz como E+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono ) mostraron un grado intermedio de control. Este experimento aporto dos conclusiones importantes (1) el entrenamiento en discriminacin aumenta el control por el estmulo de la conducta instrumental, y (2) una dimensin particular del estmulo (como la frecuencia tonal ) es mas probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensin del estmulo.

Rango de posibles estmulos discriminativos


Los procedimientos de entrenamiento en discriminacin se emplean a menudo para evaluar la capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado para determinar los umbrales visuales y auditivos .Los investigadores tambin se han interesado por el estudio de si los animales son capaces de detectar las sensaciones internas creadas por una droga. Esta investigacin ha mostrado que los mecanismos de control por el estmulo con drogas son asombrosamente parecidos a los mecanismos identificados por Jenkins y Harrison para el control del picoteo de una tecla por claves visuales en las palomas. El gradiente de generalizacin fue mucho mas acusado, lo que indica un control por las drogas mucho mas fuerte.

132

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Qu se aprende en el entrenamiento de discriminacin?


Se aprende a responder al E+ como a suprimir la respuesta ante el E-. Teora de Spence del aprendizaje de discriminacin: Esta basada en la idea de que lo que se aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+ como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo que sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial al E+ y al E- refleja tanto la excitacin por responder ante el E+ como la inhibicin por responder ante el E-. Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes de generalizacin del estmulo. Si se ha condicionado una tendencia exitatoria al E+, entonces los estmulos que difieran de forma prograsiva del E+ deberan ser cada vez menos efectivos en evocar la respuesta intrumental. En otras palabras, debe observarse un gradiente de generalizacin acusado, con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradiente de generalizacin del estmulo excitatorio. Por el contrario, si se ha condicionado una tendencia inhibitoria al E-, entonces los estmulos que difieran progresivamente del Edeberan ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado se llama gradiente de generalizacin del estmulo inhibitorio. Las pruebas conductuales llevadas a cabo dcadas despus compro-baron que las ideas de Spence eran sustancialmente correctas. En un experimento clsico honig, Boneau, Burstein y pennypacker, 1963. Un grupo de palomas es reforzado cuando la tecla estaba iluminada con luz blanca y una lnea vertical negra (E+) sin la lnea vertical no refuerzo (E-). 2 Grupo el E+ yEintercambiados, despus de que los dos grupos aprenden a responder al E+, se llevaron a cabo las pruebas de generalizacin del estmulo para averiguar el grado de control de la barra vertical negra sobre la conducta; en el grupo 1, mayor tasa de respuesta ante la raya vertical y progresivamente descendiendo, esto

Gradientes de generalizacin del estmulo para estmulos consistentes en la inclinacin de una lnea en dos grupos de palomas tras un entrenamiento en discriminacin. Para el Grupo 1, sirvi como E+ una barra vertical negra sobre un fondo blanco, y la luz blanca sin barra sirvi como E-. Para el Grupo 2, las funciones de los estmulos se invietieron.

133

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

ilustra un gradiente de generalizacin del estmulo excitatorio. En el grupo 2los estmulos que eran cada vez mas diferentes del original E- producan progrsivamente menos inhibicin en la conducta, ilustrando un gradiente de generalizacin del estmulo inhibitorio. Este experimento muestra que el entrenamiento en discriminacin puede producir tanto condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-. El hecho de que los gradientes de excitacin e inhibicin puedan ocurrir alrededor del E+ y del Eproporcionan un fuerte apoyo a la teora de Spence del aprendizaje de discriminacin. Se obtienen diferentes resultados si los estmulos E+ y E- difieren cuantitativamente en una carateristica en lugar de cualitativamente ( incluyendo muchas caractersticas.)

Interacciones entre el E+ y el E-: desplazamiento del mximo


Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-. Esta suposicion es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la respuesta al E- y viceveresa. Estas interacciones son particularmente probables si el E+ y el E- se relacionan de alguna manera. Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantes excepto por un rasgo o atributo. Un procedimiento de entrenamiento en que slo difieren por el valor de una caracteristca del estmulo se llama discriminacin intradimensional Las discriminaciones intradimensionales son de particular inters debido a que estn relacionadas con el problema de la ejecucin experta, esta implica normalmente realizar distincines sutiles. Distinguir los estmulos que difieren en un nica caractiristica es mas difcil que distinguir entre estmulos que difieren en muchos aspectos. La discriminacin intradimensional requiere la deteccin de un nico rasgo diferenciador entre el E+ y el Ey, en consecuencia, es una forma de ejecucin experta. Una caracterstica importante de la discriminacin intradimesional es que a veces dan como resultado una interesante interaccion entre las respuestas al E+ y al E-, en un experimento clsico Hanson (1959) examinaba el grado en que varios colores controlaban la condcuta de picoteo en paloma. Todos los sujetos fueron reforzados con un luz de 550nn, el E+ era el mismo para todos los grupos, diferan en lo similar que era el E- al E+. un grupo recibi un E- de 590nn , para otro grupo el E- era de 555nm, y u n grupo de control que no recibi entrenamiento en discriminacin pero que tambien fue reforzado por picotear en presencia del estmulo de 550 nm. El grupo de control mostro un gradiente de generalizacin del estmulo excitatorio normal centrado
134

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

alrededor del E+, el grupo en que el E- fue de 590nm mostro un desplazamiento del mximo del gradiente de generalizacin desde el E+ llamativo porque la respuesta nunca se reforzo en 540 o 530 donde se obtuvieron las tasas mas altas de respuesta, estos estmulos nunca haban sido presentados durante el entrenamiento original. El desplazamiento del mximo del gradiente de generalizacin alejado del E+ original se denomina efecto del desplazamiento del mximo, este puede ocurrir en cualquier discriminacin intradimensional. Explicacin de Spence del desplazamiento del mximo. El efecto de desplazamiento de mximo es importante porque muestra que el nico estmulo en cuya presencia se refuerza la respuesta (E+) no es necesariamente es estmulo que evoca la tasa de respuesta ms alta. Spence sugiri que los gradientes excitatorio e inhibitorio pueden producir el fenmeno de desplazamiento del mximo, asumi que el entrenamiento en discriminacin intradimensional produce gradientes de generalizacin excitatorios e inhibitorios centrados en el E+ y el E-, sin embargo, debido a que el E+ y el E- son semejantes en las tareas de discriminacin intradimensional, los gradientes de generalizacin de la inhibicin y excitacin se superpondrn. Es mas, el grado de suprposicion depender del grado de semejanza entre el E+ y el E-. La inhibicin generalizada del E- suprimir la respuesta al E+, dando como resultado un efecto de desplazamiento del mximo. Explicaciones alternativas del desplazamiento del mximo: Una cuestin importante es si vemos los estmulos en funcin de sus propiedades individuales y absolutas, o en funcin de su relacin con otros estmulos que experimentamos, existe evidencia consistente con cada una de estas aproximaciones, que sugiere que ambos tipos de mecanismos estn implicados en la forma de responder de los organismos. El modelo de Spence es un modelo de aprendizaje absoluto del estmulo. Predice la conducta basada en las propiedades excitatorias netas de los estmulos individuales. Una aproximacion alternativa asume que los organismos aprenden a responder a un estmulo basndose en la relacion de ese estmulo con otras claves de la situacin. Una prediccin interesante de esta aproximacin es que la forma de un gradientes de generalizacin cambiara en funcin del rango de los estmulos de prueba que se presenten durante la sesin de generalizacin. Estas y oras predicciones de la teora relacional han sido confirmadas.

Entrenamiento de equivalencia de estmulos

135

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

De la misma forma que el entrenamiento en discriminacin potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estmulos. Se dispone de varias aproximaciones para promover la generalizacion en lugar de la discrimizacion, 1 (Herrnstein, Loveland y Cable 1976, la estrategia bsica de entrenamiento es reforzar la misma respuesta en presencia de varias imgenes que contiene agua, una vez que aprenden la discriminacion agua/no agua, su conducta se generalizo a nuevas fotografa. Los investigadores tambin han explorado la posibilidad de que la equivalencia funcional entre dos estmulos diferentes podra establecerse enlazando cada una de las distintas claves con un tercer estmulo comn Ej. Honey y Hall (1989) un grupo ruido y click con comida, grupo control ruido y click, solo el click con comida despus ambos recibe ruido con descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo condicionado se generalizaria al clik, se dio significativamente mas generalizacin en los animales entrenados en equivalencia que en el grupo de control. El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estmulos, con la consecuencia de que una respuesta condicionada a uno de ellos se generalizara a los oros. Una definicin mas formal de clase de equivalencia ha sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si sus miembros poseen propiedades matematicas 1 reflexividad o igualdad, 2 simetria y 3 transitividad. La reflexividad o igualdad se refiere a la relacin A=A: la simetra existe si una relacin es bidireccional, la transitividad se refiere a la integracin de dos relaciones en una tercera.

CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES

(pgina 242 del libro)

Un estmulo se dice que es discreto si se presenta durante un breve periodo y tiene un comienzo y un final claros. Las claves contextuales pueden ser visuales, auditivas o claves olfatoria de la habitacin o lugar donde se presentan los estmulos discriminativos discretos. La investigacin reciente indica que las claves contextuales pueden proporcionar una importante fuente adicional de control de la conducta aprendida. Control por claves contextuales Las claves contextuales pueden llegar a controlar la conducta instrumental. Es ms fcil concentrarse en una biblioteca del colegio que en casa durante las vacaciones, debido al control contextual de la conducta de estudio por los estmulos experimentados en la bibioteca. Charlar en un partido de futbol, pero no durante misa es otro ejemplo del poder de las claves contextuales. El control contextual por el estmulo puede ocurrir sin que un contexto est ms fuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejor seal par el reforzamiento que otro, las asociaciones involucran un tipo diferente de
136

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

mecanismos. Una posibiliad es que cada contexto activa una memoria diferente. Que le Contexto 1 active la memoria de reforzamiento con 90 y la de ausencia de reforzamiento con 0. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0 y la de ausencia de reforzamiento con 90. En lugar de estar asociado con un estmulo particular, cada contexto podra estar asociado con una contingencia diferente E+/E-. Estas asociaciones se denominan relaciones condicionales.

Control por las relaciones condicionales


En captulos anteriores se han destacado las relaciones que involucran slo dos eventos, un Ec y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman relaciones bianarias. En ciertas circunstancias, la naturaleza de un relacin binaria esta determinada por un tercer suceso, llamado modulador. La relacin de un modulador con la relacin binaria que seala se denomina una relacin condicional. Numerosos experimentos han indicado que los animales pueden aprender a utilizar moduladores para decir cuando esta en funcionamiento una relacin binaria particular. Un procedimiento en el que un organismo es reforzado por responder en presencia del E+ pero no es reforzado en presencia del E-, los estmulos discriminativos E+ y Eson moduladores que sealan la relacin entre la respuesta y el reforzador. Existe una relacin respuesta-reforzador durante el E+ y una relacin diferente durante el E-, por tanto los procedimientos de discriminacin instrumental incluyen el control condicional de la relacin entre la respuesta y el reforzador. Control condicional en el condicionamiento pavloviano. El concepto fundamental del control condicional es que un evento seala la relacin entre otros dos eventos. Un modulador es un tercer elemento que indica cundo la presentacin del EC o el reforzador aparecer. En los procedimientos de discriminacin instrumental, los moduladores (E+ yE-) se denominan "estmulos discriminitativos". En el condicionamiento pavloviano han denominado al control condicional de la respuesta facilitacin debido a que el modulador facilita la respuesta del EC. Mas comn, el control condicional en el condicionamiento clsico se llama establecimiento de la ocasin porque el modulador establece la ocasin para los emparejamientos del EC con el EI. En esta terminologa, el modulador se llama establecedor de la ocasin.

137

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Distincin entre la excitacin y la modulacin. El establecimiento de la ocasin es un aspecto importante del condicionamiento clsico porque parece involucrar mecanismos de aprendizaje diferentes . Los emparejamientos de un EC con un EI dan como resultado una asociacin entre los dos sucesos tal que la presentacin del EC llega a activar una representacin del EI. Este tipo de aprendizaje se ha considerado que refleja el condicionameinto de la excitacin al EC. Las propiedades modulatorias de los estmulos son diferentes de la excitacin condicionada. En varios estudios, los intentos de obtener evidencia de las propiedades excitatorias condicionadas de los moduladores han fracasado, estos experimentos indican que un estmulo puede establecer la ocasin para la respuesta condicionada elicitada por otra clave sin elicitar por si mismo una respuesta condicionada visible. Otros estudios han mostrado que condicionar las propiedades excitatorias simples a un estmulo no hace que este funcione como un modulador. La evidencia adicional para mantener la distincin entre modulacin y excitacin condicionada se basa en los efectos de los procedimientos de extincin. La extincin es un procedimiento en el cual un estmulo previamente condicionado se presenta repetidamente pero se omite el EI. Un estmulo condicinado excitatorio seala la prxima presentacion del EI. La ausencia del EI despus de la presentacin del EC durante la extincin es una violacin de esa expectativa. Por tanto, el valor como seal del EC tiene que reajustarse en la extincin para estar en consonancia con la nueva realidad. Un reajuste como este no se requiere en un procedimiento de extincin de un establecedor de la ocasin Un establecedor de la ocasin seala una relacin entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasin por si solo durante la extincin no significa que la relacin entre el EC y el EI haya cambiado. La informacin sealada por un establecedor de la ocasin no se prueba que sea incorrecta mediante la presentacion del modulador por si mismo durante la extincin. En consecuencia, la habilidad del modulador para promover la respuesta elicitada se reduce si se altera la relacin EC-EI sealada por el modulador. Otra evidencia que apoya la conclusion de que el establecedor de la ocasin es distinto de la excitacin convencional se ha obtenido en las pruebas de transferencia, estas fueron llevadas a cabo para determinar si un estmulo que haba sido condicionado para establecer la ocasin de responder a un EC critico particular tambin incrementara la respuesta a orto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de un modulador a un nuevo EC critico, los efectos de transferencia son mas probables si los nuevos estmulos crticos han servido previamente como estmulos crticos de otros estmulos moduladores. Las limitaciones en la transferencia proporcionan evidencia adicional de que los moduladores tienen sus efectos mediante algn mecanismo distinto de la excitacin convencional.

138

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Modulacin frente a condicionamiento configuracional: Los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares, Los investigadores han presentado los elementos uno tras otro mas que simultneamente, en lo que se llama compuesto serial. En los ensayos reforzados, el establecedor de la ocasin es presentado normalmente primero, seguido por el EC crtico y el reforzamiento. Holland y colaboradores han encontrado que los organismos responden a las discriminaciones condicionales que incluyen compuestos seriales en trminos de relaciones condicionales. En contraste, la utilizacin de compuestos simultneos en la discriminacin condicional a menudo no produce efectos modulatorios.

COMENTARIOS FINALES

(pgina 249 del libro)

El control por el estmulo se refiere al grado de precisin del ajuste de la conducta de un organismo a las caractersticas especficas del ambiente. Por tanto, los temas relacionados con el control de la conducta por el estmulo son importantes para entender cmo un organismo interacta con su ambiente. El control por el estmulo se mide en trminos de apuntamiento de los gradientes de generalizacin. Un gradiente de generalizacin acusado indica que pequeas variaciones en un estmulo producen grandes diferencias en la respuesta. Un control por el estmulo ms dbil se manifiesta en gradientes de generalizacin ms planos. El grado de control por el estmulo est determinado por numerosos factores, incluyendo la capacidad y orientacin sensorial del organismo, la prominencia relativa de otras claves en las situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para el reforzamiento. El control por el estmulo est tambin en funcin del aprendizaje. El entrenamiento en discriminacin aumenta el control de la conducta por el estmulo tanto si incluye estmulos que difieren en varios aspectos como en uno solo. El entrenamiento en discriminacin con estmulos que difieren slo en una dimensin produce un control por el estmulo ms preciso y puede llevar al resultado contraintuitivo de que el nivel mximo de respuesta se desplace del estmulo reforzado. Lo opuesto del entrenamiento en discriminacin es el entrenamiento en equivalencia, el cual aumenta la generalizacin de la conducta. No slo los estmulos discretos sino tambin las claves contextuales de fondo pueden llegar a controlar la conducta. El control del estmulo por claves contextuales pueden desarrollarse aun cuando no se requiera atencin a las claves contextuales para optimizar el reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EI o servir prara modular la relacin entre un EC discreto y un EI.

139

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

TRMINOS CLAVE
Aproximacin de la clave configuracional Aproximacin al anlisis del control por estmulos compuestos que asume que los organismos responden a un estmulo compuesto como un todo integral ms que a una coleccin de elementos estimulares separados e independiente. (Comparse con la aproximacin elemental del estmulo) Aproximacin elemental del estmulo Aproximacin al anlisis del control por los estmulos compuestos que asume que los participantes responden a un estmulo compuesto en trminos de los elementos del estmulo que forman el compuesto. (Comparse con aproximacn de la clave configuracional.) Desplazamiento del mximo Desplazamiento de la tasa ms alta de respuesta en un gradiente de generalizacin del estmulo desde el E+ en direccin opuesta al E- despus del entrenamiento en discriminacin intradimensional. Discriminacin del estmulo Respuesta diferencial en presencia de dos o ms estmulos. Discriminacin intradimensional Discriminacin entre estmulos que difieren slo en cuanto al valor de una caracterstica del estmulo, como el color, el brillo o el tono. Equivalencia de estmulos Responder a estmulos fsicamente distintos como si fuesen iguales debido a experiencias comunes previas con los estmulos. Ensombrecimiento Interferencia en el condicionamiento de un estmulo debido a la presencia simultnea de otro estmuo que es ms fcil de condicionar. Establecimiento de la ocasin facilitacin. Lo mismo que Facilitacin Procedimiento en el que una clave designa cundo otra clave ser reforzada. Tambin llamado establecimiento de la ocasin. Generalizacin del estmulo Ocurrencia de una conducta aprendida a travs de habituacin o condicionamiento en presencia de estmulos que son diferentes de los estmuos utilizados durante el entrenamiento. Gradiente de generalizacin del estmulo Gradiente de respuesta que se observa si los participantes se prueban con estmulos que difieren cada vez ms del estmulo que estaba presente durante el entrenamiento. (Vease tambin gradiente de generalizacin del estmulo

excitatorio y gradiente de generalizacin del estmulo inhibitorio.)

Gradiente de generalizacin del estmulo excitatorio Gradiente de respuesta que se observa cuando se prueba a los organismos con el E+ de un procedimiento de discriminacin y con estmulos que difieren cada vez ms del E+. El nivel ms alto de respuesta sucede con los estmulos similares al E+; se da progresivamente menos respuestas a los estmulos que difieren cada vez ms del E+. Por tanto, el gradiente tiene forma de U invertida. Gradiente de generalizacin del estmulo inhibitorio Gradiente de respuesta que se observa cuando se prueba a loa organismos con el E- de un procedimiento de discriminacin y con estmulos que difieren cada vez ms del E-. El nivel ms bajo de respuesta sucede con los estmulos similares al E-; se da progresivamente ms respuestas a los estmulos que difieren cada vez ms del E-. Por tanto, el gradiente tiene forma de U. Modulador Estimulo que seala la relacin entre otros dos sucesos. La naturaleza de una relacin binaria est determinada por el modulador.

Estmulo discriminativo Estmulo que controla la ejecucin de la conducta instrumental porque seala la disponibilidad (o no disponibilidad) de reforzamiento.

140

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Captulo 8:El control de la conducta por el estmulo


Juan Carlos Cabrera

Procedimiento de discriminacin del estmulo (en condicionamiento clsico) Procedimiento de condicionamiento clsico en el cual un estmulo (el EC+) es emparejado con el estmulo incondicionado en algunos ensayos y otros estmulos (el EC-) se presenta sin el estmulo incondicionado en otros ensayos. Como resultado de este procedimiento, el EC+ llega a elicitar una respuesta condicionada, y el EC- llega a inhibir esta respuestas. (Tambin denominado inhibicin diferencial.) Procedimiento de discriminacin del estmulo (en condicionamiento instrumental) Procedimiento en el cual el reforzamento por responder est disponible siempre y cuando se presente un estmulo (el E+, o ED) y no est disponible siempre y cuando se presente otro estmulo (el E- o E). Programa mltiple de reforzamiento Procedimiento en el cual funcionan diferentes programas de reforzamiento en presencia de diferentes estmulos presentados en sucesin. Generalmente, cada estmulo llega a evocar un patrn de respuesta que se corresponde con el programa de reforzamiento. Relacin condicional Relacin en la que la significacin de un estmulo o suceso depende del estatus del otro estmulo.

141

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

Efectos de los procedimientos de extincin Extincin y aprendizaje originales


Recuperacin espontnea Renovacin del condicionaiento excitatorio original Restauracin de la ejecucin de la extincin. Restablecimiento de la excitacin condicionada. Sensibilidad a a devaluacin del reforzador.

Qu se pretende en la extincin?
Asociacin E-R inhibitorias Efectos paradjicos Mecanismos del reforzamiento parcial de la extincin

Resistencia a la extincin y momento conductual Comentarios finales

143

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

La extincin puede llevarse a cabo slo despus de que haya sido establecida una respuesta o una asociacin utilizando condicionamiento pavloviano o instrumental. El objetivo es revertir los efectos de la adquisicin, pero raramente se alcanza y en la mayora resultan imposible. Fenmenos como la recuperacin espontnea, la renovacin y el restablecimiento muestran que la extincin no elimina lo que se aprendi de forma original. Los estudios sobre devaluacin del reforzador sugieren que la extincin no tiene virtualmente ningn impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo aprendizaje de una asociacin E-R inhibitoria que se superpone a lo que se aprendi con anterioridad. La inhibicin surge de los efectos de la frustacin y esta falta inesperada de recompensa es responsable de una serie de efectos paradjicos de la recompensa, incluyendo el efecto del reforzamiento parcial en la extincin. El reforzamiento parcial o intermitente permite a los organismos aprender sobre la falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la extincin, como demuestra los estudios acerca del momento conductual. La extincin implica la omisin del EI o reforzador. Por tanto, la extincin en condicionamiento clsico incluye presentaciones repetidas del estimulo condicionado por solo; la extincin en el condicionamiento instrumental implica no volver a presentar reforzador como una consecuencia de la respuesta instrumental. El resultado es que respuesta condicionada disminuye. La extincin no es lo contrario de la adquisicin. el s el la

La extincin se produce por la omisin del EI que sigue a las presentaciones del EC o la omisin del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario, es una disminucin de la respuesta condicionada que se da por la ausencia prolongada de experiencia con el estimulo condicionado o con la respuesta instrumental. La extincin no siempre funciona en la terapia de conducta, los avances sugieren que los fallos en la extincin reflejan las limitaciones normales de la misma. La extincin no revierte los efectos de la adquisicin, en lugar de ello, implica el aprendizaje de algo nuevo que se superpone sobre lo que se aprendi antes (sin la perdida de lo que se aprendi anteriormente).

145

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCION.(pgina 253 del libro)


La extincin disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta. Si un organismo est acostumbrado a recibir reforzamiento por una respuesta particular, puede trastornarse cuando no vuelve a entregar los reforzadores. Las reaccin emocional inducida por la falta de un reforzador esperado se denomina frustacin. La ausencia frustrante de recompensa proporciona energa a la conducta que en ocasiones puede ser lo suficietemente severa como para implicar reacciones agresivas.

EXTINCION Y APRENDIZAJE ORIGINAL

(pgina 255 del libro)

Aunque la extincin produce importantes efectos conductuales y emocionales, no revierte los efectos de la adquisicin. La evidencia de que la extincin no elimina lo que se aprendi originalmente se ha obtenido a travs de estudios sobre la renovacin espontanea, la renovacin, el restablecimiento y los efectos de la devaluacin del reforzador.

Recuperacin espontanea
La recuperacin espontanea tras el condicionamiento pavloviano: La extincin se disipa con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse si el sujeto se pone a prueba tras una demora que siga al procedimiento de extincin.

Recuperacin espontanea tras el condicionamiento instrumental: La recuperacin espontnea es un fenmeno notable en la extincin tras el condicionamiento instrumental. La introduccin de un periodo de descanso tras la extincin produce una recuperacin sustancial en la respuesta.

Renovacin del condicionamiento excitatorio original


La renovacin se refiere a la recuperacin de la ejecucin propia de la adquisicin que se da cuando se cambian las claves contextuales que estaban presentes durante la extincin. El cambio puede consistir en una vuelta al contexto de la adquisicin original o a un cambio a un contexto neutral. El efecto de la renovacin no slo se ha observaldo en el condicionamiento pavloviano del miedo, sino tambin en el condicionamiento apetitivo del miedo, la inhibicin condicionada y
146

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

en varias situaciones de condicionamiento instrumental. El fenmeno se evidencia no slo con claves externas contextuales sino con claves contextuales creadas por estados provocados por drogas. Tambin puede darse si el sujeto se retira del contexto de adquisicin a uno alternativo que no es el de la adquisicin original. Este tipo de renovacin no es tan slido como cuando se reinstaura en el contexto original de adquisicin. La mayor parte de la evidencia indica que el efecto de renovacin se produce porque la memoria de la extincin es especfica de las claves que estaban presentes durante la fase de extincin. En consecuencia, un cambio en el contexto de la extincin dificulta la recuperacin de la memoria de extincin, con el resultado de que se pierde la ejecucin propia de la extincin. Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la ambigedad del significado de un estimulo condicionado. Un EC que adquiere condicionamiento excitatorio y luego se extingue tambin tiene un significado ambiguo, en el sentido de que podra indicar la cercana del EI (adquisicin) o su ausencia (extincin). Esta ambigedad permite al EC ponerse bajo el control contextual de manera ms fcil. Tras el entrenamiento de adquisicin por s solo, el EC no es ambiguo porque solo significa una cosa (la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control contextual. Los investigadores han explorado la forma de reducir el efecto de renovacin. Un procedimiento que se muestra prometedor es llevar a cabo la extincin en distintos contextos. Otras tcnicas para reducir el efecto de renovacin implican entrenamiento en inhibicin condicionada, condicionamiento diferencial, y la presentacin del EC explcitamente emparejado con el EI.

Restauracin de la ejecucin propia de la extincin


El efecto de renovacin representa reactivar una conducta aprendida previamente mediante el cambio del contexto a condiciones ms aproximadas a las presentes cuando la conducta se adquiri con anterioridad. Esta estrategia puede aplicarse a la extincin, es decir, la ejecucin propia de la extincin puede restaurarse introduciendo claves contextuales que reactiven la memoria de extincin. La recuperacin espontanea implica la recuperacin de la conducta condicionada originalmente que sigue a la extincin si transcurre un periodo suficiente de tiempo tras la fase de extincin. La conducta propia de la extincin puede restaurarse (contrarrestando la recuperacin espontaneas) presentando las claves que estaban presentes durante la fase de

147

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

extincin. La recuperacin expontnea se debe a un eterioro de las claves contextuales de la extincin que se da con el paso del tiempo.

Restablecimiento de la excitacin condicionada


El restablecimiento se refiere a la recuperacin de la respuesta excitatoria a un estimulo extinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que se extinguen con xito, pueden recuperarse si el individuo se enfrenta de nuevo con el estmulo incondicionado. Investigaciones durante los ltimos 20 aos sobre el efecto del restablecimiento, han indicado que el condicionamiento contextual es importante, pero no porque permita la suma de la extincin sino por suprimir la ambigedad del significado de un estimulo que tiene una historia mezclada de condicionamiento y extincin. El contexto tiene poco efecto en los estmuos con una historia slo de condicionamiento. Bouton considera el restablecimiento como una forma de renovacin. Las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta el EC por si solo durante la extincin.

Sensibilidad a la devaluacin del reforzador


La persistencia del aprendizaje original a pesar de la extincin puede tambin investigarse analizando los efectos de la devaluacin del reforzador. Rescorla ha utilizado la tcnica de devaluacin del EI para determinar si la asociacin EC-EI establecida a travs de condicionamiento pavloviano persiste a lo largo de la extincin. Los hallazgos han fortalecido la conclusin de que la extincin no elimina las asociaciones R-C y E-C que se aprende durante el condicionamiento instrumental.

148

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

QUE SE APRENDE EN LA EXTINCIN?

(pgina 266 del libro)

Si como hemos visto la extincin no implica desaprendizaje y deja intacta las asociaciones R-C y E-C, por qu disminuye las respuestas en los procedimientos de extincin?

Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han llegado a la conclusin de que la falta de reforzamiento produce una asociacin E-R inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estmulo especfico, produce una asociacin E-R inhibitoria que sirve para suprimir esa respuesta siempre y cuando el E est presente. Esta hiptesis, predice que los efectos de la extincin sern altamente especficos del contexto en el que la respuesta fue extinguida. La omisin de una recompensa esperada genera desilusin o frustracin. Estos efectos emocionales se presume que desempean un papel crtico en la disminucin conductual que se da en la extincin. La ausencia de recompensa esperada desencadena una reaccin frustante aversiva incondicionada que sirve para que se deje de responder durante el curso de la extincin mediante el establecimiento de una asociacin inhibitoria. La afirmacin de que la extincin implica el aprendizaje de una asociacin inhibitoria resulta controvertida frente a las teoras convencionales que consideraban la inhibicin condicionada y la extincin como fenmenos diferentes.

Efectos paradjicos de la recompensa


Efecto de sobreentrenamiento en la extincin. Cuanto ms entrenamiento con reforzamiento se proporciona ms fuerte es la expectativa de recompensa, y ms fuerte la frustracin cuando se introduce la extincin. La disminucin en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento ms extenso produce una extincin ms rpida. Especialmente evidente cuando el entrenamiento incluye reforzamiento continuo.
Ejemplo: Podriamos pensar que un entrenamiento ms extenso creara una respuesta ms fuerte, que sera ms resistente a la extincin, pero sucede lo contrario.

149

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

Efecto de magnitud del reforzamiento en la extincin: se refiere al hecho de que la respuesta disminuye ms rpido durante la extincin que sigue a un reforzamiento con un reforzador mayor. Es ms evidente cuando el entrenamiento incluye reforzamiento continuo.
Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100 al mes; en la otra, 20 al mes. Si se deja de percibir la cantidad, es ms aversiva si nos hemos acostumbramos a 100 que a 20.

Efecto del reforzamiento parcial en la extincin: Es el efecto paradjico ms estudiado. Un factor crtico que determina la magnitud de los efectos tanto conductuales como emocionales de un procedimiento de extincin es el programa de reforzamiento que opera antes de que se introduzca el procedimiento de extincin. Pero la caracterstica dominante del programa que determina los efectos de la extincin es si la respuesta instrumental se reforz cada vez que ocurra (reforzamiento continuo) o slo algunas veces (reforzamiento intermitente o parcial). La extincin es mucho ms lenta y produce menos reacciones de frustracin si estaba en activo un programa de reforzamiento parcial antes de la introduccin del procedimiento de extincin. Este fenmeno se denomina el efecto de reforzamiento parcial en la extincin o ERPE,

Mecanismos del efecto del reforzamiento parcial en la extincin


La explicacin ms evidente del ERPE es que la introduccin de la extincin es ms fcil de detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de reforzamiento es presumiblemente mucho ms fcil de detectar tras el reforzamiento continuo. Esta explicacin del efecto del reforzamiento parcial en la extincin se llama hiptesis de la discriminacin. El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia de reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes. Una explicacin seria la teora de la frustracin, basada en que los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. La otra explicacin, la teora secuencial, est basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa. Teora de la frustracin: Desarrollada por Abram Amsel, la persistencia en la extincin es resultado del aprendizaje de algo paradjico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable experiencia con reforzamiento intermitente.

150

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce el aprendizaje de expectativas tanto de recompensa como de no recompensa. La expectativa de recompensa alienta a los sujetos a responder, y la anticipacin de la ausencia de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a favor de responder. La resolucin del conflicto ocurre debido a que el reforzamiento no es predecible en el tpico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la teora de la frustracin, esta es la clave de la persistencia en responder durante la extincin. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado

el aprendizaje de realizar la respuesta instrumental como reaccin a la expectativa de ausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamiento
continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extincin. Teora secuencial; Capaldi, est formulada en trminos de memoria. Asume que los sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados. Se asume adems que durante el entrenamiento en reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser una clave para la realizacin de la respuesta instrumental, esto produce persistencia en le extincin. Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la extincin. Desde que la dos teoras fueron propuestas se ha obtenido gran evidencia en apoyo de cada teora. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede influir sobre la respuesta durante la extincin. Los mecanismos de memoria pueden contribuir en mayor medida cuando los ensayos de entrenamiento no estn separados por largos intervalos entre ensayos. El aprendizaje emocional descrito por la teora de la frustracin es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una mejor explicacin del ERPE cuando se utilizan ensayos ampliamente espaciados.
151

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL


(pgina 273 del libro)

Otra forma de considerar la persistencia de la respuesta en la extincin es que representa la resistencia al cambio en las contingencias de reforzamiento que sucede cuando se introduce la extincin. Nevin y colaboradores han estudiado la resistencia al cambio de forma ms general y han propuesto el concepto de momentos conductual para caracterizar la susceptibilidad de la conducta a las interrupciones. Est basada en el concepto de momento de la fsica newtoniana. Predice que la conducta que posee un momento elevado tambin ser difcil de parar o interrumpir por las manipulaciones. Ver ej. Pag 274 libro. Un experimento en el que particip HCB, una chica de 17 aos y una edad mental de 3. Los resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de momento conductual. La primera es que el momento conductual est directamente relacionado con la tasa de reforzamiento. Una tasa ms alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupcin; otro hallazgo es que el momento conductual no est relacionado con la tasa de respuesta. Dos conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de respuesta como el determinante fundamental del momento conductual. Esta conclusin est confirmada por otros estudios que demuestran que los programas que proporcionan tasas similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o resistencias al cambio. La primaca de la tasa de reforzamiento sobre la tasa de respuesta como determinante del momento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductual principalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exacta en que estas asociaciones promueven el momento conductual no se han averiguado todava. El reto principal a la proposicin bsica de que el momento conductual est directamente relacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que la resistencia a la extincin es mayor despus de una baja tasa o probabilidad de reforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que la extincin es menos discriminable tras el reforzamiento intermitente que tras el continuo

152

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

Comentarios finales

(pgina 276 del libro)

Los estudios sobre extincin ilustran la naturaleza duradera de ciertos temas en la teora de la conducta. Los primeros estudios sobre la extincin se centraron en los efectos del reforzamiento parcial enla extincin y otros efectos paradjicos de la recompensa, y se llevaron a cabo dentro de la tradicin hulliana que daba preeminencia al aprendizaje E-R. Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de la revolucin cognitiva que se introdujo en la psicologa en el ltimo cuarto de siglo XX. sta proporcion una mejor compresin de la recuperacin espontnea y llev al descubrimiento de nuevos fenmenos como la renovacin y el restablecimiento. Sin embargo, estos fenmenos representas los fallos de la extincin ms que la exticnin en s misma. Como se ha descrito, la compresin de la extincin en s misma ha requerido la vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los investigadores sigun interesados en qu es lo que hace que conducta sea resistente al cambio. Esta resistencia o momento conductual plantea especiales desafos para la terapia de conducta.

153

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA


Captulo 9: Extincin de la conducta condicionada
Juan Carlos Cabrera 2009-2010

Terminos Clave

(pgina 277 del libro)

Efecto de la magnitud del reforzamiento en la extincin Persistencia menor de la conducta instrumental en la extincin que sigue al entrenamiento con un reforzador de gran magnitud que en la que sigue al entrenamiento con un reforzador pequeo o moderado. Efecto de reforzamiento parcial en la extincin Trmino utilizado para describir una persistencia mayor de la respuesta instrumental en la extincin posterior a un entrenamiento de reforzamiento parcial (intermitente) que en la extincin posterior a un entrenamiento de reforzamiento continuo. Abreviado ERPE. Efecto de sobreentrenamieno en la exticin Persistencia menor de la conducta instrumental en la que la extincin que sigue a un entrenamiento extenso con reforzamiento (sobrentrenamiento) que en la que sigue a un entrenamiento con niveles de reforzamiento moderados. Extincin (en el condicionamiento clsico) Reduccin de la respuesta aprendida que ocurre debido a que el estmulo condicionado no se vulve a emparejar con el estmulo condicionado. Tambin, el procedimiento de presentar repetidamente un estmulo condicionado sin el estmulo incondicionado. Extincin (en el condicionamiento intrumental) Reduccin de la respuesta instrumental que ocurre porque la respuesta no vuelve a ir seguida de un reforzador. Tambin, el procedimiento de no volver a reforzar la respuesta instrumental. Frustracin Respuesta emocional aversiva que es resultado de la ausencia inesperada de reforzamiento. Hiptesis de la discriminacin Explicacin del efecto de reforzamiento parcial en la extincin, de acuerdo con la que la extincin es ms lenta tras el reforzamiento parcial que tras el reforzamiento continuo, porque el principio de la extincin es ms difcil de detectar cuando sigue el reforzamiento parcial.
154

Momento conductual Susceptibilidad de la respuesta a la interrupcin mediante manipulaciones como la alimentacin presin, la disponibilidad libre de comida, o el cambio en el programa de reforzamiento. Olvido Reduccin de la respuesta aprendida que ocurre por el paso del tiempo, no debido a experiencias particulares. Reforzamiento continuo Programa de reforzamiento en el que cada ocurrencia de la respuesta intrumental produce el reforzador. Abreviado RFC. Reforzamiento intermitenta Un programa de reforzamiento en el que slo algunas de las ocurrencias de la respuesta instrumental se refuerzan. La respuesta intrumental se refuerza ocasionalmente, o intermitentemente. Tambin denominado reforzamiento parcial. Restablecimiento Recuperacin de la respuesta excitatoria a un estmulo extinguido producida por la exposiciones al estmulo incondicionado. Renovacin Recuperacin de la respuesta excitatoria a un estmulo extinguido producida por la retirada de las claves contextuales que estaban presentes durante la extincin. Teora de la frustracin Teora del efecto del reforzamiento parcial en la extincin, de acuerdo con la cual la extincin se retarda tras le reforzamiento parcial porque la resuesta instrumental se condiciona a la anticipacin de la ausencia frustante de recompensa. Teora secuencial Teora del efecto de reforzamiento parcial en la extincin, de acuerdo con la que la extincin se retarda tras el reforzamiento parcial porque la respuesta intrumental se condiciona a la memoria de ausencia de rescompensa.

You might also like