Psicología del aprendizaje



Descargar 1.08 Mb.
Página9/14
Fecha de conversión03.12.2017
Tamaño1.08 Mb.
Vistas1442
Descargas2
1   ...   6   7   8   9   10   11   12   13   14

12. Algunas aplicaciones
Las aplicaciones prácticas del sistema de Skinner se centraron en la psicoterapia y en la educación.

a) Psicoterapia.- En vez de ocuparse del pasado del paciente, de sus proceso psíquicos o de sus problemas orgánicos, la psicoterapia skinneriana busca modificar conductas indeseables y promover conductas deseables sobre la base de cambiar las llamadas 'contingencias del refuerzo', o sea, de las relaciones según las cuales el refuerzo depende de una u otra conducta.

Por ejemplo Hart y otros (1964, citado por Hill, 1985) utilizaron el sistema para hacer que un niño no llore. Comenzaron por diferenciar el llanto debido a molestias físicas (conducta respondiente) del llanto debido a la actitud frente a dicho llanto por parte de los adultos (conducta operante). Actuando sobre esta última, instruyeron a las enfermeras a que, cada vez que el niño lloraba, ellas lo desatendieran (cambio en las contingencias del refuerzo), con lo cual el niño aprendió a no llorar (para no ser desatendido).

Se ha criticado esta terapia diciendo que sus resultados duran mientras duren las contingencias del refuerzo, pero por otro lado, no es probable que los partidarios de Skinner sientan esto como una crítica, mientras puedan invocar cambios de conducta rápidos, mesurables y a veces incluso llamativamente amplios.

Rachlin (1985) refiere algunas aplicaciones del modelo de Skinner en terapia humana. Aplicando al ser humano los principios anteriores, se ha tenido éxito. La base de estos tratamientos reside en que, si se quiere modificar una conducta disfuncional, se debe cambiar gradualmente el ambiente hasta conseguir el comportamiento deseado (por el mismo paciente o por la sociedad). A veces la misma institución psiquiátrica refuerza la conducta indeseada, como cuando el hecho de atender y cuidar a los más ‘locos’ o graves hace que los pacientes agraven su enfermedad para ser más cuidados. Por tanto se impone una revisión de los programas de refuerzo.

Otro ejemplo es el modelamiento gradual de una respuesta, o sea ir transformándose de a poco de respuesta indeseada en conducta deseada. Esto fue criticado porque no ataca la base del problema: se sustituye un síntoma por otro menos disfuncional. La cuestión está en, si una vez lograda la conducta deseable, el paciente seguirá teniéndola una vez fuera del hospital (pues cambió el ambiente). Para ello debe seguir siendo reforzada con otros premios.

Otra cuestión son algunos síntomas clínicos de la depresión: muchos supusieron que ellos se deben a una forma de extinción (falta de premio en el medio). Algunos han centrado la terapia de la depresión tratando de inducir al paciente mostrándole que puede controlar refuerzos importantes por medio de sus propias acciones (puede comportarse de tal modo de recibir premios) (Rachlin, 1985).
b) Educación.- Aunque no fue el primero en hacerlo, Skinner sugirió en este campo al aprendizaje programado como método de enseñanza, orientado principalmente hacia el aprendizaje de conductas verbales.

"El estudiante debe progresar gradualmente desde el material familiar hasta el que no lo es, debe tener la oportunidad de aprender las discriminaciones necesarias y debe ser reforzado" (Hill, 1985:94). El problema es que no todos los alumnos del aula tienen el mismo ritmo, razón por la cual Skinner propuso su 'máquina' de enseñar, es decir, un programa que refuerza las respuestas correctas. Por ejemplo, el alumno debe contestar una pregunta y luego cotejar su contestación con la respuesta correcta: si coincide, habrá reforzado su conducta verbal de contestar correctamente, y si no, fijará la respuesta correcta para aumentar su probabilidad de ser reforzado la próxima vez. Las diferencias individuales entre los alumnos aparecen en la velocidad con que cada estudiante prosigue adelante con el programa.

Este procedimiento difiere del ya conocido método de ejercicios en que el hacer preguntas y verificar respuestas es 'todo' el contenido del material de enseñanza, es decir, no hay primero lecciones y luego ejercicios para resolver.

El empleo de computadoras en la enseñanza ha introducido variantes en este programa. Aunque Skinner es partidario de los programas 'lineales', donde todos los alumnos pasan por las mismas etapas y estas son tan graduales que pocas veces se cometen errores, con la difusión de la computadora han aparecido los programas 'ramificados', donde las respuestas del alumno determinan el material que les será presentado a continuación.


Skinner dio mucha importancia a las aplicaciones prácticas de su sistema: consideró al lenguaje como un sistema de respuestas operantes, indicó las diversas formas de refuerzo de la conducta en los sistemas políticos, sociales y económicos (por ejemplo los salarios reforzadores en programas de intervalo fijo), y hasta imaginó una sociedad ideal (que llamó Walden II) donde se utilizaría sus principios del aprendizaje para construir una sociedad mejor.

Skinner exponer de qué manera es posible aplicar sus principios a los cambios sociales en los dos primeros capítulos de su texto “Sociedad y conducta”.

Comienza diciendo que hay dos maneras de gobernar: castigando a la gente cuando se porta mal (gobiernos aversivos, empleo de reforzamientos negativos), y recompensando a los que se portan bien, es decir, utilizando un reforzamiento positivo.

Si bien el castigo tiene efectos rápidos, tiene sus desventajas, lo cual no ayuda al establecimiento de una democracia real, que por otro lado son pocas. Algunas democracias tienen apariencia de reales, como el caso de aquellas donde hay seguridad social, pero esto es un gobierno aversivo porque se basa en la amenaza de castigo no si no se pagan los impuestos, hay coerción para trabajar, etc. Hay una distribución de bienes, pero esto sirve mas bien para reducir el contracontrol (control que ejerce el pueblo para controlar a los gobernantes).

El reforzamiento positivo es fortificante y carece de los efectos agresivos y represivos del castigo, así como de los efectos del reforzamiento negativo de la ansiedad y el temor. Cuando nuestra conducta está reforzada positivamente disfrutamos de lo que hacemos, y esta debiera ser la meta de los gobiernos.

El reforzamiento negativo sirvió antaño por una razón de supervivencia física ya que esta implicaba luchar, sufrir. Pero ahora estos reforzamientos negativos ya no tienen sentido: la sociedad ha resuelto estos problemas de supervivencia con las comodidades, el bienestar, etc., aunque también esto es una desventaja. El reforzamiento positivo tiene su desventaja en el sentido que ha hecho acentuar las diferencias sociales: no sólo llevó a una gran riqueza sino también a una gran pobreza. Lo ideal sería un balance entre riqueza y pobreza donde todas las personas estuviesen más o menos niveladas. Este equilibrio podría lograrse con reforzamiento negativo (por ejemplo aplicando impuestos a los que más tengan), pero el ideal es utilizar el reforzamiento positivo, que tiende a crear un estado donde la gente obre por gusto y no por obligación. Es algo más cercano a una democracia (entendida como gobierno del pueblo).

Lo ideal sería también que el poder estuviese distribuido homogéneamente, pero ello casi nunca se cumple: siempre hay alguien que ejerce más poder y controla a los demás, por más que el contracontrol funcione bien. El riesgo es el autoritarismo, el abuso de poder, la dictadura.

La conductas se desarrollan en un medio ambiente social, el cual puede ser dividido en tres partes: político (ejerce el control aversivo), económico (produce e intercambia bienes reforzantes), y cultural (incluye otras contingencias de reforzamiento como prácticas familiares, religiosas, etc). Reforzamientos contingentes son aquellos no mantenidos por el poder centralizado, y pueden o no existir.

Cuando el poder está en manos del medio político o económico se centraliza, deja de ser un poder ‘frente a frente’, de la gente por la gente, y pasa a ser el de un líder o usurpador que controla al resto. Una mejor estrategia sería fortalecer el control ‘frente a frente’, lo que posibilitaría modificar conductas mediante un reforzamiento positivo, que es lo ideal. Los medios coercitivos, tan frecuentes, no son recomendables para modificar conductas. La sustitución del control aversivo por el reforzamiento positivo alienta la libertad humana.

Podemos enunciar algunos principios para gobernar democráticamente basándonos en la teoría del reforzamiento positivo:

Alentar el control frente a frente con refuerzos positivos (evitando el monopolio del poder controlador en manos de una persona o de unas pocas).

Evitar reforzadores artificiales. El reforzador artificial típico es el dinero, y por tanto, la recompensa no debe ser dinero (por ejemplo un salario) sino algo más natural, menos alienado diría Marx, a saber, el producto mismo que se fabrica. El dinero sólo sirve como medio, no como fin en sí mísmo, y la educación debe concluir en la recompensa del propio trabajo y la propia obra, no en el dinero.

Educar correctamente la conducta no significa seguir reglas fijas y estereotipadas (del tipo ‘hay que portarse así siempre’) sino adaptar las conductas a las contingencias del medio social; de esta última manera vamos adaptando nuestra conducta según las recompensas (o censuras) que resultan de nuestro obrar.

Deben evitarse los llamados reforzadores no contingentes, o sea los que aparecen por azar (un golpe de suerte, un clima benigno, etc) pues evitan el desarrollo pleno de las capacidades de las personas, amenazan la cultura y la oportunidad de sobrevivir ya que tienden a anular a los reforzadores más naturales.

La cultura debe preparar a la persona que nace y adiestrarla para enfrentarse con los reforzamientos positivos propios de esa cultura, o sea, adiestrarlos para enfrentar y aprender los ‘mecanismos para la vida en común’ (la cultura misma), por oposición a los controles políticos y económicos.

El control no debe servir como fin en sí mísmo sin para mejorar el medio ambiente social. Para que haya un control debe haber controladores, pero éstos deben a su vez ser controlados por la misma cultura donde ellos ejercen el control, o sea, en las personas, productoras de la cultura. El control ideal es entonces aquel en el cual las personas controlan directamente a las personas, y no hay un poder por encima de todos que controla a los demás.


Muchas de las conclusiones obtenidas en experimentos con animales pueden extenderse también a los humanos, pues en todo proceso de aprendizaje ejerce muchísima influencia el medio ambiente.

El problema central de la conducta humana es cómo educar la conducta del hombre para que tome en cuenta su futuro, ya que a diario puede verse que las personas no cuidan su futuro: gastan mucha energía, contaminan el ambiente, agotan alegremente los recursos naturales, etc.

Skinner responde que puede influirse sobre las personas para que cambien su conducta de forma tal de cuidar el futuro de la especie (ahorrando recursos, etc). Lo importante es modificar la conducta y no tanto hacer tomar conciencia o hacer pensar en el futuro y en las consecuencias (de hecho según los mentalistas es esto lo que distingue al hombre de los animales: la posibilidad de prever el futuro, de pensar en las consecuencias de sus actos), pues con la toma de conciencia no basta: muchos pueden saber qué ocurrirá pero no hacen nada para impedirlo.

Y si el medio ambiente es muy importante para la conducta, lo que debe cambiarse son las circunstancias en las que viven las personas para que ellas se comporten de forma diferente.

Algunos procesos biológicos como las mutaciones tienen un ‘efecto sobre el futuro’, pues tienen como finalidad lograr una mejor adaptación al ambiente, o sea un futuro mejor, más aptitud para sobrevivir. Los experimentos sobre condicionamiento operante mostraron algo similar: la conducta misma está influenciada por sus consecuencias futuras, o sea, si a cierta conducta le sigue luego un reforzador, el organismo tenderá a repetir de nuevo esa conducta. El sujeto toma en cuenta un futuro que se asemeja al pasado: toma en cuenta un futuro pues el reforzador viene después de la conducta, y se asemeja al pasado porque se tiende a repetir la conducta anterior que fue reforzada.

Entre la conducta y su reforzador (por ejemplo trabajar y luego recibir un premio) no hay necesaria ni fundamentalmente una relación causal, en el sentido que el reforzador sea una consecuencia natural de la conducta (como pensaban los hedonistas o la ley del ejercicio de Thorndike). Al analizar la conducta operante vemos que el reforzador no es consecuencia, sino que simplemente sigue a la conducta temporalmente: simplemente está después de la conducta. Por ejemplo la conducta supersticiosa: ‘hago tal cosa porque tendré luego suerte’, cuando en rigor la relación entre lo que hago y la suerte no es real. Pero, mientras más inmediata sea la consecuencia, es más probable que haya sido efectivamente producida por la conducta a la que sigue. Así, el reforzador debe ser rápido, debe aparecer inmediatamente después de la conducta para que sea eficaz.

Skinner distingue el condicionamiento respondiente del condicionamiento operante. En el primero la conducta o respuesta es producida por un estímulo concreto (salivar en presencia de comida). En el segundo la conducta se produce por variadas influencias del medio ambiente y tienen cierta probabilidad de ocurrir (puede salivar en presencia de comidas dulces de cierta clase, por ejemplo). Esta última conducta, operante, tiene más probabilidad de ocurrir si en el medio ambiente aparece un reforzador. Este reforzador, para ser eficaz, no necesariamente debe ser inmediato a la conducta; por ejemplo en el reforzamiento intermitente (administrar un reforzador cada 5000 conductas), el organismo actúa en función de un reforzador lejano en el tiempo (‘me faltan 4999 conductas para llegar a él’).

Si bien mucha gente actúa previendo el futuro lejano donde hay un reforzador (‘siembro ahora y el año que viene tendré buena cosecha’), Skinner dice que muchas conductas se adoptan por imitación y no necesariamente para prever una recompensa, y puesto que el medio ambiente es bastante estable, igual para todos, quienes imiten la conducta del vecino es probable que también obtengan la recompensa, aunque sin habérselo propuesto.

Otros reforzadores tienen también en cuenta el futuro: son los reforzadores artificiales creados por el gobierno (castigar o encarcelar como reforzador negativo, condecorar o premiar como reforzador positivo). Quizá el más importante reforzador condicionado sea el dinero, que si bien en sí mísmo no tiene valor (es papel), es útil para intercambiarlo por reforzadores positivos. El dinero da beneficios inmediatos, pero también se buscan beneficios más alejados en el futuro como la paz, la seguridad, la estabilidad, etc., pero estas consecuencias más alejadas no tienen tanto valor como reforzadores, siendo simplemente derivaciones incidentales. No obstante, muchas medidas gubernamentales se toman teniendo en cuenta consecuencias remotas (no usar naftas contaminantes pues en el futuro el sistema ecológico se alterará), pero es difícil reforzar dichas conductas con reforzadores inmediatos. El trabajo trae a la larga prosperidad, pero si falta el reforzador inmediato, el cobro del salario, la gente tenderá a no trabajar pues es más susceptible a las consecuencias inmediatas (‘si ahora tengo bienestar, para qué voy a trabajar?’). Skinner resalta la importancia de las gratificaciones inmediatas siempre y cuando la conducta que se espera producir tenga a la larga también gratificaciones, aunque más remotas, y que tienen que ver con la supervivencia y el bienestar de la humanidad. Dice que no podemos dejar el futuro a los ocasionalmente benéficos efectos laterales de un fuerte interés en el presente.

Skinner da el ejemplo de Frazier, un personaje de “Walden II”, quien no utiliza controles aversivos y sin embargo logra el mismo efecto que los gobernantes pues promueve el desarrollo y mejoramiento del medio social desde su humilde posición, introduciendo reforzadores inmediatos pero con vistas a objetivos más a largo plazo. Como esos reforzadores son positivos, las personas se sienten libres. Cuando actuamos porque hemos sido reforzados positivamente nos sentimos libres y no tratamos de escapar del control o de crear un contracontrol. Pero debe tenerse en cuenta que la libertad no es hacer lo que uno quiere (libertad en realidad aparente): la libertad depende de las razones que uno tenga para comportarse de tal o cual modo: si hago algo para evitar un castigo –refuerzo negativo- entonces no me siento libre.


Skinner estudió fundamentalmente animales, pero pensó que podía extenderse muchas conclusiones al ser humano, cosa que actualmente se está investigando. La aplicación del condicionamiento operante aparece, según Hilgard y Bower (1983) en cuatro áreas:

Tecnología de laboratorio.- Los métodos de condicionamiento operante de la psicología pueden llevarse también a la psicofísica animal (con los condicionamientos operantes se pueden producir curvas de sensibilidad visual de las palomas para ver la adaptación a la oscuridad), a la farmacología (para calibrar drogas), etc.

Instrucción programada.- Para incrementar la eficiencia de la enseñanza de temas escolares, Skinner hizo una máquina o dispositivo de autoinstrucción donde el niño marcaba su respuesta, y si esta era correcta ocurría el reforzamiento, consistente en que la máquina daba paso al siguiente problema.

Conducta verbal.- Los sonidos del habla son emitidos y reforzados por una respuesta por parte de quien escucha (por ejemplo, accede a escuchar). Hay un reforzamiento mutuo entre las dos personas que hablan, y esto es susceptible de analizar a partir del condicionamiento operante.

Psicoterapia.- Si la terapia existe, dice Skinner, es porque las demás gentes controlan excesivamente a las otras, sobre todo con el castigo, y entonces quien es controlado pierde sus facultades o se vuelve peligroso para los demás y él mísmo. El terapeuta es un auditorio que no castiga, con lo cual las respuestas reprimidas vuelven a aflorar, la experiencia olvidada puede recordarse, y puede mostrar emociones intensas. La psicoterapia permite manifestar la conducta antes castigada.
13. Relación de Skinner con otros psicólogos
Junto a Watson, Guthrie y otros, Skinner integra el conjunto de las teorías conductistas, sólo que, a diferencia de los dos primeros, pone el énfasis en el problema del refuerzo. Así, a la hora de analizar una conducta, mientras Guthrie se pregunta qué estímulos evoca, Skinner se interroga acerca de qué refuerzo la sustenta.

Al igual que Watson, fue Skinner un ardiente defensor de la psicología científica, en reacción contra otros sistemas juzgados como vagos y demasiados teóricos. Por otro lado, el sistema de Skinner fue criticado, entre otras cosas, por a) demasiado estrecho en sus intereses (buscó la aplicación práctica de unos pocos principios despreocupándose por una comprensión general de la conducta); y b) por haber estudiado uno solo o muy pocos sujetos y pretender desde allí sacar conclusiones y leyes generales para todos los sujetos. Debe destacarse, sin embargo, el aporte skinneriano en cuanto al control preciso de la conducta en los casos individuales, y en cuanto a su distinción básica entre conducta respondiente y conducta operante.


Finalmente, consignemos la explicación de da Skinner acerca de porqué NO es un psicólogo ‘mentalista’ en el capítulo 8 de su texto “Sociedad y conducta”, en su afán por diferenciarse de otros psicólogos. Para él, la conducta humana es función del medio ambiente. Este influye tanto sobre la especie como sobre cada individuo y sobre cada conducta de ese individuo. No soy psicólogo cognoscitivo porque no asigno tanta importancia a los factores internos, intrapsíquicos en la determinación de la conducta sino mas bien a las influencias ambientales (Skinner es ambientalista).

Se dice que el perro asocia la campana con la comida como si esta asociación fuese algo interno: pero fue Pavlov quien los asoció!... En general, los reforzantes de la conducta se encuentran en el medio ambiente (premios, castigos, etc). O sea, es el experimentador (o el educador, etc) quien provee los reforzadores para que las personas desarrollen tal o cual conducta, y no el sujeto mismo. En el caso del proceso de abstraer, por ejemplo, las personas no aprenden conceptos o ideas como dice el planteo mentalista, sino que, desde el planteo ambientalista, lo que aprende es a comportarse de tal o cual manera respecto de ciertas palabras.

Skinner critica también otro concepto mentalista: el que dice que las personas tienen un ritmo interno del tiempo, pero refuta esto diciendo que la medida del tiempo está en el ambiente: en los relojes que el hombre fabrica.

También Skinner refuta la afirmación según la cual las personas hacen tal o cual cosa simplemente porque ‘tienen ganas’ (que sería un factor intrapsíquico). Skinner sostiene que si lo hace es porque encuentra en el ambiente un reforzador positivo.

La tendencia a pensar en forma mentalista se debe a que casi todas las conductas operantes se producen sin que haya un evidente estímulo ambiental previo, y entonces el mentalista piensa en causas o razones internas, como por ejemplo en ‘intenciones’ del sujeto. No hay tal intención como acto interno, señala Skinner: dicha intención se basa en la existencia de reforzamientos, positivos o negativos. No hay entonces factores internos, sino sólo contingencias ambientales, es decir, reforzadores.

Tampoco tiene sentido decir que la gente almacena información o almacena conductas. Skinner se pregunta: donde está la conducta cuando la persona no se está comportando?

Se aprende, por ejemplo a hablar, no porque se aprendan reglas fijas sino porque el sujeto va amoldándose a las contingencias (ver tercer principio, capítulo 1). Las personas no descubren las reglas por sí mismas como sugieren los psicólogos cognoscitivos, usando alguna facultad misteriosa, sino que aprenden a hablar por interacción con el ambiente, donde ciertas conductas verbales se aprenden y se repiten porque son reforzadas, mientras que otras no.

Debemos considerar el aparato mental de los mentalistas sólo como una metáfora. Podemos observarlo por introspección según los mentalistas o cognoscitivistas, pero, señala Skinner, la introspección no nos permite observar los procesos fisiológicos mediante los cuales la conducta es moldeada y mantenida por contingencias de reforzamiento.



Skinner no es entonces un psicólogo cognoscitivo porque no ve evidencias de un mundo interno de vida mental considerado como factor determinante de conductas, pues éstas dependen de las fuerzas ambientales. Si queremos cambiar nuestras conductas no debemos cambiar nosotros internamente, sino cambiar nuestro medio social.
Skinner considera su teoría como un sistema descriptivo, y al mismo tiempo abiertamente analítico, lo que se ve bien en sus primeras tesis sobre los reflejos. Skinner pensó que el reflejo, como acontecimiento que produce cambios en la conducta, es la unidad adecuada para el análisis de la conducta. Es una unidad funcional, no anatómica o localizada. Luego dudó de la afirmación anterior, e incluso dudó también de considerar como unidad de análisis a los componentes de la operante medida, como la respuesta, el reforzamiento y el estímulo discriminativo que es la ocasión para la respuesta. Finalmente tomó como unidad de conducta ciertos tramos de un encadenamiento de respuestas, tales que sus unidades o eslabones conservan cierta independencia dentro del todo. De hecho, la conducta real se da en secuencias más largas que en la simple opresión de la palanca (Hilgard y Bower, 1983).
14. Estimación del sistema de Skinner
Siguiendo los lineamientos de Hilgard y Bower (1983), se puede estimar la teoría de Skinner en los siguientes aspectos.

Su posición frente a problemas típicos de aprendizaje.- 1) Capacidad: son diferentes en cada persona, animal o edad, pero las leyes del condicionamiento siguen cumpliéndose sea cual fuere la capacidad de cada uno. 2) Práctica: en el condicionamiento de tipo E, la práctica depende del ejercicio (contigüidad E-R), y en el tipo R depende del reforzamiento repetido. 3) Motivación: siguiendo a Thorndike, el premio refuerza la respuesta, pero el castigo no la debilita en la misma proporción. 4) Comprensión: el insight se explica o bien porque el problema presente es similar a otro resuelto anteriormente, o bien porque el problema es simple. 5) Transferencia: lo que otros llaman generalización, Skinner lo llamó inducción, y es la base de la transferencia. Por ejemplo el reforzamiento de una respuesta aumenta la probabilidad de otras respuestas similares (y lo mismo respecto de los estímulos). 6) Olvido: a diferencia de la extinción, en el olvido el condicionamiento desaparece, pues en la extinción puede haber una recuperación espontánea.

El reflejo no es ya una unidad satisfactoria.- La unidad que finalmente elige Skinner es la operante. El reflejo propiamente dicho, base de la conducta respondiente, se limita a las respuestas autónomas y posturales.

Coordinación con otros puntos de vista sistemáticos.- Skinner en general se rehusó a articular su teoría con otras teorías anteriores. En lo tocante a lo puramente psicológico, es anómalo que Skinner no haya querido predecir con exactitud lo que hará una rata y por otro lado haya hecho aseveraciones tan categóricas respecto de las conductas más complejas del hombre.

El argumento de la antiteoría.- Skinner se opone al menos a dos tipos de teorías: a) las que intentan reducir la psicología a una mera fisiología u otra disciplina distinta de la psicología, y b) a las teorías hipotético-deductivas, que teorizan mucho cuando lo único que vale son los hechos y sus correlaciones mediante leyes.

El buen éxito del sistema.- Dos logros se rescatan de Skinner. a) El grado de control en sus experimentos, que permitió encontrar interesantes y originales datos, especialmente en los programas de reforzamiento intermitente. b) En el plano de la conducta práctica, los resultados más notables se obtuvieron en el entrenamiento animal y en la instrucción programada.


CAPÍTULO 7: EL APRENDIZAJE SEGÚN TOLMAN Y HULL
Las teorías de Edward Tolman y Clark Hull representan una transición entre las teorías ambientalistas y las mentalistas al estudiar el aprendizaje considerando sus determinantes externos e internos al mismo tiempo.

Hill (1985:132), por ejemplo, destaca que la concepción de Tolman fue un intento por dar a la teoría cognitiva una relación tan estrecha con los estímulos externos y el aprendizaje como lo había hecho el conexionismo.


1. El aprendizaje según Tolman
Según Tolman no se aprende una conducta sino el camino hacia el objetivo. Lo que aprende el hombre es “qué signos conducen a qué objetivos”, con lo cual, aprender implica percibir el significado de esos signos. Esa percepción origina una conducta intencional (dirigida a un objetivo) que busca un fin con el menor esfuerzo. Así, la secuencia del aprendizaje es signo-conducta-significado: la percepción de un estímulo (signo) es seguido por una conducta y luego se llega a un objetivo (o significado). Se aprende una relación medio-fin, de forma tal que cuando el organismo (animal o humano) asiste a una repetición de la misma situación, responde con una cierta expectativa: “qué conduce a qué” (Gaffuri y Abecasis, 1986).

El organismo formaría “mapas” o estructuras (Gestalt) de las relaciones entre signos y objetivos. Asimismo, para Tolman, los refuerzos (recompensas o castigos) no son esenciales al aprendizaje (aunque pueden ayudar), pues el refuerzo en realidad está en el mismo sujeto y dependen de las relaciones signo-objetivo y de la medida en que se confirman o refuten sus expectativas (Gaffuri y Abecasis, 1986).

Para apoyar esta postura, Tolman hizo tres tipos de experiencias: aprendizaje latente, aprendizaje de lugar y experimentos de refuerzo intermitente (Gaffuri y Abecasis, 1986):

a) El aprendizaje latente mostró que las ratas buscaban igualmente la salida del laberinto que hayan sido privadas de comida o no, lo que muestra la relatividad del refuerzo.

b) Con los experimentos de aprendizaje de lugar, Tolman demostró que lo que se aprende es el lugar, no la conexión E-R. En un laberinto en cruz, puso dos tipos de ratas: el grupo de aprendizaje por E-R, y el grupo de aprendizaje por lugar. Las primeras encontraban el alimento (o debían encontrarlo) doblando hacia la izquierda, sea cual fuere el lugar donde estuvieran, pero las segundas (que encontraron más rápido el lugar) se ponía la comida en lugar fijo (una de las alas de la cruz) y debían encontrarlo doblando a la derecha o a la izquierda indistintamente, según el lugar donde estuvieran como punto de partida.

c) El experimento de refuerzo intermitente mostró, a su vez, que no es la frecuencia del refuerzo lo que origina el aprendizaje o su resistencia a desaparecer, sino el efecto que tiene el refuerzo de confirmar o refutar la expectativa del aprendiz.


Para Hill (1985:145) se puede considerar a Tolman como el teórico más eminente del aprendizaje porque: a) combinó lo mejor de las teorías conexionistas y cognitivas, b) tomó en cuenta un amplio espectro de variables y anticipó el empleo de las variables intervinientes en la teoría psicológica.

Si bien estudió la clase de leyes que necesita la psicología, Tolman no desarrolló estas leyes, no hizo experimentos que demostraran la utilidad predictiva de sus formulaciones cognitivas. No es este no obstante un fracaso de Tolman, toda vez que él consideraba a sus teorías como simples tanteos, búsquedas incesantes e inacabadas para una mejor comprensión de la conducta.

En lo que sigue, se expone más detalladamente el sistema de Tolman, en base a la exposición de Hill (1985:132-145).
Edward Tolman (1886-1959) publica en 1932 un trabajo donde ya está condensado todo el espíritu de su sistema, que se ha denominado conductismo intencionista.

Es un conductismo por tres motivos: a) estudia la conducta, no la experiencia conciente; b) se interesa en el efecto de los estímulos externos sobre la conducta y no simplemente en el espacio vital inferido de la conducta; y c) trata del aprendizaje, o sea de cómo cambia la conducta cuando cambia la experiencia del mundo exterior.

Es intencionista, porque para Tolman casi toda nuestra conducta no es tanto una respuesta a estímulos, sino un esfuerzo hacia el logro de alguna meta. Los estímulos nos guían hacia la meta y van marcando los medios para alcanzarla, pero la búsqueda de una meta es lo que dará unidad y significado a nuestra conducta. El conductismo intencionista estudia la conducta tal como se organiza alrededor de intenciones o propósitos.

Para ello encara la conducta como molar, es decir concebida como conjunto unitario de varios movimientos (ir a trabajar o cocinar una comida) y no como molecular, es decir entendida como movimientos separados de músculos particulares.



Las cogniciones como variables intervinientes.- Como vemos en el esquema 1, para Tolman la respuesta R no es simplemente función de un estímulo externo EExt, sino que también depende de ciertas variables intervinientes, y que básicamente son dos: las cogniciones y las demandas.

Las cogniciones surgen a partir de la experiencia con ciertos estímulos externos, y las demandas resultan de la necesidad de satisfacer ciertas necesidades (por ejemplo el hambre produce una demanda de alimento), y por tanto están en relación con lo que podríamos llamar estímulos internos (EInt). Las cogniciones y las demandas interactúan juntas para producir respuestas R orientadas hacia una meta.



Las cogniciones no son cosas directamente medibles, sino abstracciones teóricas que permiten explicar la conducta más allá de si algún día se descubre o no que se corresponden con cierta actividad particular del cerebro, cosa que a Tolman no le preocupaba.
Esquema 1 – El modelo de Tolman

Las predicciones en la teoría de Tolman.- Si Tolman habla de buscar metas, su sistema podría quedar reducido a una simple teoría del refuerzo de tipo conexionista, concibiéndose por ejemplo la meta como la obtención de una recompensa. Sin embargo no es así: ratas soltadas en un laberinto donde no había premios o recompensas (tipo comida) desarrollaban conductas en ese laberinto para satisfacer sus demandas de exploración y al mismo tiempo iban conociendo la disposición del laberinto. En un experimento subsiguiente, se alimentó a las ratas en cierto lugar A del laberinto y luego se las ubicó en otro lugar B apartado dentro del mismo, Resultado: las ratas que antes habían explorado el laberinto encontraron mucho más fácilmente el lugar de la comida que las que no lo habían hecho. Según Tolman, las ratas formaron una cognición acerca de la disposición del laberinto, lo cual muestra que no todo es explicable en los simples términos de recompensas, y además permite explicar el aprendizaje latente (latente porque su conocimiento sobre la disposición del laberinto no fue utilizado hasta no habérseles dado un motivo para ello: buscar alimento).

Pero aún hay más. Mediante otro experimento, Tolman comprobó que una rata puede llegar al lugar de la recompensa por otros caminos alternativos. De hecho utilizaba estos otros caminos (cuando lo esperable hubiera sido que usara los caminos ya recorridos hasta la comida). Conclusión: las ratas no aprendían simplemente una ruta para alcanzar el alimento, sino también la ubicación del alimento en el espacio.

Todos los experimentos citados podían explicarse, según Tolman, a partir de la idea de mapa cognitivo: las conductas de la rata podían ahora entenderse diciendo que ellas tenían mapas cognitivos de las áreas que habían explorado, esto es un mapa mental con los diversos pasadizos que llevaban o que no llevaban a callejones sin salida.

Otra idea central en Tolman es la expectación signo-Gestalt, que es el conjunto de expectativas que tiene el individuo acerca de cómo está organizado el mundo, acerca de qué cosas conducen a qué otras cosas, expectativas que surgen de su examen de los diversos estímulos externos o señales que percibe. Estos operarían, podríamos decir, como carteles indicadores que muestran cómo está configurado el ambiente. Mapa cognitivo y expectación signo-Gestalt son dos ejemplos de la variable intervinientes cognición.



Inspirado por los trabajos de Lewin, introdujo también Tolman los conceptos de vectores de ejecución pragmática y los vectores de ejecución por identificación. Los primeros se refieren a las tendencias a ir realmente a varios lugares o a producir otras respuestas que actúan directamente sobre el ambiente. Los segundos apuntan solamente a las tendencias a observar simplemente las cosas, a explorar el ambiente, por ejemplo por simple curiosidad. Los primeros implican una tendencia a actuar, y los últimos una tendencia a observar.

Seis tipos de aprendizaje.- En sus últimos trabajos teóricos (1949) Tolman catalogó seis tipos de aprendizaje, basándose en algunos conceptos de Freud, Guthrie y los teóricos del refuerzo.


  1. Formación de catexias: Aprender a buscar ciertas metas en lugar de otras, según el impulso experimentado. Por ejemplo ante el impulso del hambre buscar comida en vez de aserrín, elección que se basa en experiencias anteriores (la comida satisfacía el hambre, no así el aserrín). Lo que Tolman llamaba 'demanda' puede entendérselo como el impulso más la catexia: el impulso del hambre más la catexia sobre el alimento, hará surgir la demanda de alimento.

  2. Creencias de equivalencia: No son meras creencias que en tal o cual situación se encontrará una recompensa o un castigo, sino cogniciones de que la situación es equivalente a la recompensa o castigo y, por lo tanto, es en sí mísma recompensadora o castigadora. Por ejemplo, el niño aprende que recibir una medalla de oro 'equivale' a recibir cariño y admiración.

  3. Estos dos primeros tipos de aprendizaje se aplican a situaciones donde actúan premios o castigos, y donde Tolman aparece por tanto como un teórico del refuerzo, cosa que no necesariamente ocurre en el tercer tipo de aprendizaje:

  4. Expectativas de campo: Son básicamente las anteriormente llamadas expectativas signo-Gestalt, y permiten explicar el aprendizaje de conocimientos, como aprender una ruta, o qué herramientas usar para tal fin, etc. Los mapas cognitivos están constituidos en su mayor parte por las expectativas de campo que formamos a partir de nuestra experiencia con el mundo objetivo.

  5. Modos de cognición de campo: Son propensiones a aprender ciertas cosas más fácilmente que otras, y son en parte innatas y en parte aprendidas. El ejemplo típico es nuestra propensión a usar el lenguaje como forma de conocer y estructurar el campo. A diferencia de la rata, el hombre puede obtener un conocimiento del laberinto en términos de una secuencia verbal de 'a la izquierda' y 'a la derecha': es la forma en que el ser humano puede obtener conocimiento en forma más fácil.

  6. Discriminación de impulsos: Capacidad para distinguir diferentes impulsos (por ejemplo distinguir el hambre de la sed), lo cual está muy vinculado con el primer tipo de aprendizaje (la formación de catexias).

  7. Pautas motoras: El organismo no aprende solamente que mediante ciertos actos obtiene ciertas metas, sino también aprende a ejecutar esos mismos actos. Incluyó este sexto tipo de aprendizaje como una concesión a las críticas de Guthrie, según las cuales el sistema de Tolman dejaba a la rata en el laberinto 'absorta en la meditación' sin preocuparse cómo debía ejecutar sus actos. Tolman sugirió que el aprendizaje de pautas motoras podía explicarse mediante el esquema contigüista de Guthrie.

Para Tolman el aprendizaje, pese a su gran importancia, no es el único determinante de la conducta: ésta depende también de otros cuatro factores, que son la herencia, la edad, el entrenamiento y las condiciones endocrinas o vitamínicas.



Ratas y hombres.- Tolman es posiblemente el teórico cognitivo que más estudió animales. ¿Razones? Cabría pensar en tres: a) es más fácil trabajar con animales y se puede controlar mejor su ambiente; b) probar la objetividad de sus sistema, al no estar apoyado en las manifestaciones verbales de los sujetos sino en su conducta concreta; c) Tolman pensaba que si el psicólogo quería predecir y controlar conductas humanas muy complejas como las organizaciones sociales, las guerras, etc. realmente podía hacerlo (y de hecho Tolman hizo todo un plan para erradicar las guerras controlando ciertas variables), pero que este estudio debía comenzar con la resolución de problemas más sencillos, que apuntarían por ejemplo a poder predecir completamente la conducta de las ratas en un ambiente de laboratorio.
2. El aprendizaje según Hull
Clark Hull (1884-1952), que enunció su teoría en forma de postulados y teoremas derivados, no distingue como Skinner entre conducta operante y respondiente, pero acuerda con Watson, Guthrie, Thorndike y Miller en que toda conducta implica conexiones E-R, solo que es más explícito que estos autores en el sentido de mostrar otros factores que no son estímulos pero que influyen también en la respuesta (Hill, 1985:147).

Según este autor, para establecer o reforzar la conexión entre las respuestas y ciertas condiciones estimulantes tienen que darse dos condiciones: 1) acentuada proximidad temporal entre R y E; y 2) refuerzo, o estado de recompensa que produce disminución del estado de necesidad. El refuerzo puede ser primario (necesidades básicas) o secundario (asociado a refuerzos primarios). El concepto de necesidad lo relaciona con la supervivencia del individuo (Gaffuri y Abecasis, 1986).


Siguiendo el lineamiento expositivo de Hill (1985:147-174), puede detallarse más su teoría en los siguientes términos.

Hull quiere desarrollar un sistema para predecir las variables dependientes de la conducta a partir de diversas variables independientes, e intentó simplificar su tarea introduciendo variables intervinientes en un esquema de predicción de cuatro etapas: la primera etapa identifica variables independientes, la segunda y la tercera variables intervinientes, y la cuarta las variables dependientes a predecir:



Como puede verse, en la segunda y tercera etapa hay una serie de variables intervinientes, estados hipotéticos del organismo que no pueden observarse pero que permiten predecir diversos aspectos de la conducta como la amplitud, la velocidad, y la resistencia a la extinción.

El impulso es un estado temporario del organismo producido por algo que necesita o por estimulación dolorosa.

La motivación incentiva se refiere al efecto motivador del incentivo que se proporciona para suscitar la respuesta, y puede ser mayor o menor en cuanto a su intensidad. A diferencia de Skinner o Miller, Hull se interesó por la magnitud de la recompensa utilizada como reforzador.

La fuerza del hábito se refiere a la fuerza de la conexión aprendida entre una o varias indicaciones y una respuesta, conexión que se ha formado mediante la práctica reforzada.

El potencial excitatorio es igual a ePr = Im . K . eHr de manera tal que si por ejemplo K se aproxima a cero, también lo hace ePr. Esto significa que las tres variables intervinientes de la segunda etapa actúan juntas para producir la otra variable interveniente de la tercera etapa. Esta última, el potencial excitatorio, se refiere a la tendencia total a producir una respuesta dada para un estímulo dado.

Señalan Gaffuri y Abecasis (1986) que, si bien la introducción de variables intermediarias hizo que la psicología pase de ser descriptiva a ser explicativa, la teoría de Hull tiene su limitación porque es difícil experimentar con seres humanos, y además ciertos experimentos contradicen su teoría, pues mostraron que hay conductas que son más resistentes a la desaparición a pesar de haber sido menos reforzadas, con lo cual el papel del refuerzo no parece aquí tan importante.




Compartir con tus amigos:
1   ...   6   7   8   9   10   11   12   13   14


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

enter | registro
    Página principal


subir archivos