Visión Parcial 1

ABRIR LOS OJOS Y VER
Al ver, el sujeto busca, de alguna forma, aprehender un objeto.

La visión es una relación sujeto que ve-objeto visto.
Se intenta responder ¿En qué consiste ver? - ¿Qué se ve?
El ver resulta ser instantáneo y sin esfuerzo, ya que todo el gran esfuerzo de
reconstrucción y compaginación se realiza inconscientemente mediante el sistema
nervioso.
El proceso para que se lleve a cabo la reconstrucción es:
captar Vía DORSAL

Córtex cerebral Áreas corticales
información por y
primario y subcorticales
OJOS Vía VENTRAL
VIA DORSAL VIA VENTRAL

Vía del dónde/cómo Vía del Qué
Vía de la acción Vía de la percepción
Inconsciente Consciente
Procesa señales generadas en el transcurso Transporta datos desde receptores
de datos por córtex visual- lóbulo parietal retinianos, discurriendo en lóbulos
Calcula posición de objeto respecto al occipital y temporal.
observador y planea acciones apropiadas Su información se combinado con los de la
(para esquivarlo). vía ventral en el lóbulo frontal.
Aún no se sabe qué objeto es. Solo se Reconoce objetos y escenas. Identifica
puede conocer movimiento, configuración visiones y les proporciona significado
geométrica y tamaño.
Gracias al accionar de ambas vías, somos conscientes de una visión con significado.
PERCEPCIÓN: función cognitiva del organismo. Tiene su origen en la interacción física

con objetos, llevada a cabo mediante órganos sensoriales del sujeto. Así, una forma
puntual de energía (provocada por la presencia física de un objeto) ocasiona una
respuesta fisiológica de un puntual receptor sensorial.
Produce modelos perceptivos, mediante procesos de representación no basados en la
semejanza, extracción o aplicación directa de la realidad.
La percepción es primordialmente un proceso computacional, ya que va más allá de la
mera actividad sensorial, hasta convertirse en un fenómeno semiótico. Toma el dato
sensorial en principio, lo trasciende (por el uso de información adicional) y se transforma
en una representación estable y consistente del mundo real.
Son dos las CARACTERÍSTICAS PRINCIPALES DE LA PERCEPCIÓN, diferenciándose de

operaciones de cognición superior:
1. Parte de datos sensoriales
2. Operaciones están reguladas inicialmente por dichos datos, para conocer
propiedades relevantes del medio.
Ambas características se relacionan con el carácter BOTTOM-UP (ligada al estímulo y
que adquiere información útil del medioambiente) de procesos perceptivos, en contraste
con el TOP-DOWN (ligado a lo que ya conoce) de los procesos cognitivos. La diferencia
entre ambos procesos radica en la dependencia a un DATO SENSORIAL.
PROCESOS PERCEPTIVOS PROCESOS
COGNITIVOS
Guiados por datos sensoriales Exhiben
Limitados para llevar a cabo cómputos e inferencias, en función características
de la información disponible opuestas,
Tendencia a ser automáticas e inconscientes disponiendo de
Rápidas y eficaces parte significativa
de información del
sistema cognitivo
general
Procesos cognitivos contribuirán al resultado perceptivo definitivo, relacionando

información nueva con información ya existente del conocimiento, volviendo la primera
en algo útil (incluso para el mismo procesamiento cognitivo futuro).
Por ende, ambos procesos interactúan sin olvidar sus correspondientes limitaciones.
Distinción filosófica:
OBJETO MATERIAL es todo aquello capaz de estimular físicamente los sentidos
(extensión). En un sentido RELACIONAL, un objeto material es cuando queremos saber
CON QUÉ cosa interactuamos cuando percibimos algo/CÓMO es el mundo. Para ver una
cosa en el sentido relacional, esta debe existir.
OBJETO FORMAL: aspectos de un objeto significativos para el hombre, que constituyen

conocimiento (intensión, connotación o significado).En un sentido FENOMENAL, un
objeto formal es cuando queremos saber CÓMO se experimentan las cosas a través de la
percepción/ CÓMO nos parecen que son las cosas.
Para ver una cosa en sentido fenomenal, NO necesariamente debe existir.
Al objeto material no lo vemos tal cual es, sino que lo vemos como nos parece que es;
debido a que estamos convencidos socialmente que la visión fenomenal es la única
posible.
La visión no entró dentro de la curiosidad científica ya que se trataba solamente del

registro de fenómenos ordinarios. Fue hasta que se cuestionó si podría ocurrir de alguna
manera diferente.
Más allá de la descripción del estímulo sensorial y de la explicación de los impulsos
nerviosos que llegan al cerebro, se pretende saber cómo hace el organismo (cuerpo y
mente) para obtener información útil del mundo, a partir de energía que interactúa con
superficies sensoriales. Cómo transforma interacción energética en conocimiento y
experiencia.
Psicólogos conductistas pensaban que ver era solo un proceso inconsciente de la forma
estímulo-respuesta.
La INTELIGENCIA VISUAL es capaz de reconstruir la compleja escena que tiene en

frente.
Los objetos/escenas pueden ser los mismos, a pesar de que difieran con las proyecciones
retinianas y sus contextos. Por otro lado, una proyección retiniana puede dar lugar a
percepciones u objetos fenoménicos diferentes.
Se debe comprender a la visión con la perspectiva de que al reconocer cada

configuración visual, hay una representación o construcción de una configuración
evidente. Dicha representación (o modelo tridimensional constante) se relaciona con un
aducto retiniano variable en función de reglas de construcción COMPUTACIONALES.
El modelo tridimensional constante es una atribución ABSTRACTA de la representación
mental, y no una atribución inmediata del ojo y su información brindada.
Es característica de la visión humana realizar CONSTRUCCIONES (Modelos 2 ½ D/

Modelos 3D; imágenes; modelos semánticos/generales y modelos perceptivos/
particulares) según principios, a partir de una INFERENCIA.
A partir de un conjunto múltiple, inconstante y fugaz de imágenes planas (cóncavas)
proyectadas en la retina por ojos en movimiento, la inteligencia visual construye:
1. Modelo estable (incluso recordable) de escena vista
2. Modelos 3D de cosas particulares vistas, posteriormente categorizables en
3. Modelos 3D genéricos ya adquiridos. Pueden modificarse a partir de lo que se está
viendo.
Biológicamente, podemos practicar la visión y el lenguaje, con o sin inteligencia y/o

cultura; pues son habilidades innatas, naturalmente aseguradas en el cerebro gracias a
configuraciones genéticas. Por ello, los niños son ya grandes talentos de la visión antes
de caminar: por ejemplo, no se les explica cómo dividir el continuum visible y percibir
profundidad. Dichas habilidades innatas (universales para la especie) permiten que todos
lleguemos a formular las mismas reconstrucciones, a pesar de la excesivamente
abundante información proveniente de las imágenes retinianas.
La visión es universal porque los niños la reinventan cada generación. No debido a que se
les enseñe, sino porque no puede librarse de esta tarea.
No obstante, las experiencias visuales obtenidas pueden mutar a partir de la formación
cultural o discursiva de las personas.
Finalmente, el sujeto adquirirá REGLAS DE PROCESAMIENTO VISUAL que le permitan
construir, recordar y comparar modelos de escenas con tan solo mirar. Estas reglas
permitirán formular alguna hipótesis sobre ellas, aumentando nuestro saber relativo e
inteligencia visual; resolviendo problemas de referencia y significación de imágenes
Pero la visión, a diferencia del lenguaje, es algo que compartimos con otros animales
(por ende, varía entre especies).
La ESENCIA de la visión está en la facultad de construir representaciones visuales más o
menos estables, a partir de estímulos. Esta construcción está condicionada por la
realidad. Alhazen y Hochberg describieron la percepción de la mayoría de las
propiedades visuales como CONSECUENCIA de INFERENCIA INCONSCIENTE. Pero como
decir inferencia (regularmente de génesis consciente) inconsciente resultaba
contradictorio, otros autores prefieren decir construcción, para designar procesos
modeladores de la inteligencia visual.
Marr describió la visión como: proceso que a partir de imágenes retinianas del mundo
exterior, construye modelos útiles para el observador. Modelos construidos mediante
métodos inconscientes producto de selección natural, inmutables por informaciones
externas irrelevantes. Esto sería la clave del éxito ilusorio de las grandes imágenes del
entretenimiento, artes y ciencia.
En cierto punto, las IMÁGENES son una aglomeración de puntos estimulantes sobre una
superficie.
PROBLEMA FUNDAMENTAL DE LA VISIÓN
La IMAGEN RETINIANA formada a partir de sucesivas y temblorosas imágenes

proyectadas desde el mundo exterior, sobre un tejido fotosensible de la parte posterior
interna del ojo) es susceptible de innumerables interpretaciones. Esta imagen no es
visible ni vista. Ayuda a reconstruir un mundo estable 3D: ancho, alto y profundidad.
Y si bien son abundantes en información, conducen al problema de que podrían
construirse innumerables mundos visuales posibles a partir de esa abundancia de datos.
Si bien percibimos la PROFUNDIDAD, la distancia en sí misma no se puede percibir, pues

es una línea con un extremo hacia el único punto del fondo del ojo (punto inalterable e
invisible). Entonces, la profundidad que vemos es una de las incontables que podríamos
percibir para cada imagen 2D.
La profundidad fenoménica de la escena, y por ende el modelo espacial mental, puede
desviarse a partir de diversos indicios como:
1. Cambios graduales de texturas
2. Disparidad del ángulo de convergencia entre los dos ojos
3. Disparidad estereoscópica en la proyección perspectiva de la escena (como se ve en
cada uno de los ojos). Para evitar este problema, naturalmente existen soluciones
trigonométricas utilizadas para lograr una sola imagen a partir de dos imágenes
sutilmente divergentes de una misma escena.
Para llegar a una imagen constante, se emplea un esquema mental en base a

CONSTANCIAS PERCEPTIVAS, que hacen uso de variables como configuración
geométrica, tamaño y posición relativa de las partes entre sí. Gracias a un tipo
específico de computación de dichos datos, se puede establecer la única profundidad
posible y adecuada para cada imagen 2D; que se ofrece al ojo.
En caso de VARIACIÓN DE POSICIÓN DE LA ESCENA respecto de un observador binocular

móvil, la comprensión visual debe rectificarse a partir de un aducto retiniano variable e
inestable, en búsqueda de la constancia de atributos de los objetos percibidos.
LO QUE ESTIMULA NUESTRA VISIÓN, LAS COSAS, LA ENERGÍA
Estimulación PROXIMAL es la respuesta generada por energía organizada que actúa

directamente sobre una superficie receptora sensorial. La energía produce un efecto
físico-químico, lo que corresponde a este con una reacción físico-química.
Mientras que la DISTAL es aquel aspecto periférico, que de una u otra manera, participa
de la génesis del proximal y que, sin actuar directamente sobre el receptor, constituye
un referente.
[EJEMPLO: El continuum de la región que rodea un libro, es el estímulo distal. Mientras
que el proximal es el de la remitida por la superficie del libro, que afectan los
fotorreceptores retinianos].
El observador al ver, requiere del estímulo proximal ineludiblemente. Aunque, dicha
estructura no es inmediatamente un estímulo proximal, sino una representación o
estructura vicaria del estímulo distal; pues no vemos organizaciones luminosas
(proximal), vemos cosas, lugares, sucesos, etc. (distal).
El estímulo proximal no es suficiente para una representación consistente y útil del
estímulo distal.
Para construir un modelo útil a partir de un estímulo distal, el organismo recurre a algún
elemento capaz de trascender la estructura del estímulo proximal. Se requiere un
proceso de obtención de información fiable, partiendo de una estimulación proximal
inestable e insuficiente.
Se puede transformar un estímulo proximal en un distal mediante procesamientos de

información, siempre y cuando no coincidan ambos punto a punto en propiedades
elementales como tamaño, configuración geométrica, etc. En tal caso, no se produce
una captación directa por ser semejantes entre sí, sino que se producen PROCESOS DE
INFERENCIA, que transforman una representación primitiva 2D en una 3D.
Información proveniente de estímulos medioambientales llegan a almacenes sensoriales,

donde se registra la información de forma poco analizada, basada en características
proximales. En la mayoría de los sentidos, en especial la visión, esta información se
pierde casi por completo luego de una fracción de segundo. Tan solo una parte es
recogida para ser procesada a otro nivel del sistema.
Puntualmente, las imágenes retinianas monoculares y bidimensionales se suceden
(borran y reemplazan) con el movimiento sacádico. Estas imágenes, en conjunto,
proporcionan datos que formarán modelos de características distales de escenas/
objetos, así como modelos generales/semánticos.
La veracidad de la percepción refiere solo al grado de ajuste con la realidad y al valor

epistémico que cabe atribuir a sus juicios perceptivos.
EL ENFOQUE DEL PROCESAMIENTO DE LA INFORMACIÓN
El enfoque cognitivo es el que prevalece en el espacio teórico entre biología, psicología

y filosofía (sin acercarse a las ciencias sociales, donde generalmente se realiza el
enfoque en construcciones sociales). El objetivo es llegar a comprender como cualquier
sistema inteligente (ej., humano) adquiere información externa, la representa, la
procesa y la recupera para luego almacenarla.
Se piensa a la percepción humana desde la REPRESENTACIÓN (o construcción, modelo,

imagen – de uso restringido-. También símbolo, en psicología) y el PROCESO (cálculo,
inferencia-de uso restringido-. También computación, en psicología); entiendo que la
mente es un sistema para manipular entidades abstractas (SÍMBOLOS) mediante
PROCESOS PSICOLÓGICOS.
La habilidad fundamental de la mente humana consistirá en construir signos,

manipularlos y transformarlos.
Para manipularlos, se deben conocer reglas y operaciones básicas; que resultan ser
transformables y combinables, pudiendo realizar cálculos/computaciones.
Este enfoque se denomina como PROCESAMIENTO DE LA INFORMACIÓN, y sus supuestos

básicos son:
1. Mente funciona como un programa de ordenador. Puede desmembrar información
compleja y especificarse a un nivel más sencillo.
2. Dicha información se almacena como modelos (signos) que pueden ser
transformados mediante procesos computacionales.
Este procesamiento define a todo EVENTO MENTAL-INFORMACIONAL (consciente/
inconsciente) como compuesto por un INPUT de información, una transformación y un
OUTPUT de información resultante.
A pesar de todo, no hay una teoría unificada sobre tal procesamiento. Solo hay teorías
parciales (teoría computacional de Marr).
PRINCIPIO DE DESCOMPOSICIÓN SECUENCIAL (o recursiva): expectativa de que cada

fenómeno informacional pueda describirse en un nivel cada vez más básico, hasta llegar
a un elemento PRIMITIVO, no susceptible a continuar descomponiéndose. Se detiene la
descomposición en esos primitivos, ya que es el nivel requerido de información por otros
sistemas que primeramente podrían ser de orden computacional; aunque también
podrían ser fisiológicos.
[Ejemplo: una teoría dice que computacionalmente, mamíferos detectan contornos –
que no existen en la naturaleza observada, sino en la percibida- de elementos
individuales a partir de los ceros de la segunda derivada de una función de los cambios
de intensidad lumínica de una escena. Mientras que neurobiólogos decían que,
fisiológicamente, células nerviosas retinianas de mamíferos llevaban a cabo la
inhibición lateral, capaz de hacer las veces de un calculador de dicha segunda derivada).
Nuestro SISTEMA DE PROCESAMIENTO DE INFORMACIÓN está biológicamente limitado

en la cantidad de elementos retenibles simultáneamente en la memoria inmediata. Al
parecer, la mejor forma de ampliar la retención de la memoria inmediata de la especie
ha sido disponer de procesos que codifiquen elementos individuales (acontecimientos
particulares del continuum no semiotizado), en CLASES O TIPOS. Entonces, parte (y
solo parte) de información de la memoria inmediata es transformada en output de otro
sub-sistema, una especie de memoria a largo plazo, donde se almacena y desde donde
se comparte con otros sistemas, el conocimiento del mundo.
PROCESAMIENTO DE LOS MUNDOS NATURAL Y CULTURAL
Conocer el trabajo sensorial del cuerpo para explicar la percepción-visión humana

implica aceptar que:
1. Lo sensorial es condición necesaria de la percepción, con una relación CAUSAL entre
ambos.
2. Dicha relación causal no reduce a la actividad sensorial como el sustrato físico de la
perceptiva, sino que implica una compleja interconexión INFORMATIVA (o de
semiosis perceptiva); que explica en principio la transformación del input sensorial
(naturaleza) en output perceptivo (sentido).
¿Cómo un sistema físico (sensorial) termina obteniendo información, conocimiento y

experiencia útil acerca del mismo?
Desde la NEUROFISIOLOGÍA: Sistemas sensoriales responden con la codificación neural
del estímulo proximal por medio de la TRANSDUCCIÓN y MODULACIONES, que pueden
afectar a la circulación del impulso nervioso.
Para que esta codificación tenga consecuencias perceptivas, debe:
1. Hechos neurales tender a construir representaciones a partir de propiedades
relevantes de la estimulación
2. Procesos perceptivos actuar sobre datos provistos por tales representaciones (1).
TRANSDUCCIÓN FUNCIONAL: es una operación física y no simbólica, que sin embargo

obtiene símbolos, representación mental o estructura semiótica a partir del pasaje de la
codificación netamente física de la actividad neural a una codificación de valor
simbólico, dependiente de clases del proceso de información; de transacciones físicas
perceptivamente relevantes.
Su cometido es transformar eventos físicos en representaciones, al dotarlos de
información.
TRANDUSCCIÓN SENSORIAL: tiene lugar en los receptores, transforma una energía física
en otra.
Dentro de la percepción se llevan a cabo acciones de carácter MODULAR (sistemas de

entrada) o de carácter NO MODULAR/INTERACTIVO (sistemas centrales).
SISTEMA MODULAR se encarga principalmente de procesos básicos del análisis

perceptivo. Es rápido, eficaz, automático y obligatorio. Su información está
“encapsulada”, pues sus representaciones no son accesibles para la consciencia ni para
son susceptibles a procesos cognitivos (conocimiento previo no influye). Conducen más
bien a la ACOMODACIÓN que a la ASIMILACIÓN. Su output equivale a una representación
distal (modelo perceptivo).
Dicho output, adquiriendo la cualidad de consciente, es el input del SISTEMA NO
MODULAR/INTERACTIVO, cuyos procesos son sensibles a cualquier tipo de información
top-Down; y ayudan a fijar las creencias perceptivas. Funcionalmente, los resultados se
vuelven útiles para la memoria de trabajo para planificación, razonamiento, etc.
Fenomenológicamente, resultados forman parte de la experiencia vivida, de cualidades
subjetivas.
En las CREENCIAS PERCEPTIVAS, representaciones distales (modelo 3D) interactúan con

outputs de otros módulos perceptivos y – a la vez – con información memorística, hasta
que la percepción adquiere información respecto del reconocimiento, identificación e
interpretación de objetos/escenas.
Entonces, interacción activa del SISTEMA COGNITIVO general afectaría principalmente a

las últimas fases de la ACTIVIDAD PERCEPTIVA.
DIAGRAMA DE LAS ETAPAS DE LA ACTIVIDAD

PERCEPTIVA
REPRESENTACIONES IMÁGENES E IMAGINERÍA
¿Cómo se almacena la información cambiante que registran órganos sensoriales, para

luego poder ser utilizadas exitosamente en una instancia posterior? ¿Cómo es el formato
de estas representaciones?
REPRESENTACIÓN: entidad que está en lugar de otra.

Supuestos básicos de representaciones:
1. Su información se emplea en lugar de algún referente mundano
2. Preservan la estructura informacional semiotizable del mundo exterior
Las representaciones deben mantener cierta “semejanza” con el mundo real que
reconstruyen, y luego se preguntan qué formato debe adquirir esa información
proveniente del exterior para poder ser almacenada en la mente.
Psicólogos dicen que la representación es EXTRÍNSECA.
El RENDIMIENTO COGNITIVO de la representación está dado en la medida en que las

construcciones permiten explicar un conjunto de fenómenos cognitivos (como el
iconismo primario).
En cuanto al FORMATO que adquieren las representaciones del conocimiento, algunas

consideran que pueden ser de naturaleza PROPOSICIONAL (verbal) o de orden NO
PROPOSICIONAL (espacial).
La psicología actual sostiene que el conocimiento se representa completamente por

medio de un conjunto de signos (símbolos) - que funcionan como el lenguaje-, que
apuesta a un formato de representación único, permitiendo operar conceptos y objetos
del mundo como proposiciones formales.
A pesar de ser versátil para poder expresar todo tipo de información en representaciones
analíticas o discretas, su debilidad teórica radica en que las proposiciones podrían
predecir cualquier resultado experimental.
Paivio pensó un CÓDIGO dual, VERBAL- NO VERBAL para representar, almacenar y

recuperar con utilidad la información. Ambos mecanismos, verbal y no-verbal, serían
semióticos y podrían ser activados independientemente, o bien en paralelo. Difieren
principalmente en la naturaleza de sus unidades (SIGNIFICANTES Y SIGNIFICADO), y en
cómo se conectan estas unidades con redes para formar estructuras superiores.
IMAGEN, coloquialmente, es toda representación de una percepción. Psicólogos la

definen como clase de representación analógica en las que se da una correspondencia
casi directa entre el mundo real y el mundo representado (mental o textual).
Estudios, de sentido cronométrico (rinoceronte y distancia del cuerno con otras partes
del cuerpo) y de sentido estructural (rotación de figuras geométricos y tiempo de
identificación), demuestran que hay una clase de INFORMACIÓN MENTAL casi
geométrico o espacial; de forma tal que imágenes mentales espaciales se codifican en
operaciones puntuales (en estos casos, de rastreo y rotación). Para ello, esta
codificación debe ser capaz de construir una red de tipos (universales) y no de
especímenes (particulares).
IMÁGENES MENTALES ESPACIALES representan objetos en término de sus

configuraciones y tamaños, reales o aparentes; bien tendiendo a ser modelos 3D o
continuando siendo un modelo 2 ½ D. Así, múltiples objetos se relacionan espacialmente
en distancia y orientación.
Las IMÁGENES MENTALES ALGEBRAICAS, en contraste con las imágenes mentales
espaciales, representan un objeto por medio de un símbolo arbitrario que no tiene que
ver con su realidad ni con su apariencia. Establece relaciones formales entre símbolos.
Estas operaciones de representación responden a REGLAS VISUALES DE INFERENCIA,
principios para formar una representación visual a partir de otra.
Kosslyn propuso la idea de una memoria transitoria de imágenes o IMAGE BUFFER, que
sería la sección de la memoria de trabajo en donde se construyen las representaciones
geométricas. Como esta memora transitoria se limita a unidades de cálculo (sinapsis y
neuronas), representa una cantidad finita de información; por ello, las imágenes no
pueden ser ni muy detalladas ni muy grandes en cuando información se refiere. Además,
es muy lento discernir imágenes muy detalladas.
Luego, Kosslyn propone una nueva teoría, en la que las imágenes se representan en una
MATRIZ 3D INTERNA que podría, incluso ser más económica en cuanto a bites. Así, una
imagen comienza a desvanecer tan pronto como se genera; ya sea por procesos visuales
perceptivos, como procesos cognitivos. Se asume entonces que se recuerda la
APARIENCIA LITERAL de un objeto (de esbozo casi 3D), o bien una DESCRIPCIÓN
ESTRUCTURAL ABSTRACTA. Ambas memorias se pueden utilizar para generar imagen; de
allí viene la acción de dibujar AL NATURAL o dibujar de MEMORIA.
¿Para qué tener dos tipos de representaciones, si la algebraica, siempre necesaria,

podría hacer todo el trabajo de cómputo que se le exige a la geométrica?
La respuesta más sólida puede ser la de pylyshyn, que dice que para que podamos hablar
de lo que vemos, debe haber un proceso en el cual las formaciones retinianas (entra
exclusiva de lo visual) se traduzca finalmente en una forma conceptual, y para llegar a
esta última se deben pasar por niveles de representación geométrica.
Pylyshyn dice que cualquier programa de ordenador se reduce a series digitales escritas
en el código de control de la máquina. Entonces, todos los procesos mentales se
reducirían a impulsos nerviosos o a otro código primitivo, que organizados
funcionalmente, pueden hacer explícitas relaciones de alto nivel (como el modelo 3D).
EL ENFOQUE DEL CÁLCULO VISUAL Y LA OBRA DE DAVID

MARR
Tratar de comprender la percepción estudiando únicamente las neuronas es como
intentar entender el vuelo de un ave sólo por las plumas.
Una teoría de la visión/percepción, debe tener en cuenta:

1. Problemas efectivos de la percepción de objetos/escenas
2. Formas de resolver esos problemas, abstractamente; y formas de conseguirlo a
través de ciertos mecanismos.
Para que la VISIÓN ARTIFICIAL practicada por ordenadores pudiera evolucionar, tuvo
que orientarse en la ideación y comprensión de mecanismos. Esto equivale a reconstruir
las primeras fases de la visón humana. Esto se consigue combinando perspectivas y
nociones proporcionadas por la psicología de la percepción, la neurociencia y la
inteligencia artificial.
Marr creyó que la visión se crea a partir de DESCRIPCIONES SIMBÓLICAS eficaces de las
imágenes que mediante las retinas, el sujeto registra del mundo visible. Esta sucesión de
imágenes, primero de la estimulación retiniana y luego del cálculo, deben proporcionar
descripción útil del mundo visible.
Marr decía que para que se obtuvieran descripciones SIMBÓLICAS, debían:
1. conocerse cómo funcionan las neuronas y las sinapsis (PARTE INSTRUMENTAL)
2. conocerse el esquema rector de un proceso de cómputo (PARTE ALGORÍTMICA)
3. Conocerse una teoría de computación para interpretar datos de entrada visual
(PARTE COMPUTACIONAL).
PARTE COMPUTACIONAL: cómo funciona la visión humana, qué hace y por qué lo hace.
Debe establecer qué es lo computado y por qué es útil computarlo.
Debe especificar relaciones necesarias para organizar grupo múltiple y caótico de
imágenes retinianas 2D, en imágenes distales 3D. También la forma en que las imágenes
pueden interpretarse.
PARTE ALGORÍTMICA: se describen diversas maneras de cómo se representa, por

ejemplo, cómo la estereopsia puede ser correctamente representada y ejecutada por
algún mecanismo.
PARTE INSTRUMENTAL: se ocupa del dispositivo que habrá de materializar físicamente

el proceso, pues cualquier logaritmo requiere de un soporte material para poder ser
expresado (hardware/wetware).
Entonces, una vez que se ha elaborado una teoría computacional, se pueden elaborar
algoritmos para implementarlo, y comparar finalmente su rendimiento con el del
sistema visual humano.
Y si bien, por cuestiones experimentales, para los científicos era más sencillo trabajar
con la parte algorítmica e instrumental; Marr creía que lo más importante era la
computacional.
Así, considera a la visión como una serie de problemas de procesamiento de

información, explicables mediante la especificidad de las representaciones mentales
ante los diferentes niveles de información que presenta un objeto/escena.
Sugiere una TEORÍA DE LA VISIÓN basada en el cálculo de sucesivas representaciones
espaciales, capaz de extraer, mediante representaciones sucesivas, información 3D de
objetos/escenas a partir de imágenes retinianas.
Mediante ese MECANISMO DE MODELOS SUCESIVOS, se puede conocer el proceso por el
cual se trata de volver comprensible una escena externa, hasta que ya se ha
aprehendido y se es capaz de recordar y clasificar esa escena.
Estas representaciones son:

1. ESBOZO PRIMITIVO 2D: registra cuestiones lumínicas (reflectancia de la superficie,
iluminación de la escena) y geometría local (tamaño o densidad) de imágenes
retinianas 2D sucesivas. El estímulo proximal es su primera operación.
Es una serie de manchas orientadas en diversas direcciones, información en bruto de la
escena, obtenidas gracias a dispositivos biológicos de procesamiento totalmente
independientes de conocimiento o referencia cultural del objeto.
2. MODELO 2 ½ D: registra profundidad, orientación y discontinuidad de superficies

visibles. Está centrada en el sujeto observador. Comprende la estereopsia, detección
de sombras, texturas, contornos y aspectos del movimiento. Es el último paso antes
de la interpretación de una superficie con respecto a un objeto reconocible. Se
presenta en la consciencia y no se puede ignorar (a menos que se cierren los ojos).
3. MODELO 3D: registra volumen de objetos, su espacio ocupado, sus propias

coordenadas; por lo que ya no se centra más en el observador. Implica la
transformación de las formas, en una representación que puede ser reconocida. Para
reconocer el objeto, se necesita una descripción estable de la forma que no depende
de un punto de vista momentáneo. Se identifica el objeto y sus partes componentes.
Los productos de un modelo 3D se asemejan a entidades densas, compuestas de
pequeños cuerpos redondos de rotación, llamados conos redondos o GEONES. Esto
obedece a que el cerebro transpone de manera casi automática los contornos que ha
extraído del modelo 2 ½ D, a EJES DE SIMETRÍA que guardan similitud con esos
volúmenes (virtuales).
El resultado del modelo 3D construido es una descripción singular de cualquier objeto.
Así, se podrá recurrir siempre a la misma descripción, no importa el ángulo desde donde
se lo mire.
Es almacenado en la memoria a largo plazo y se evoca a voluntad. El recuerdo,
esquematización 3D, se forma inconscientemente pero se ofrece a la consciencia.
Guía de estudio para el primer examen parcial |

Visión
PARTE 1: Lectura del Programa (4 preguntas)
1) ¿Cuáles son nuestros cinco principales objetivos?
1. desarrollar la capacidad de observación

2. Conocer los principios que efectiva e históricamente regularon los textos visuales, en
artes y diseño.
3. Desarrollar destrezas y creatividad a partir de principios de organización estudiados.
4. Análisis y crítica para nuestros trabajos y los de otros (artistas y compañeros).
5. Evaluar la importancia dela visión y las leyes que rigen la percepción y composición,
en las artes visuales.
2) ¿Cómo es el nombre de nuestras cuatro unidades y de qué tratan (someramente)?
A. Elementos de la percepción visual: trata sobre fundamentos psico-biológicos de la

percepción visual, como también su proceso evolutivo. Trata también la organización
perceptual y el reconocimiento visual de objetos. Además, interpela la Teoría de la
Gestalt.
B. Color: explica sencillamente cómo se percibe, se reconoce y se organiza el color,
basándose en cuestiones psicofísicas de la visión y en la teoría del color. Además,
desarrolla y entrena la percepción del color; para luego aplicar nociones a estudios.
C. Signo: aborda la semiótica de forma introductoria, lo que vemos y lo que entendemos

de eso. Conocer procesos algorítmicos usados para representarla multidimensionalidad.
Aplica conocimientos al analizar imágenes.
D. Forma: conocer la génesis (geometría básica) y la organización de la forma visible, sin

tener en cuenta necesariamente, el proceso de percepción. También conocer la
composición y proporción que jugaron en el arte occidental. Aplicar este último para
dimensionar la obra artística.
3) ¿Cómo un alumno alcanza su regularidad a lo largo del año?
Al obtener calificaciones mayor o igual a 4 en cada uno de los parciales.
Asistiendo al 70% de las actividades prácticas y obteniendo calificación promedio de esos

trabajos prácticos mayor o igual a 4.
Con respecto a trabajos prácticos, el regular puede hacer 10 TP (los 2 primeros
obligatorios), para que se promedien los 7 TP de mejor calificación.
SI aspira a la regularidad, podrá recuperar el 100% de los parciales y el 33% (o más) de

TP. Calificación obtenida en recuperatorios, sustituirá la recuperada.
Finalmente, el regular deberá preparar y rendir su examen final dentro de los 27 turnos
subsiguientes al curso realizado. Este examen es teórico-práctico.
4) ¿Hay contenidos de morfología? ¿Cómo es esto?
Si, hay contenidos de Morfología dentro del programa de Visión. Esto se debe a que, en
la primera unidad se estudia lo expuesto por la teoría de la Gestalt; que si bien
actualmente ha caído en desuso, se la trata debido a que ha sido y continúa aun siendo
influyente en el proceso en el que actualmente percibimos el mundo, y le atribuimos
sentido.
PARTE 2: Lectura del volumen Fraenza, Fernando; Sergio Yonahara & Alejandra Perié
(2013), 1.1.1./1.1.7.
5) ¿Por qué la acción de ver parece instantánea y lograda sin esfuerzo?

6) ¿Para qué sirve la vía dorsal de la visión?
7) ¿Para qué sirve la vía ventral de la visión?
8) ¿Por qué hablamos de un objeto material en un sentido relacional?
9) ¿Por qué la visión no entró tempranamente en el dominio de la curiosidad científica?
10) ¿Por que la visión requiere transformar una interacción física en una transacción
cognitiva?
11) ¿Por qué aún siendo un virtuoso de la visión, el ser humano no advierte y no cree su
talento innato?
12) ¿Qué quiere decir que una misma proyección retiniana puede dar lugar a
percepciones u objetos fenoménicos diferentes?
13) ¿Por qué razón la tridimensionalidad paralelepípeda propia y estable de un
refrigerador no es -precisamente- un atributo de la información recolectada por el
órgano sensitivo?
14) ¿Por qué es característica de la visión humana hacer “construcciones”?
15) ¿A qué llamamos inteligencia visual? 2
16) ¿Por qué la potencia clave de la visión consiste en reconstruir una representación
estable del mundo a partir de estimulaciones fragmentarias y fugaces?
17) ¿Por qué decimos que la visión es un proceso mediante el cual, a partir de imágenes
retinianas del mundo exterior produce descripciones o modelos que son útiles para el
observador?
18) ¿por qué decimos que las imágenes retinianas tienen información x, e y?
19) Si, una misma proyección retiniana puede dar lugar a percepciones u objetos
fenoménicos diferentes, ¿cómo es posible ponderar sólo uno de los mundos visibles,
llegando a la misma reconstrucción que otros observadores hacen de la escena? (¿A qué
llamamos éxito estadístico?)
20) ¿La visión es innata o cultural? ¿Por qué?
21) ¿A qué llamamos estimulación distal?
21) ¿A qué llamamos estimulación proximal?
22) ¿Por qué la tarea de la visión es construir un modelo del estímulo distal a partir del
estímulo proximal?
23) ¿A qué llamamos enfoque del procesamiento de la información?
24) ¿En qué consiste el imput del procesador visual?
25) ¿En qué consiste el output del procesador visual?
26) ¿En que consistirá partir de una representación primitiva bidimensional como la
matriz de distribución 2-D de simples niveles de luminancia, para luego, llevar a cabo
operaciones de cálculo que permiten de tales distribuciones primarias derivar los
bordes, contornos?
27) ¿En qué sentido las operaciones de la percepción, guiadas por los datos sensoriales,
tienden a ser automáticas, inconscientes, rápidas y eficaces, y restringidas por la clase
específica de información que utilizan para articular los datos y llevar a cabo cómputos
e inferencias?
28) ¿Qué son procesos top-down?
29) ¿En qué consiste la distinción entre los sistemas de entrada, de carácter modular, y
los sistemas centrales, de character no-modular, holístico o interactivo?
30) Cuando decimos “El debate sobre el formato de la representación del 3
conocimiento se ha polarizado entre quienes consideran que el conjunto de la
representaciones son de orden proposicional (verbal), y quienes se encontrarían
agrupados, al menos en lo que política académica refiere, bajo el rótulo de
“representación por imágenes” aún cuando sus modelos hipotéticos de las
representaciones perceptivas de orden espacial (y no proposicional) disten de ser
mismamente imágenes.” ¿Qué significa pensar que las representaciones mentales son de
orden proposicional? Y, ¿por qué decimos que las representaciones perceptivas de orden
espacial (y no proposicional) disten de ser mismamente imágenes?
31) ¿Qué ideas defienden autores como Stephen Kosslyn, Roger Shepard o Alan Paivio?
32) ¿Qué representa el esbozo primario o primitivo?
33) ¿Qué tipo de información posee el modelo de 2½-D?
34) ¿Qué tipo de información posee el modelo de 2½-D?

Visión Parcial 1

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Visión Parcial 1

Uploaded by

Copyright:

Available Formats

ABRIR LOS OJOS Y VER

Al ver, el sujeto busca, de alguna forma, aprehender un objeto.

captar Vía DORSAL

VIA DORSAL VIA VENTRAL

PERCEPCIÓN: función cognitiva del organismo. Tiene su origen en la interacción física

Son dos las CARACTERÍSTICAS PRINCIPALES DE LA PERCEPCIÓN, diferenciándose de

Procesos cognitivos contribuirán al resultado perceptivo definitivo, relacionando

OBJETO FORMAL: aspectos de un objeto significativos para el hombre, que constituyen

La visión no entró dentro de la curiosidad científica ya que se trataba solamente del

La INTELIGENCIA VISUAL es capaz de reconstruir la compleja escena que tiene en

Se debe comprender a la visión con la perspectiva de que al reconocer cada

Es característica de la visión humana realizar CONSTRUCCIONES (Modelos 2 ½ D/

Biológicamente, podemos practicar la visión y el lenguaje, con o sin inteligencia y/o

La IMAGEN RETINIANA formada a partir de sucesivas y temblorosas imágenes

Si bien percibimos la PROFUNDIDAD, la distancia en sí misma no se puede percibir, pues

Para llegar a una imagen constante, se emplea un esquema mental en base a

En caso de VARIACIÓN DE POSICIÓN DE LA ESCENA respecto de un observador binocular

LO QUE ESTIMULA NUESTRA VISIÓN, LAS COSAS, LA ENERGÍA

Estimulación PROXIMAL es la respuesta generada por energía organizada que actúa

Se puede transformar un estímulo proximal en un distal mediante procesamientos de

Información proveniente de estímulos medioambientales llegan a almacenes sensoriales,

La veracidad de la percepción refiere solo al grado de ajuste con la realidad y al valor

EL ENFOQUE DEL PROCESAMIENTO DE LA INFORMACIÓN

El enfoque cognitivo es el que prevalece en el espacio teórico entre biología, psicología

Se piensa a la percepción humana desde la REPRESENTACIÓN (o construcción, modelo,

La habilidad fundamental de la mente humana consistirá en construir signos,

Este enfoque se denomina como PROCESAMIENTO DE LA INFORMACIÓN, y sus supuestos

PRINCIPIO DE DESCOMPOSICIÓN SECUENCIAL (o recursiva): expectativa de que cada

Nuestro SISTEMA DE PROCESAMIENTO DE INFORMACIÓN está biológicamente limitado

PROCESAMIENTO DE LOS MUNDOS NATURAL Y CULTURAL

Conocer el trabajo sensorial del cuerpo para explicar la percepción-visión humana

¿Cómo un sistema físico (sensorial) termina obteniendo información, conocimiento y

TRANSDUCCIÓN FUNCIONAL: es una operación física y no simbólica, que sin embargo

Dentro de la percepción se llevan a cabo acciones de carácter MODULAR (sistemas de

SISTEMA MODULAR se encarga principalmente de procesos básicos del análisis

En las CREENCIAS PERCEPTIVAS, representaciones distales (modelo 3D) interactúan con

Entonces, interacción activa del SISTEMA COGNITIVO general afectaría principalmente a

DIAGRAMA DE LAS ETAPAS DE LA ACTIVIDAD

REPRESENTACIONES IMÁGENES E IMAGINERÍA

¿Cómo se almacena la información cambiante que registran órganos sensoriales, para

REPRESENTACIÓN: entidad que está en lugar de otra.

El RENDIMIENTO COGNITIVO de la representación está dado en la medida en que las

En cuanto al FORMATO que adquieren las representaciones del conocimiento, algunas

La psicología actual sostiene que el conocimiento se representa completamente por

Paivio pensó un CÓDIGO dual, VERBAL- NO VERBAL para representar, almacenar y

IMAGEN, coloquialmente, es toda representación de una percepción. Psicólogos la

IMÁGENES MENTALES ESPACIALES representan objetos en término de sus

¿Para qué tener dos tipos de representaciones, si la algebraica, siempre necesaria,

EL ENFOQUE DEL CÁLCULO VISUAL Y LA OBRA DE DAVID

Una teoría de la visión/percepción, debe tener en cuenta:

PARTE ALGORÍTMICA: se describen diversas maneras de cómo se representa, por

PARTE INSTRUMENTAL: se ocupa del dispositivo que habrá de materializar físicamente

Así, considera a la visión como una serie de problemas de procesamiento de

Estas representaciones son:

2. MODELO 2 ½ D: registra profundidad, orientación y discontinuidad de superficies

3. MODELO 3D: registra volumen de objetos, su espacio ocupado, sus propias

Guía de estudio para el primer examen parcial |

PARTE 1: Lectura del Programa (4 preguntas)

1) ¿Cuáles son nuestros cinco principales objetivos?

1. desarrollar la capacidad de observación

2) ¿Cómo es el nombre de nuestras cuatro unidades y de qué tratan (someramente)?

A. Elementos de la percepción visual: trata sobre fundamentos psico-biológicos de la

C. Signo: aborda la semiótica de forma introductoria, lo que vemos y lo que entendemos