Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Visión 3D: cómo el cerebro crea profundidad a partir de imágenes 2D. - Prof. Aznar Casanov, Apuntes de Psicología de la Percepción

Cómo el sistema visual humano, a partir de imágenes bidimensionales captadas por los ojos, construye una percepción tridimensional de la profundidad. Se abordan conceptos como la convergencia ocular, los gradientes de densidad y textura, la disparidad retiniana y las claves de profundidad dinámicas. Se incluyen ilustraciones para facilitar la comprensión.

Tipo: Apuntes

2019/2020

Subido el 09/04/2020

nuriagq
nuriagq 🇪🇸

4.7

(3)

17 documentos

1 / 4

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Percepció i atenció
1
PERCEPCIÓN DEL ESPACIO
1.1. Diferentes planos de profundidad
Problema de la percepción de la profundidad: las imágenes que captan la retina son bidimensionales, son planas (tienen altura y anchura). A
partir de la i nformación de los dos ojos podemos reconstruir la idea de la profundidad. Lo que capta el ojo izquierdo no es exactamente igual
que lo que capta el ojo derecho. Cada ojo capta más de su parte de la imagen espacio visual percibido. Los conos nos dan pistas que nos
hacen calcular más o menos las distancias.
El gran problema de la percepción del espacio la planteó un obispo americano. Se preguntaba ¿cómo es posible que el cerebro, a partir de
imágenes 2D, construya imágenes 3D? Tenemos consciencia de ver el mundo con un solo ojo hablamos de que tenemos visión ciclópea, ya
que se fusionan las imágenes de los dos ojos.
Existen dos teorías para explicar la visión 3D:
Teoría de la percepción directa (enfoque realista): asegura que captamos la realidad directamente, sin intermediarios. Sinton izando
las dos imágenes, el cerebro reconstruye la información que hay en el mundo y la plasma en la consciencia visual. Según esta teoría el
cerebro es un dispositivo receptor de la información, está diseñado para construir. No tiene muchos seguidores, ya que es difícil de
demostrar.
Teoría inferencial y constructivista (enfoque empirista): es la más extendida. A partir de detalles de la imagen 2D se construye la imagen
3D (de lo particular a lo general inferencia). A partir de la experiencia, se asumen la s pistas que nos llegan. Esta teoría tiene más
evidencia empírica. Neisser se planteaba si la naturaleza estaba dentro de nuestra cabeza.
o Metáfora del paleontólogo: con un escaso número de huesos, infiere como era la estructura ósea. El sistema visual coge
pistas y las integra, reconstruyendo así la imagen que ve.
La información que extrae el cerebro son invariancias (como es la estructura del terreno que tenemos delante).
Gradientes de densidad o comprensión de la textura: Tenemos diferentes gradientes:
Gradiente de densidad de textura.
De perspectiva.
De comprensión de la textura.
Consisten en fuentes de información sobre la tercera dimensión. Cada superficie refleja la luz incidente de
forma peculiar, comprimiéndose la textura (aumentando densidad) conforme se alejan del observador (A).
Mediante los gradientes también podemos comprender la orientación de superficies (B) y las discontinuidades
del terreno (C), ya que producen patrones característicos de energía lumínica.
1.2. Claves de profundidad
Claves de profundidad:
Fisiológicas:
o Convergencia ocular
o Acomodación del cristalino
o Disparidad retiniana.
Monoculares o pictóricas: perspectiva, solapamiento, sombreado…
Dinámicas: paralaje del movimiento.
1.3. Claves de profundidad fisiológica
1.3.1. Convergencia ocular
Como tenemos visión binocular, la focalización del objeto percibido requiere que los músculos oculares hagan girar cada uno de los ojos hasta
converger en la percepción, para que tengamos una sola imagen de él. El ángulo de convergencia que fo rman los dos ojos con el objeto que se
percibe, aumenta a medida que el objeto se encuentra más próximo. Como más lejos está el punto, menor ángulo; a menor distancia, mayor
amplitud angular correlación negativa.
pf3
pf4

Vista previa parcial del texto

¡Descarga Visión 3D: cómo el cerebro crea profundidad a partir de imágenes 2D. - Prof. Aznar Casanov y más Apuntes en PDF de Psicología de la Percepción solo en Docsity!

PERCEPCIÓN DEL ESPACIO

1.1. Diferentes planos de profundidad

Problema de la percepción de la profundidad: las imágenes que captan la retina son bidimensionales, son planas (tienen altura y anchura). A partir de la información de los dos ojos podemos reconstruir la idea de la profundidad. Lo que capta el ojo izquierdo no es exactamente igual que lo que capta el ojo derecho. Cada ojo capta más de su parte de la imagen → espacio visual percibido. Los conos nos dan pistas que nos hacen calcular más o menos las distancias. El gran problema de la percepción del espacio la planteó un obispo americano. Se preguntaba ¿cómo es posible que el cerebro, a partir de imágenes 2D, construya imágenes 3D? Tenemos consciencia de ver el mundo con un solo ojo → hablamos de que tenemos visión ciclópea, ya que se fusionan las imágenes de los dos ojos. Existen dos teorías para explicar la visión 3D:

  • Teoría de la percepción directa (enfoque realista): asegura que captamos la realidad directamente, sin intermediarios. Sintonizando las dos imágenes, el cerebro reconstruye la información que hay en el mundo y la plasma en la consciencia visual. Según esta teoría el cerebro es un dispositivo receptor de la información, está diseñado para construir. No tiene muchos seguidores, ya que es difícil de demostrar.
  • Teoría inferencial y constructivista (enfoque empirista): es la más extendida. A partir de detalles de la imagen 2D se construye la imagen

3D (de lo particular a lo general → inferencia). A partir de la experiencia, se asumen las pistas que nos llegan. Esta teoría tiene más

evidencia empírica. Neisser se planteaba si la naturaleza estaba dentro de nuestra cabeza. o Metáfora del paleontólogo : con un escaso número de huesos, infiere como era la estructura ósea. El sistema visual coge pistas y las integra, reconstruyendo así la imagen que ve. La información que extrae el cerebro son invariancias (como es la estructura del terreno que tenemos delante). Gradientes de densidad o comprensión de la textura: Tenemos diferentes gradientes:

  • Gradiente de densidad de textura.
  • De perspectiva.
  • De comprensión de la textura. Consisten en fuentes de información sobre la tercera dimensión. Cada superficie refleja la luz incidente de forma peculiar, comprimiéndose la textura (aumentando densidad) conforme se alejan del observador (A). Mediante los gradientes también podemos comprender la orientación de superficies (B) y las discontinuidades del terreno (C), ya que producen patrones característicos de energía lumínica.

1.2. Claves de profundidad

Claves de profundidad:

  • Fisiológicas : o Convergencia ocular o Acomodación del cristalino o Disparidad retiniana.
  • Monoculares o pictóricas : perspectiva, solapamiento, sombreado…
  • Dinámicas : paralaje del movimiento.

1.3. Claves de profundidad fisiológica

1.3.1. Convergencia ocular

Como tenemos visión binocular, la focalización del objeto percibido requiere que los músculos oculares hagan girar cada uno de los ojos hasta converger en la percepción, para que tengamos una sola imagen de él. El ángulo de convergencia que forman los dos ojos con el objeto que se percibe, aumenta a medida que el objeto se encuentra más próximo. Como más lejos está el punto, menor ángulo; a menor distancia, mayor amplitud angular → correlación negativa.

Todo lo que esté más lejos de 18 metros, se tiene que aportar otro tipo de información, ya que está demasiado lejos. Solo podemos captar de 0 a 8 metros para calcular la distancia del ángulo de convergencia, ya que, a partir de 8 metros, la distancia ya casi es paralela y el ángulo no nos sirve para calcular. La clave de profundidad que subministra la convergencia no consiste en el cálculo del ángulo, sino en la sensación propioceptiva proporcionada por los músculos oculares al realizar los movimientos de convergencia. Es decir, la tensión orbital de los ojos, que es elevada cuando el objeto se encuentra cerca (Angulo B), y relajada cuando está lejos (Angulo A).

1.3.2. Ángulo de convergencia y distancia

Sensación propioceptiva proporcionada por el grado de contracción muscular de los músculos ciliares responsables del incremento-decremento de la convexidad del cristalino. El cristalino es una lente intraocular y tiene un grosor variable: pude ser plano (objeto lejano) o abombado (objeto próximo). Los músculos ciliares ajustan el cristalino para acomodarlo y, por tanto, el grado de contracción o relajación que determina si está aplastado o abombado. → Objeto lejano: relajado, aplastado. A más de 8 metros, ya no aporta más información. → Objeto próximo: tenso, abombado. La acomodación opera entre 0 y 8 metros. Borrosidad : se produce cuando desenfocamos. Cataratas : las cataratas son opacidades en el cristalino. En las operaciones se quitan capas de cristalino para eliminarla siempre que tenga un color amarillento o pardo. También se puede realizar un implante de una lente ocular. Investigaciones en operaciones de cataratas, donde se extrae a los pacientes el cristalino, luego presentan dificultades en la estimación de distancias. Vista cansada : la vista cansada se empieza a desarrollar sobre los 40-50 años. El cristalino pierde elasticidad y se queda rígido-endurecido y su grosor no varía.

1.3.3. Disparidad retiniana

Los seres humanos a pesar de disponer de dos ojos que captan dos perspectivas visuales ligeramente solapadas, experimentamos una única imagen que situamos en el centro de la distancia interpupilar. Algo así como lo percibiría el ojo del cíclope de Polifemo descrito en la obra “La odisea”. Además, tenemos conciencia de experimentar un mundo, una realidad tridimensional. Las imágenes de los objetos y escenas que se proyectan sobre nuestras dos retinas son representaciones bidimensionales (planas). ¿Cómo, a partir de dos imágenes planas, el sistema visual llega a formar una sola imagen y en relieve? En la especie humana adulta, la distancia interpupilar promedio es de unos 65mm. Cada ojo abarca un ángulo visual de unos 150º. Existe una superposición de las imágenes captadas por los dos ojos, que da lugar al campo visual captado de, aproximadamente 164º. La diferente ubicación espacial de los dos ojos, susceptibles de enfocar a un mismo objeto, tiene como consecuencia que las imágenes captadas por cada ojo, en un determinado instante no sean exactamente iguales. En otras palabras, cada ojo capta una perspectiva ligeramente distinta, aspecto que se conoce como paralaje binocular y que posibilita la percepción de la profundidad o visión tridimensional (3-D) y la estereopsis visual. Así pues, como consecuencia de que la distancia interpupilar es de, aproximadamente, 6.5 cm en la especie humana adulta, con el ojo izquierdo percibimos algo más del lado izquierdo del objeto y con el ojo derecho algo más del lado derecho del objeto. De esta manera podemos localizar un objeto en el espacio, es decir, podemos informar si el objeto está al frente, a nuestra izquierda o a nuestra derecha. Estrabismo : un ojo mira directamente al objeto y el otro está desviado hacia dentro, fuera o abajo.

1.5. Claves de profundidad monoculares o pictóricas Son todas aquellas que pueden captarse con un solo ojo. También son, a veces, llamadas pictóricas por haber sido ampliamente utilizadas por los pintores, al objeto de provocar en el observador, mediante estos recursos representacionales, una sensación de profundidad. Perspectiva lineal: Numerosas ilusiones visuales se producen como consecuencia de aplicar claves de perspectiva a representaciones 2D que no corresponden con los objetos o situaciones 3D de la realidad. Ej: ilusión de Müller-Lyer de las flechas. Punto de desvanecimiento : punto donde todas las líneas confluyen. Se comprime el tamaño de una forma creíble, siguiendo las leyes de la profundidad, igual que la distorsión. Ley del ángulo visual o ley de Emmert: La ley del ángulo visual correlaciona de modo perfecto con el tamaño de la imagen retiniana. La tangente inversa del ángulo visual puede calcularse mediante el cociente entre el tamaño real del objeto y la distancia real del observador. Ambigüedad de la forma en la retina: Un objeto conocido, al observarlo de lejos proyecta una imagen en la retina más pequeña que el mismo objeto de cerca. El tamaño de un objeto proyectado en la retina resulta ambiguo para juzgar su tamaño real. Como se desprende de la ley del ángulo visual, debemos considerar la distancia de observación, para compensar la tendencia a la constancia del tamaño. Es decir, existe ambigüedad en la imagen retiniana respecto el tamaño real del objeto, cuando no se tiene en cuenta la distancia de observación. El tamaño relativo aparente se calcula mediante la tangente del ángulo y la distancia → Lejanía y difracción de la luz (blurring): Dada la dispersión de la luz por la atmósfera (difracción), tendemos a percibir lo próximo de manera más nítida, clara y con contornos definidos, y lo lejano difuminado, borroso y desdibujado. Solapamiento u oclusión: los objetos ocluidos parcialmente se hallan detrás (más lejos) de los objetos oclusores (más cerca). Altura angular: si los objetos se sitúan sobre el propio terreno, cuanto a mayor altura de la línea de terreno se encuentren, inferimos que están más alejados en profundidad (hombres). Los objetos por encima del terreno, cuanto menos arriba se encuentren, más cerca o próximos al observador los percibimos. Dirección de la luz y las sombras: Normalmente, las fuentes de iluminación se sitúan a lo alto, por lo que estamos condicionados a percibir la direccionalidad de la luz de arriba hacia abajo, y la sombras se proyectan en la base de sustentación de los objetos (abajo). Es decir, luz arriba, sombra a bajo. Ej. Al observar la fotografía de los cráteres de la luna, solemos percibir los cráteres en bajo-relieve (hundidos en profundidad) y el terreno circundante a éstos sobre- relieve (más elevados). Si invertimos esta fotografía, se invierte la direccionalidad de la luz y la sombra, de modo que lo percibimos al revés. En la primera imagen, el relieve se percibe que sobresale del terreno, mientras que en el segundo, lo percibimos hundido. Los gradientes de claro-oscuro (líneas negras sobre fondo claro) como elevados o hundidos, de acuerdo con la dirección percibida de la luz y sombra. Por la misma razón percibimos las letras en relieve: The hollow mask illusion : Podemos percibir la imagen de la parte interna de una máscara en relieve, como si fuese una fotografía de la parte exterior, debido a que se ha manipulado la dirección de la luz que ilumina. De modo que se invierte la percepción en relieve.