Vista previa parcial del texto
¡Descarga Audición II. Munar capítulo 14 y más Apuntes en PDF de Psicología solo en Docsity!
14. Percepción de la tonalidad y de la sonoridad Luis E. López-Bascuas Este capítulo centra su atención en los procesos que conducen a realizar atribuciones tonales y de sonoridad con respecto a los estímulos fisicos que impresionan nuestro sistema auditivo, Como en el capitulo anterior, el énfasis es fundamentalmente psicofísico por lo que no se tratarán los detalles de la implementación biológica. Asimismo, se trata de poner de manifiesto cómo la maquinaria esbozada en el capítulo anterior resulta ser eficaz para la codificación de las propiedades señaladas. Así, se co- mienza estudiando la percepción de la tonalidad, tanto en estímulos sim- ples como complejos. En ambos casos existe una polémica abierta acerca del tipo de información (temporal o espectral) que se utiliza para poder codificar la tonalidad del estímulo. Por ello, a lo largo del capitulo se de- tallan unos modelos y otros, presentando la evidencia experimental que favorece a cada uno de ellos. Posteriormente se pasa a estudiar la codifi- cación de la sonoridad, también tanto para el caso de sonidos simples como para el caso de sonidos complejos. En esta sección se revisan los datos fundamentales que posibilitan la elaboración de escalas y los expe- rimentos de adición de la sonoridad que permiten formular modelos con- cretos para dar cuenta de cómo el sistema auditivo codifica la sonoridad de los estímulos. | 1. Percepción de la tonalidad La tonalidad es el atributo psicológico que nos permite exdenar los sonidos en una oscala tal que en un extremo se sitúan los sonidos más graves y, en el otro, los sonidos más agudos. Á veces, también se define como la dimen- sión psicológica que posibilita la ordenación de los sonidos en una escala 1. De hecho, si se varía la tonalidad a lo largo del tiempo, cl sujeto percibe una sensación de melodía. Debe quedar claro, por tanto, que siem- pre que hagamos referencia a la tonalidad de un sonido estamos aludiendo Luna sensación psicológica provocada por dicho sonido y no a una variable fisica constituyente del mismo. Obviamente, esto no quiere decir que la percepción de la tonalidad no esté apoyada en variables físicas, simplemen- te quiere decir que no se da una correspondencia directa entre las variacio- nes en las maguitudes de la estimulación y las consecuencias perceptivas que tales variaciones provocan. Ta variable física más estrechamente relacionada con la atribución de lo- nalidad a los sonidos es la tasa de repetición de la obda acústica. Un los so- nidos simples (tonos puros) esta tasa se cefiere a la frecuencia temporal de la señal (v) en tanto que, en los sonidos complejos, se refiere a la frecuen- cia fundamental del estimulo (v,). Por supuesto, esto constituye una mera aproximación al problema de fa codificación de la tonalidad, En las scecio- nes siguientes se estudiarán más detalladamente algunas de las dificultades que aparecen al tratar de aclarar cómo el sistema auditivo realiza atribucio- nes tonales ante la presentación de sonidos, La definición de tonalidad dada hasta el momento cs útil conceptual- mente pero poco adecuada para proponer experimentos concretos que per- mitan entender su naturaleza, Por eso, es preciso proporcionar una definición operativa de tonalidad. Así, se dice que la tonalidad de una determinada señal periódica se corresponde con la [rceuencia del sinuscide que gencra una sensación tonal idéntica a la de la señal en cuestión. No es de extrañar, por lo tanto, que uno de los métodos más profusamente utilizados cn las investigaciones realizadas acerca de la percepción de la lonalidad sea el del emparejamiento de tonalidades. En este método, el sujeto debe ajustar la frecuencia de un estímulo de referencia hasta que la tonalidad percibida sea la misma que la que tiene el estímulo test. Aunque. como hemos di- cho, el estimulo de referencia suele ser un sinusoide, a veces se utilizan otro tipo de estímulos como los trenes de impulsos (estímulo que será des- crito más adelante). La razón es que el timbre del sinusoide suele ser muy diferente al timbre del estimulo complejo objeto de estudio, Lin cstas con: diciones es dificil realizar los emparejamientos dado que ello implica ig. norar dimensioves físicas que hacen claramente diferentes a los estímulos que están siendo emparejados. En ocasiones, para paliar aún más este últi- mo problema se utilizan en los experimentos sujetos con cierto entrena- miento musical, Aunque podría pensarse que quizá sus resultados no scan musi loa 490 representativos de la población general de sujetos, los estudios realizados hasta el momento parecen indicar que no hay diferencias sustantivas entro los datos que proporcionan sujetos ingenuos y sujetos con entrenamiento musical. Se prefiere a estos últimos porque la variabilidad de los datos que proporcionan estos sujetos es mucho menor que la que se obtiene con los primeros. Antes de pasar a estudiar con más detenimiento cómo se codilica la to- nalidad en distintos tipos de estímulos, vamos a esbozar Jas grandes tradi- ciones que hemos heredado a este respecto, ya que estos modos de pensar se proyectan, en mayor o menor medida, en las teorías contemporáneas yea de la percepción de la tonalidad, tanto para el caso de los estímulos simples como para el de aquellos otros más complejos. Una de estas tradi- ciones está inspirada en los trabajos Hevados a cabo por investigadores de la talla de Obm tcuya ley fue citada en el capitulo anterior) y Helmholtz. Este último autor publica en la segunda mitad del siglo xIx varios trabajos que sentarán las bases de la llamada teoría del lugar de la percepción de la tonalidad. Aunque formulada de modos algo diferentes a lo largo del icm- po, podríamos resumir esta teoría en dos postulados diferentes, El primero afirma que el sistema auditivo realiza un análisis espectral del estímulo con una resolución determinada, esto es, diferentes frcenencias (o conjunto de frecuencias) excitan distintos subsistemas de codificación (distiotas bandas eríticas). O en otros términos, tonos de frecuencias distintas ocasionan má- ximos on lugares diferentes de la membrana basilar. Este postulado, tal y como vimos en el capítulo anterior, esta Mrmemente consolidado por los re- sultados experimentales obtenidos hasta el momento. El segundo sostiene que Ja tonalidad finalmente percibida depende del patrón de excitación ob- servable a través de los distintos subsistemas de codificación. Así la tonali- dad de un sonido elemental se correspondería con cl lugar de máxima exci- tación, es decir, con la frecuencia de pico de la banda crítica máximamente activada. Lamentablemente, este segundo postulado sigue siendo objeto de una enconada disputa. Ta segunda de las tradiciones a las que aludimos proviene de los trabajos realizados por Rutherford y Seebeck, también hace más de cien años. Estos autores inspirarán un conjunto de leorías que deno- minaremos temporales porque suponen que la percepción de la tonalidad depende del patrón temporal de respuesta al estimulo producido por el sub- sistema de codificación pertinente. Al igual que para la teoria anterior, tam- bién en este caso existen mecanismos [isiológicos capaces de levar a cabo esta tarca. Recordemos que, tal y como exponiamos en el capítulo anterior el fenómeno de la sincronización en fase hace que los intervalos de disparo de las fibras del nervio auditivo sigan un patrón regular, al menos para un rango determinado de frecuencias. En conercto, los intervalos de tiempo entre disparos sucesivos resultan ser múltiplos enteros del periodo de la s ñal y, por tanto, a partir de estas respuestas es posible dorivar la frecuencia del estímulo. 491) 1000 500 pi 4 1 1 1 4 125 250 5001.000 2.000 4.000 6.000 8.000 12.000 Frecuencia Figura 14.2. Unbrales diferenciales de Irecuencia (UDF2) obtenidos en distintos estudios. Se añaden los resultados obtenidos por Shower y Bidduliph (1931) (linea discontinua) para facilitar la comparación de los UDFI con los UDF2, Adaptado de Wier. Jesteadt y Green (1977), ser comparados con el resto de datos. En esta ocasión en el eje de ordena- das aparece, directamente, la magnitud del UDE, Av, En primer lugar, cabe señalar la falta de correspondencia que se da entro los UDI'1 y los UDF2. En general los UDFI varían menos con la frecuen- cia que los UDF2 aunque para frecuencias medias y altas podría decirse que cl patrón de resultados cs, al menos, análogo. Centrándonos ahora en los resultados de los experimentos donde se han medido UDF2 observamos como la función que relaciona la frecuencia del estímulo con Av es una función monótona creciente, Esto significa que conforme se aumenta la frecuencia del estimulo más difícil es detectar un cambio cn la frecuencia del mismo. Cualitativamente al menos, estos resultados scrían consistentes con los datos ya estudiados acerca de la resolución de frecuencias que pro- senta el sistema auditivo. Recuérdese que la anchura de banda de las ban- das críticas aumentaba según crecía la frecuencia de pico de la misma y, por tanto, cabe esperar una peor resolución del sistema en la zona de altas frecuencias. Esta observación sería consistente con las teorías del lugar. Sin embargo, cl problema se plantea cuando se trata de justificar los datos cuantitativamente dado que la capacidad de discriminación de frecuencias, al menos en cierto rango, es extraordinariamente fina. Es sabido, por ejem- plo, que el UDF2 para un tono de 1,000 Flz está en torno a 2 Hz. No obstante, sc ha intentando responder a la demanda anterior estudian- do las representaciones internas (los patrones de excitación) generadas por 494 el sistema de bandas críticas ante dos estímulos de frecuencias mínimamen- te discriminables. Supongamos que presentamos al sujeto dos tonos puros cuyas frecuencias respectivas son 995 y 1.005 Hz, Las representaciones ge- neradas por el conjunto de filtros auditivos son las que aparecen en la Figu- ra 3. El modelo (propuesto por Zwicker, un investigador del instituto Elec- troacústico de la Universidad Técnica de Munich) asume que para detectar un cambio en frecuencia es preciso que el nivel de excitación diferencial de las representaciones correspondientes supere un umbral determinado (que Zwicker sugirió que podría estar en torno a | dB) para cualquier frecuencia del patrón de excitación, Es sabido que la pendiente del lado do bajas fre- cuencias (que es el más «brupto y, por tanto, en cl que es más fácil apreciar los cambios en el nivel de excitación) os constante cuando se expresa Ch unidades de anchura de banda crítica (barks). En conercto, la pendiente re- sulta ser de 27 dB/bark. En estas condiciones es sencillo predecir, ya que el valor del umbral diferencial para una determinada frecuencia será 1/27 de la anchura de banda crítica para esa frecuencia (nótese que un cambio en frecuencia de 1/27 de bark debe producir un cambio de 1 dB en el nivel de excitación correspondiente). Pues bien aunque los UDFL se ajustan bien a las predicciones del modelo, los UDF2 no. Estos últimos tienden a ser más pequeños que lo que cabría osperar para las bajas frecuencias y mayores gue lo esperado para las frecuencias altas. Por lo tanto, parece que aunque algún tipo de mecanismo basado en las teorías del lugar podría dar cuenta de parte de los datos, se necesita algún otro tipo de sistema (quizá basado en información temporal) para cubrir el conjunto de las observaciones. De hecho existe más evidencia que apunta en esta misma dirección pro- veniente de experimentos completamente diferentes quo están relaciona- dos con la percepción de la música, Como ya se dijo al comienzo de esta sección, una secuencia de tonos provoca en el sujeto que los percibe una sensación de melodía. Sin embargo, esto sólo ocurre en un rango de fre- cuencias, tal y como han puesto de manifiesto los experimentos de trans- posición musical llevados a cabo por Attneave y Olson en los años setenta. La tarca de los sujetos experimentales consistía cn transponer una melodía de una región de la escala musical a otra diferente. Pues bien, la tarea sólo podía ser realizada con precisión cuando las frecuencias de los tonos impli- cados se situaban por debajo de los 5 kHz. De hecho, parece que con rela- ción a la percepción de la tonalidad, los 5 KHz marcan una frontera natural que delimita dos ámbitos de actuación distintos, tanto para el sujeto que percibe, como para los mecanismos del sujeto que posibilitan dichas per- cepciones. Así, parece que la sensación de tonalidad musical sólo se produ- ce cuando se utilizan tonos con frecuencias inferiores a 5 klfz. Para este rango de frecuencias se ha sugerido que los mecanismos activos a la hora de codificar la tonalidad bicn podrían ser de naturaleza temporal, Sin em- bargo, frecuencias superiores a 5 kHz deberían ser codificadas por maca- nismos basados en las teorias del lugar. Los datos fisiológicos de los que se 495 Ela Perceprión 50 40 30 | Excitación (d8) 20 + 10 Pp ma 1 1 800 1.000 1.200 1.400 1.600 El Frecuencia central Figura 14.3. Patrones de excitación correspondientes a un tono de 995 Hz y a un tono de 1.005 Hz. Adaptado de Moore (1989). dispone hoy día son también consistentes con esta interpretación. Recuér- dese que el fenómeno de la sincronización en fasc sólo se produce para es- tímulos cuyas frecuencias sean inferiores, precisamente, a 5 kHz. En el pró- ximo apartado continuaremos con el conflicto que ha existido entre ambos tipos de teorias, esta vez para el caso de los tonos complejos. 1.2 La codificación de la tonalidad en sonidos complejos Recordemos que un tono complejo está constituido por un conjunto de to- nos puros. Si cl sonido complejo puede representarse mediante una función periódica, entonces su espectro estará formado por una frecuencia funda- mental (que se corresponde con la tasa de repetición global del estímulo y que es la frecuencia menor presente en el mismo) y un conjunto adicional de componentes sinusoidales cuyas frecuencias son múltiplos de la fre- cuencia fundamental y que denominamos armónicos. La pregunta que se han planteado los investigadores hace referencia a la contribución que reali- za cada uno de los componentes al codificador de tonalidad del sistema de procesamiento. Así en 1841 y 1843 aparecen sendas publicaciones de See- beck y Ohm en el Annalen fúr Physik und Chemie donde se exponen con claridad dos posturas contrapuestas. Ohm sostenía que el sistema auditivo [RIN realizaba una análisis de frecuencias del estímulo de modo que podrían re- solverse —al menos parcialmente-- los componentes individuales dol soni- do complejo; la tonalidad percibida estaría determinada por el componente fundamental (el de más baja frecuencia) del estímulo en cuestión. Es decir, la energía asociada a la frecuencia fundamental del estímulo sería la res- ponsable de que el sujeto percibiera una tonalidad u otra. Sin embargo, existen fenómenos que se resisten a esta explicación, al menos en los térmi- nos en los que aquí ha sido presentada. Quizá el más claro de todos ellos sea el que se conoce como percepción del fundamental ausente. Para enten- derlo imaginemos un estímulo periódico (por ejemplo un tren de impulsos) con una frecuencia fundamental de 250 Hz. Tal estímulo tendrá energía, además, en 500, 750, 1.000, 1.250... Hz. Si se realizan los experimentos pertinentes, es posible probar que la tonalidad percibida en este estímulo se corresponde, tal y como predeciría Ohm, con la tonalidad de un sonido ele- mental con una frecuencia de 250 Hz, Supongamos ahora que filtramos el estímulo con un filtro paso-alto con una frecuencia de corte de 300 Hz. En estas coudiciones, ol estímulo, una vez procesado por el filtro, contendrá Únicamente las frecuencias que estén por encima de la frecuencia de corte, esto es, el componente fundamental habrá desaparccido del estímulo y, por tanto, no habrá energía en el sonido resultante asociada a tal componente. A pesar de ello, la tonalidad percibida sigue siendo la misma. Obviamente este resultado no es tranquilizador para los partidarios de los modelos del lugar, Seebeck, en una línea de trabajo parecida, llevó a cabo un experimento simple y directo que ponía de manifiesto las deficiencias de los modelos clásicos del lugar. A mediados del siglo pasado no era fácil generar estímu- los acústicos y Seebeck tuvo que recurrir a una solución ingeniosa. Cons- truyó un disco que sujetó a una plataforma giratoria. Tras la plataforma, en un lugar detorminado, se colocó un dispositivo que expulsaba aire a una determinada presión. Si ahora abrimos un orificio en el disco y hacemos gi- rar la plataforma a una velocidad constante, gencraremos un estímulo periódico consistente en un tren de pulsos de aire. Si el disco tarda T se- gundos en dar una vuelta completa, habremos generado un estímulo con un periodo igual a T. Como es fácil imaginar, es posible producir estímulos di- ferontes si utilizamos discos en los que se hayan abierto orificios de modos diversos. En la Figura 14.4 aparoccen los tres estímulos usados por Scebeck en su experimento y sus espectros correspondientes. La sirena de la fila a genera- ra un tren de impulsos de periodo T y, por la tanto, su frecuencia funda- mental será 1/T. Por eso su espectro tiene energía en 1/T y en sus múltiplos. En la sirena b hemos abierto un orificio adicional situado en el otro cxtre- mo del diámetro del disco. Si la velocidad de rotación de la plataforma se mantiene constante, obtendremos ahora un estímulo cualitativamente idén- tico al anterior pero con un periodo igual a la mitad del periodo correspon- 97M Percepción 1.2.1 Modelos temporales o sintéticos Resultados como los de Seebeck y Licklider impulsaron la formulación de modelos de la percepción de la tonalidad basados en información temporal o, si se prefiere, modelos que toman la periodicidad de la señal como la clave esencial que permite predecir las atribuciones tonales del sistema au- ditivo ante los sonidos complejos. Quizá sea Schouten quien en una serie de brillantes experimentos llevados a cabo en la década de los treinta con- solida este acercamiento a los problemas que plantea la percepción de la to- nalidad. Schouten utilizó un equipo más sofisticado (aún muy distante del utilizado hoy día en nuestros laboratorios) que el que usara Seebeck un si- elo atrás, de modo que el control sobre sus estímulos pudo realizarse de forma más rigurosa. Más en concreto, Schouten utilizó una sirena óptica para generar trenes de impulsos. El sistema contenía un conjunto de máscaras a las que se podía hacer girar de modo que éstas determinaban el patrón de luz que alcanzaba a una célula fotosensible la cual, a su vez, controlaba la for- ma de onda que se presentaba a través de un altavoz. El sistema de másca- ras permitía eliminar de modo selectivo los armónicos deseados de modo que Schouten pudo, por ejemplo, proporcionar los datos, comentados ante- riormente, referidos a la percepción del fundamental ausente. Además del fenómeno del fundamental ausente, otros experimentos pusieron de relieve, como acabamos de apuntar, la importancia de las claves temporales en la percepción de la tonalidad. Nótese que, por ejemplo, podría argumentarse, en contra de los modelos temporales, que es la separación entre armónicos resueltos lo que determina la tonalidad percibida. Sin embargo, Schouten sugirió que eran precisamente los armónicos no resueltos (de alta frecuen- cia) los que ocasionaban la percepción de la tonalidad virtual. Al no resol- verse dichos armónicos (debido a que la anchura de banda de los filtros sintonizados a frecuencias altas no es suficientemente estrecha) el sujeto no puede hacer uso de la separación que existe entre ellos. Aunque la salida del filtro correspondiente estará constituida, necesariamente, por un tono complejo (producto de la interacción de los armónicos que son procesados por ese filtro), el periodo fundamental del mismo se corresponderá con el del estimulo. La Figura 14.5 ilustra la respuesta del modelo de bandas críticas (presen- tado en el capítulo anterior) ante un tren de impulsos con una tasa de repeti- ción de 200 impulsos por segundo. A la izquierda aparecen las FTM de los filtros auditivos. Se ha asumido anchura de banda del filtro es proporcional a su frecuencia de pico. A la derecha aparece la respuesta de cada uno de ellos. Los armónicos de baja frecuencia son procesados por filtros distintos y, por esa razón, resueltos. Así la salida de la banda crítica es un sinusoide de la frecuencia correspondiente. Sin embargo, los armónicos de alta fre- cuencia acaban interactuando entre sí. Por ejemplo, la banda crítica centra- da en 5.000 Hz tiene una anchura de banda aproximada de 800 IIz por lo 500 Salidas AAA 1 1 ?.2R88R38 Atenuación Estímulos: pulsos periódicos Figura 14.5. Rospuesta del modelo de bandas críticas anto un trco de impulsos con una tasa de repetición de 200 impulsos por segundo, Adaptado de Green (1988). que los armónicos 23, 24, 25, 26 y 27 del tren de impulsos serán procesa- dos por ese filtro. Tal y como anunciábamos en el párrafo anterior, aunque la salida de la banda crítica es un tono complejo, el periodo fundamental del mismo se corresponde con la frecuencia fundamental del tren de impul- sos (5 ms). Para probar que, de hecho, los sujetos usan esta información en sus decisiones lonales, Sehouten elaboró dos trones de impulsos. El prime- To era un tren de impulsos ordinario con una frecuencia fundamental de 400 Hz, El segundo, un tren de impulsos con polaridad invertida cuya frecuen- cia fundamental era 200 Hz. Lo interesante de este último estímulo es que OT su espoctro de amplitud sólo tiene armónicos impares. Asi, el primer tren de impulsos contenía la siguiente serie de armónicos; 400, 800, 1.200, 1.600, 2.000... Hz; cl segundo, por su parte tenía energía en 200, 600, 1.000, 1.400, 1.800... Híz. Nótese que la separación en frecuencia entre los distintos armó- nicos es la misma en ambas series por lo que si ésta fuera la clave usada por los sujetos para derivar la tonalidad del estímulo, entonces la tonalidad per- cibida debería ser idéntica en ambos casos. Sin embargo, los sujetos efec- tuaron emparejamientos tonales que seguían el periodo temporal de cada uno de los trenes de impulsos, corroborando la idea de que son las claves temporales las que determinan la tonalidad virtual percibida. Otro hecho experimental que apoya las conclusiones anteriores es el de- nominado fenómeno del cambio tonal. Los trabajos llevados a cabo por de Boer o por el propio Schouten y sus colaboradores proporcionan datos re- levantes a cste respecto. Supongamos que presentamos al sujeto un estí- mulo constituido por los componentes espectrales de 1.800, 2.000 y 2,200 Hz. El fundamental es 200 Hz y la separación entre armónicos es también 200 Hz. En estas condiciones (caso A), los sujetos perciben una nítida to- nalidad virtual que se corresponde con la de un tono puro de 200 IIz (aun- que, por supuesto, con un timbre diferente). Pero supongamos ahora (caso B) que construimos una serie no armónica modificando, ligeramente, la frecuencia de los componentes, situándolos, por ejemplo, en 1.850, 2.050 y 2.250 Hz. La separación entre armónicos sigue siendo 200 Hz y sin em- bargo, la tonalidad virtual percibida no sc corresponde con esa frecuencia, sino con una ligeramente superior (208 Hz). Además, en estos casos en los que se utilizan series no armónicas, se suelen producir tonalidades virtua- les ambiguas, en el sentido en que los sujetos pueden proporcionar más de un emparejamiento, Como es natural, las teorías temporales invocan claves basadas en la periodicidad de la señal procesada para dar cuenta de estos resultados. La salida del filtro correspondiente a la seric presentada en el caso Á aparece en el panel superior (a) de la Figura 14.6. Este caso os rela- tivamente sencillo. La onda se repite claramente cada 5 ms, periodo que se corresponde con el componente fundamental (ausente) del estímulo y esto desencadena en el sujeto la sensación de tonalidad virtual correspondiente a 200 Hz. Si volvemos nuestra atención al caso B, la situación se torna más complicada. Ahora, la salida del filtro es una señal con un periodo de 20 ms, pero es claro que, dentro de cada periodo, se puede considerar que la señal muestra una estructura cuasiperiódica. En nuestro caso se pueden apreciar cuatro pseudociclos fácilmente reconocibles. Los modelos tempo- rales o sintéticos asumen que, en estos casos, el sujeto calcula la distancia entre picos que ocurren dentro de los pseudociclos, por ejemplo, las dis- tancias tl y 12 que aparecen en el panel central de la Figura 14.6. Es decir, se supone que los sujetos analizan lo que se suele denominar estructura fina de la señal. Estos cálculos pueden explicar tanto el cambio percibido en tonalidad virtual como el hecho de que dicha tonalidad virtual sea am- > 502 Componentes; 1800, 2000 y 2200 Hz Poe e F Componentes: 1850, 2050 y 2250 Hz Pob 1 k— lo —A M $ bl Jl | Componentes: 1900, 2100 y 2300 Hz == == == "| par pi mi Po r HH 1008 — Figura 14.6. Salidas del filtro correspondiente para cada wo de los estimulos que se indican en la figura (para detalles véase el texto). Adaptado de Green (1988). bigua. El panel c muestra una situación semejante pero con componentes diferentes. j Como suele acontecer, los modelos temporales no están exentos de pro- blemas. Uno de ellos se refiere al denominado principio de dominancia, concepto acuñado por Ritsma, uno de los estudiantes de Schouten. La idea que hay detrás del concepto es relativamente sencilla. Acabamos de insistir en que, para los modelos temporales, la interacción entre armónicos es con- dición esencial para la codificación de la tonalidad virtual. Como sabemos es más probable que los armónicos interactúen si su frecuencia es mayor Percepci gaussianas de media v, y una varianza tal que solo depende de v,. Así pues, ón de las distinitas frecuencias está sujeta a error y es ignorada amplitudes y a las fases de las mismas. Aun- críticas parece firmemente estableci- la representac la información relativa a la que el funcionamiento de las banda do, la función que relaciona el error con la frecuencia está sujeta a algunos inconvenientes. En concreto, el valor de la desviación típica relativa (vv disminuye desde un valor de 003 para una frecuencia de 100 Hz hasta un valor de 0007 en el rango de 1.000 a 3.000 Hz, para después empezar a aumentar por encima de esa frecuencia. Estos resultados no son consis tentes ni con las medidas de resolución de frecuencias (como la anchura de banda crítica) ni con las medidas de discriminación de frecuencias (como el umbral diferencial para tonos puros). Así, el umbral diferencial para una determinada frecuencia es típicamente más pequeño que la varianza error asociada a tal frecuencia. No obstante, no hay que olvidar que los procedi- mientos experimentales utilizados para estimar ambos valores son cla- ramente diferentes y estas diferencias bien podrían estar en la base de las discrepancias encontradas. En cualquier caso, la salida del primer dispositi- vo es una serie de números que serán tratados por el segundo dispositivo del modelo: un procesador central, Este procesador central trata de determi- nar la frecuencia fundamental y los sucesivos armónicos de modo que éstos se ajusten a las frecuencias computadas por el primer dispositivo. Para ello se sigue un procedimiento de máxima verosimilitud. Puede ocurrir que el ajuste sea bueno o malo. Si es bueno, el modelo predice que el sujeto perci- birá una sensación tonal clara; si es malo la sensación tonal será débil y po- siblemente ambigua, en tanto en cuanto pueden existir distintas estimacio- nes de la frecuencia fundamental que generen series armónicas más O menos cercanas a las representadas en el primer dispositivo. Así, en el ejemplo de cambio tonal que estamos manejando, si el procesador central estima un fundamental de 204 Hz, la serie armónica predicha será: 1.836, 2.040 y 2.244 Hz (armónicos 9, 10 y 11), valor ,onablemente próximos a los presentes en el estímulo. Como es fácil comprobar, el modelo predice bien las ambigúedades observadas en la asignación de tonalidad virtual en torno a 185 y 227 Hz. De hecho un fundamental de 185"5 Hz genera la se- rie 1.855, 2.040'5 y 2.226 Hz, y, por su parte, un fundamental de 226'7 Hz proporciona la siguiente predicción: 1.8 136, 2.0403 y 2.267 Hz. Un último modelo estrictamente espectral que conviene estudiar es el propuesto por Terhardt a mediados de los años setenta. A diferencia del mo- delo de Goldstein, el de Terhardt está expresado de manera determinista y, además, pretende incluir una fase de aprendizaje donde se supone que el su- jeto (a lo largo de su vida) llega a asociar una determinada frecuencia con los subarmónicos de esa frecuencia. En cierto sentido, además, puede enten- derse el modelo como una vuelta a las ideas de la Gestalt en la medida en la que supone que la atribución de tonalidad virtual está regida por ciertos principios holísticos. No obstante, en vez de detenernos en la justificación 2506 14. Pi 'ercepción de la tonalidad y la sonoridad de estas ideas, vamos a exponer la mecánica de cálculo que utiliza el mode- lo de Terhindt para la especificación de la tonalidad virtual. En primer lu- gar, el modelo computa los subarmónicos que se corresponden con cada uno de los componentes presentes en el estímulo. En segundo lugar, se clio buye al estímulo la tonalidad correspondiente a la frecuencia que ES subar- mónico del mayor número de parciales. Así, por ejemplo, para el caso, de la serio armónico, con componentes en 1.800, 2,000 y 2.200 Hz procederí mos del siguiente modo: 1) calculamos los sucesivos subarmónicos del pri- mer componente, esto es, 900 (que sería el segundo subarmónico -1.800/2-). 600, 450, etc.: 2) calculamos los subarmónicos del segundo componente a saber, 1.000, 6666, 500, 400, etc.; 3) hacemos lo propio con el tercer am ponente y obtenemos, 1.100, 7333, 550, 440, ete. y 4) observamos que la frecuencia que cs subarmónico del mayor número de parciales es 200 Hz (subarmónico 9 del primer componente, subarmónico 10 del segundo com- ponente y subarmónico 11 del tercer componente). Por lo tanto, el modelo predice que la tonalidad virtual percibida se corresponde con la frecuencia de 200 Hz, que es lo que de hecho obtenemos en los experimentos. Si ES existe una frecuencia concreta común a todos los parciales, el aia asu- me que se ha de escoger cl conjunto de frecuencias más semejantes entre sí Lsta situación se da en el caso de series no armónicas, Así, para muestra qe ne: 1.840, 2.040 y 2.240, se predice una tonalidad virtual de 204 Hz (con- sistente uma vez más con los resultados experimentales) dado que el noveno subarmónico del primer componente es 204'4, el décimo subarmónico del segundo componente es 204 y el undécimo subarmónico del tercer compo- nente es 20363. En estas condiciones parece razonable predecir que la to- nalidad virtual estará en torno a 204 Hz. Además el modelo puede NEGÓ al menos, algunas do las ambigiiedades que se dan en la atribución de tona- lidad virtual ante serics no armónicas. : Hay que señalar que todas las críticas que hicimos a los modelos tempo- rales se convierten ahora on evidencia que favorece a los modelos especíra- les, Recuérdose que los modelos espectrales suponen que la codificación de la tonalidad requiere la resolución de algunos de los parciales del estimulo complejo porque tal codificación se realiza a partir de cstos rarblles To- dos los datos que vimos en la sección anterior en los que se ponía de En tiesto la no necesidad de interacción de parciales o la particular relevancia de las frecuencias medias y bajas en la codificación de la tonalidad son. consistentes con las propuestas de los modelos espectrales. No obstante al igual que los modelos temporales, los modelos espectrales no están exentos de dificultades. Una de ellas se refiere a la denominada región de le cia de la tonalidad virtua). Si los supuestos de los modelos cspastailes sun correctos, sólo debería ser posible tener una sensación tonal virtual Crealo los componentes espcetrales del estímulo se situasen en una determinada región del espectro. En particular, si cl estímulo contiene únicamente armó- nicos de alta frecuencia, los sujetos no deberían percibir tonalidad virtual 0 TO ¿ttual debería restringirse al caso cn que a frecuencia puesto que es en esa as críticas con anchuras de Pues algana. La sensación de tonalidad v el estímulo contuviese armónicos de bay región del espectro donde se encuentran las band: o banda pequeñas y, por lanto, capaces de resolver tales a ; e bien, Brian Moore, en la Universidad de Cambridge, ha pro pe o des , dad sible percibir tonalidad virtual cuando es imposible resolver ec E RE : tes del estimulo. Por ejemplo, en un experimento llevado a bs bo Ju pa Stuart Rosen, Moore retoma la vieja idea de Esckhidenifralada ariene naa te) para dilucidar esta cuestión. Pidicron aun grupo ES Ed a caran melodías sencillas generadas mediante trenes de impu Es de AC les frecuencias Fundamentales. Los estímulos fueron tilttados Pje e modo que sólo contuvieran armónicos no resolubles y se di ruido de baja frecuencia para evitar la presencia: de cate ns o esa franja espectral. Ln estas condiciones, los sujetos podlansidan 1 LA melodías, es decir, los estímulos podían provocar una o q que parece requerir la codificación de su tonalidad, Anto Es ser o hi Ñ 6 tonalidad virtual percibida en estas condiciones no es tan el Bal pan a pal se percibe en el caso de que el estímulo contenga AE e va q cuencia, no es menos cierto que cl sultado expuesto no puede ser explic do por los modelos espectrales. 1.2.3 Un modelo espectro-temporal Parece, por tanto, que ambos tipos de procesos [ensatos cda Ja temporal y espectral) han de conjugarse para dar cuen d a o e tados experimentales. De hecho, en los últimos gnos] an Ho ae 1 este tipo de modelos, de 10 Erie! a a DS A esto por Brian Moore en la década de los ochenta, que Moc ria las etapas del modelo explicitando el sustaio A canismo de cálculo propuesto, aquí será expuesto 2) Lérminos ES pl Ha psicofísicos. Los detalles de implementación fisiológica pueden consulta capítulo anterior. : ! ES e E estadio de procesamiento esta constituido por el el banda críticas que ha sido descrilo en cl capitulo anterior. os 1 Eos A nizados a bajas frecuencias resolverán los armónicos sites De EE del espectro y generarán salidas sinusoidales, Por su parte, los fl ps alta frecuencia procesaran varios armónicos y su salida refleja ] DS a a tal interacción. No obstante, como hemos visto, aunque la ER E onda compleja su tasa de repetición se corresponderá con E de S a Fn segundo lugar se dispone un conjunto de mecanismos que TESP! a a la estructura temporal de la onda, Cada mecanismo se SuNSOS Aa á de máximamente ante ondas que tengan un determinado pisto : i el ” canismo es estimulado por tonos puro le responde a intervalos que so 1508 de la tonalidad y de la sonoridad múltiplos del periodo del estímulo. Por ejemplo, si el mecanismo es estinu- lado por una señal elemental que tiene una frecuencia de 400 FI, los inter- valos de respuesta serán 25, 5, 75, 10, 12'5...ms. Si el mecanismo es esti- mulado por una onda compleja, obtendremos una respuesta también compleja, Cada máximo de la estructura fina de la señal procesada puede provocar una respuesta por parle del sistema. Por esta razón habrá interva- los de respuesta diferentes. Asi, ol intervalo correspondiente a la frecuencia fundamental estará presente, pero también aparecerán otros intervalos de respuesta distintos, En tercer lugar se comparan los intervalos de respuesta generados por cada mecanismo con el propósito de identificar aquéllos que son comune Lo habitual es que el intervalo temporal que aparece más frecuentemente corresponda con el periodo del componente fundamental. Por último, todos los intervalos temporales que potencialmente pudieran contener información acerca de la tonalidad del estímulo se evalúan en un mecanismo de decisión que debe seleccionar uno de los intervalos. Este mecanismo puede verse afectado por factores tales como la atención, la memoria, las condiciones de presentación de los estímulos, ete, La tonali- dad finalmente percibida se corresponde con el recíproco del intervalo tem- poral definitivamente seleccionado, Moore presenta unos cuantos ejemplos indicativos de cómo funcionaría el modelo con distintos tipos de estímulos. Supongamos, en primer Iugar, un estímulo compuesto por el tercer, cuarto y quinto armónicos de un com- ponente fundamental de 200 Hz. Las bandas críticas resolverían cada uno de los componentes (al ser de una frecuencia relativamente baja) y cada uno de ellos seria procesado por un mecanismo temporal diferenciado, El mecanismo temporal sintonizado a 600 Hz generaría los siguientes interva- los de respuesta: 167 3, 5, 6'67...ms. El mecanismo temporal sintoni- zado a 800 Flz generaría los siguientes intervalos: 125, 25, 3/75, 5...ms. Finalmente, el mecanismo sintonizado a 1.000 Hz proporcionaria la iguien- te respuesta: 1, 2, 3, 4, S...ms. Dado que el único intervalo común es 5 ms, el estimulo provocará una clara sensación de tonalidad virtual no ambigua correspondiente a la de un tono puro de 200 Hz. Si consideramos ahora que el estimulo está constituido por los armónicos de orden superior, entonces el sistema de bandas críticas no podría resolverlos y sólo se pondría en fun- cionamiento un único canal temporal, Además, la información temporal se- ría ambigua: aunque cl intervalo temporal correspondiente «al fandamental estaría presente (5 ms), lambién lo estarian otros intervalos (45, 5/5, 6... ms). Consiguientemente se predice, tal y como de hecho muestran los ex- perimentos psicofísicos oportunos, que la tonalidad virtual percibida será débil y ambigua. Por último, consideremos el caso de un estimulo constitui- do por una serie no armónica de frecuencias, pero tales que éstas pueden ser resueltas por las bandas críticas, por ejemplo, 840, 1.040 y 1.240 Hz. En este caso, los canales temporales no generan intervalos comunes (como se Al Percepción cher y King, por otro en los años treinta. No obstante, las curvas que han pasado a ser recomendadas por la International Organization for Standar- dization son las de Robinson y Dadson que pueden consultarse en la Figura 14.8. . Así pues, los contornos equisonoros nos proporcionan una medida del nivel de sonoridad de un tono puro tomando como referencia otro tono puro de una frecuencia de 1.000 Hz, La unidad de medida del nivel de so- noridad es el fon. Si decimos, por tanto, que un sonido tiene una sonoridad de 60 fons, estamos indicando que dicho tono puro se percibe con la misma sonoridad que un tono de 1.000 Hz presentado a 60 dB. Todos los estímulos de 60 fons se percibirán con la misma sonoridad, independientemente de la frecuencia del estímulo en cuestión. Nivel de presión sonora (4B) | Hb , 1 ]é- Frecuencia Figura 14,8. Contomos equisonoros. Adaptado de Robinson y Dadson (1956). 2.1.2 Escalas de sonoridad Desde una cierta perspectiva, el objetivo del estudio de la codificación de la sonoridad es el de generar una escala, o, en otras palabras, el determinar la función matemática que proyecta valores de intensidad del cstímulo en atribuciones de sonoridad realizadas por los sujetos. Los contornos equiso- noros, aunque suponen un paso importante en esta dirección, no resuelven pción de la tonalidad y de la sonoridad completamente el problema. Suponen un paso importante porque, para em- pezar, controlan los efectos introducidos por la frecuencia del estímulo en las atribuciones de sonoridad. Además, proporcionan cierta información acerca de la sensación de sonoridad que experimenta el sujeto. Por ejemplo, es posible deducir que la sonoridad crece con la intensidad más rápidamen- te en la zona de bajas frecuencias que en la zona de altas frecuencias. A pe- sar de todo ello, no hemos obtenido una medida directa de la sonoridad. En cste sentido sabemos que todos los sonidos iguales en fons son percibidos con el mismo nivel de sonoridad, pero nada nos garantiza que un sonido de h fons sea percibido con la mitad de sonoridad que un sonido de 2n fons. Este problema fue atacado por S.S. Stevens en la Universidad de Har- vard. Los dos métodos principales utilizados por Stevens fueron el de es- timación de magnitudes y el de producción de magnitudes. El primero, supone la asignación de distintos números a los estímulos percibidos con sonoridades diferentes. El segundo implica el ajuste, por parte del sujeto, de la sonoridad de un tono siguiendo las instrucciones del experimentador. Asi, el exporimentador puede pedirle que ajuste la amplitud del tono de modo que se perciba como el doble de sonoro que otro tono de referencia, como la mitad de sonoro que el estímulo de referencia, etc. De este modo es posible derivar una auténtica escala de sonoridad. Pues bien, los resulta- 200 100 50 20 10 5,0 2,0 1,0 0,5 Sonoridad (sons) 0,2 or 05 El 0,5 9,2 0 20 40 60 80 100 120 Nivel de sonoridad (fons) Figura 14,9 Sonoridad de un tono de 1 KHz (en sons) on función de su nivel de sonoridad (en fons). Adaptado de Scharf (1978). E! Percepción dos experimentales de Stevens parecen ajustarse razonablemente bien a una función potencial del siguiente tipo, S=kp"*, donde $ es la sonoridad perci- bida, p es la presión sonora y k es una constante que depende del sujeto y de las unidades de medida utilizadas. La función resultante para un tono de 1.000 Hz aparece en la Figura 14,9. La unidad de sonoridad es el son. Arbitrariamente, se define el son como la sonoridad que le corresponde a un tono de 1.000 Hz presentado a 40 dB. O, en otros términos, la sonoridad correspondiente a un nivel de so- noridad de 40 fons. Como hemos señalado, la relación existente entre am- plitud del estimulo y sonoridad no es lineal. Por ejemplo, 2 sons se corres- ponden con un nivel de sonoridad de 50 fons, es decir, para doblar la sonoridad de un tono de 1.000 Hz presentado a 40 dB, es preciso aumentar en 10 el número de dB. 2.2 La codificación de la sonoridad en sonidos complejos 2.2.1 Bandas críticas y adición de la sonoridad En el capítulo anterior veíamos que la anchura de banda crítica había sido obtenida a partir de diferentes tipos de experimentos. Los experimentos de adición de la sonoridad que presentamos a continuación constituyen, pre- isamente, una de las estimaciones más directas de la anchura de banda crítica. Para entender con claridad estos experimentos y sus implicacio- nes consideremos, en principio, un caso sencillo. Supongamos, pues, que presentamos al sujeto un estímulo complejo constituido por sólo dos sinu- soides. Supongamos, además, que ambos componentes tienen frecuencias muy cercanas y que la sonoridad de ambos componentes se mantiene cons- tante. Al sujeto se le pide que compare la sonoridad del estímulo complejo con la sonoridad de un tono de referencia. Después se incrementa paulati- namente la separación en frecuencia de los dos componentes y se sigue pi- diendo al sujeto que evalúe la sonoridad del tono complejo. Los resultados indican que los juicios de sonoridad permanecen constantes hasta que la se- paración en frecuencia de los componentes alcanza el valor de la anchura de banda crítica para esa frecuencia. Cuando se supera este valor, la sonori- dad atribuida al estímulo aumenta considerablemente. Este resultado se ha generalizado al caso de estímulos constituidos por más de dos tonos puros y también para bandas de ruido. En general, el efecto es mínimo para inten- sidades muy pequeñas cercanas al umbral pero se torna mucho más acusa- do en el rango de intensidades moderadas. Los resultados típicos obtenidos para una banda de ruido centrada en 1.000 Hz pueden observarse en la Figu- ra 14,10. Parece, por tanto, que dada una determinada cantidad de energía en un estimulo, el estímulo será percibido con una sonoridad mayor en la medida 514 14 recepción de la t idad y de la sonoridad 90 + | 4 A 80 4 E I ES | Bl = so E 50 4 5 1 S 5 50p | E 1 49 3 40 4 $ Zo [| q ] 20 : 20, 10% ] , 50 100 200 500 1:00 2.000 Anchura de banda (Hz) Figura 14.10 Nivel de sonoridad (en fons) de una banda de ruido centrada en 1 kHz en función de la anchura de dicha banda, Cada curva muestra los resultados obtenidos con un nivel de imtensi- dad diferente. Adaptado de Foldtkeller y Zwicker (1956). en la que dicha energía se extienda a través de varias bandas críticas. Este hecho es fácilmente comprensible si asumimos que la sonoridad de un tono complejo depende (aditivamente) de las sonoridades computadas en cada banda crítica activa durante el procesamiento del estímulo en cuestión. 2.2.2 Modelos para la determinación de la sonoridad Justamente, los datos procedentes de los experimentos de adición de la so- voridad discutidos en el apartado anterior han sido tomados como punto de partida para la elaboración de modelos que permitan determinar la sonori- dad de tonos complejos. Uno de estos modelos ha sido propuesto por Zwicker y Scharf hacia la mitad de los años sesenta, El modelo asume que, en primer lugar, el sonido es procesado por un filtro que simula las características del procesamiento más periférico al que se ve sometido el estímulo. En segundo lugar, se cal- cula el patrón de excitación generado por el estímulo; la frecuencia es ex- presada en unidades de banda critica (barks). El modelo toma en considera- ción el fenómeno de extensión de enmascaramiento hacia arriba (véase capitulo anterior). Así, si el nivel de excitación en la banda ¡+1 es menor que el grado de extensión del enmascaramiento hacia arriba predicho a par- tir de la banda 1, la banda ¡+! se ignora en el cálculo global de la sonoridad. Después el nivel de excitación se transforma en valores de sonoridad espe- cífica, esto es, sonoridad para cada banda crítica, De este modo, el patrón To