Reducción de ruido en cámaras de cinematografía digital (XII) –Reducción y percepción de ruido
Tras el análisis que hemos llevado a cabo en anteriores entregas sobre las diferentes estrategias posibles para aplicar algoritmos de reducción de ruido altamente eficientes a las imágenes captadas con cámaras de cinematografía digital, una pregunta destaca sobre las demás: ¿Cuál es el mejor dominio para la reducción de ruido con un algoritmo puntero? ¿Es el lineal, el logarítmico o el correspondiente a la visualización en pantallas?
Así como podemos esperar que el procedimiento funcione bien en un dominio de datos cercano a la percepción humana, también es predecible un buen funcionamiento si empleamos otro con características de ruido bien conocidas y delimitadas. No obstante, ambos objetivos no pueden alcanzarse por completo a la misma vez. Es necesario encontrar un equilibrio entre los dos requerimientos. Para responder a la pregunta es imprescindible –en consecuencia– aplicar los métodos BM3D y BLS-GSM al dominio lineal.
El método BM3D alcanza una PSNR mayor en el dominio de la visualización en pantallas, tanto en lo que respecta a los datos RGB que contienen ruido no correlacionado como en lo que respecta a los datos del debayerizado. En el caso del BLS-GSM, se alcanza una PSNR superior en en el dominio lineal en RGB, pero dicha PSNR es aún más elevada para la reducción de ruido en el dominio de la visualización en pantallas a partir de los datos del debayerizado. Por lo tanto, no es posible obtener una respuesta clara basándose sólo en esta información.
Los resultados que ya presentamos en nuestro anterior artículo de esta serie –a partir de dos algoritmos de nueva hornada aplicados a la imagen de la ciudad simulada por ordenador– nos permiten asegurar que los valores finales pueden depender tanto del método como del dominio de reducción de ruido. Por tal motivo es obligatorio debatir más métodos distintos.
Métodos de reducción de ruido
Los métodos de reducción de ruido se pueden clasificar en métodos de dominio del píxel y métodos del dominio de la transformada. Los primeros abarcan desde los sistemas de filtrado adyacente más básicos –como el filtrado gaussiano local– a los más potentes, basados en la autosimilaridad. El más conocido de entre los basados en dicha autosimilitud es el algoritmo de medios no locales. También podemos considerar a los métodos variacionales como métodos del dominio del píxel. El ejemplo más conocido sería el de variación total.
Los métodos del dominio de la transformada difieren en particular en sus sistema de descomposición. De entre ellos, los relativos a la transformada de Fourier no resultan adecuados para la reducción de ruido, ya que no proporcionan ninguna clase de información local en los coeficientes. Este problema se resuelve o bien usando una transformada de coseno discreta (DCT) en una ventana local, o bien usando transformaciones de ondícula (wavelet), que proporcionan información tanto espacial como de frecuencia.
A día de hoy, las soluciones más exitosas se basan en las ventajas de ambos dominios: el de la transformada y el del pixel. El método BM3D, por ejemplo, explota la idea de la autosimilaridad en el dominio del pixel y luego aplica un filtrado del dominio de la transformada de coseno discreta. Como hemos mencionado anteriormente, la cantidad actual de algoritmos de reducción de ruido es demasiado numerosa para analizar cada uno de ellos en estos artículos, pero a partir de los más representativos podemos alcanzar conclusiones provechosas.
Percepción del ruido
Antes de enumerar una serie de conclusiones sobre los algoritmos de reducción de ruido más eficientes o sus combinaciones más afortunadas, debemos abordar el tema de la visibilidad del ruido espacio-temporal por parte del ser humano. El ruido es un efecto inevitable en cualquier secuencia de vídeo filmada en el mundo real. Afecta seriamente a la calidad visual de sus contenidos, en especial en condiciones de iluminación pobre o escasa. Teniendo en cuenta que la mayoría de los sensores actuales sacrifican el tamaño de los píxeles en favor de una mayor resolución, la necesidad de soluciones algorítmicas se ha incrementado sobremanera.
El propósito de esta serie de artículos es el estudio –a nivel muy elemental– de la visibilidad del ruido. Ninguno de los métodos de reducción que hemos mencionado es capaz de reconstruir la imagen real. Siempre existe un error de cálculo de mayor o menor calado. El desafío al que se enfrentan los ingenieros es el de ocultar las consecuencias de ese error de cálculo tan bien como sea posible. Hemos podido observar que dicho error es particularmente severo cuando se aplican métodos espaciales de reducción de ruido en la imagen a los datos de vídeo. En estos casos, el error consiste en un ruido de frecuencia muy bajo.
En una imagen fija, semejante ruido es casi invisible –como consecuencia de la disminución de la sensibilidad al contraste de la visión humana en frecuencias espaciales muy bajas. Pero si esas imágenes forman parte de una secuencia de vídeo, el ruido de baja frecuencia reaparece en forma de parpadeo y resulta muy molesto de cara a la experiencia del visionado. Como resulta muy difícil separar el ruido en las bandas de baja frecuencia del contenido real de la imagen, todavía constituye un problema de calidad crucial en los procesos de reducción de ruido para vídeo.
A pesar de que los métodos de reducción de ruido temporales pueden reducir mejor el parpadeo, también pueden introducir nuevos artefactos –sobre todo de movimiento– e implican un alto coste computacional. Sus requerimientos de memoria resultan extremadamente altos con resoluciones de 4K y superiores. Por desgracia, aún no existen estudios exhaustivos que proporcionen detalles sobre la visibilidad del ruido en secuencias de vídeo dependiendo de su distribución espectral. Stefan Winkler y Sabine Süsstrunk presentaron en su día un estudio subjetivo examinando la visibilidad del ruido en imágenes fijas. Además del ruido blanco, también utilizaron ruido de media y alta frecuencia. Los resultados muestran una visibilidad menor en el caso del ruido de alta frecuencia cuando se compara con el de media frecuencia. Esta conclusión era de esperar a causa de la función de sensibilidad al contraste. En principio, cabría esperar un fenómeno parecido si se comparara el ruido de alta y media frecuencia con el de baja frecuencia, pero este último no fue objeto del estudio.
En nuestra próxima entrega, analizaremos la visibilidad del ruido para ocho bandas de frecuencia distintas. La evaluaremos tanto en ruido estático –como ocurre con las imágenes fijas– como en ruido dinámico –que es el que aparece en los datos de vídeo–.