Mientras que en nuestra anterior entrega, describimos la influencia del debayerizado en las características del ruido en el campo de los pixeles, el siguiente análisis proporcione detalles sobre las características del ruido en el campo de la frecuencia.
Ruido en el campo de la transformada de Fourier y comparación con el grano de película
El espectro de la frecuencia es importante para la visión humana. Las frecuencias muy altas son menos visibles que las frecuencias medias o bajas, como consecuencia de la función de sensibilidad al contraste (CSF). Como, por regla general, el grano de película se considera más agradable a la vista que el ruido de los captores digitales, es interesante comparar el espectro del ruido de una cámara digital con el de la película escaneada.
La comparación se realiza a partir de la densidad espectral de potencia, que es el cuadrado de la amplitud del ruido transformado. Para el ruido de cámara utilizamos el modelo de ruido del sensor, tal y como lo describimos con anterioridad, y le aplicamos la cadena de procesado para obtener imágenes ruidosas en LogC.
El grano de película se obtiene capturando una carta de gris neutro calibrada –que constituye un área homogénea– con diferentes emulsiones fotoquímicas. Se escanea la película para obtener una representación digital con la misma resolución que su contrapartida digital. Acto seguido se calcula la densidad espectral de potencia, tanto para el grano de la película escaneada como para el ruido de cámara simulado, empleando el mismo procedimiento. En primer lugar, eliminamos el promedio total de la imagen ruidosa Isp con el tamaño de imagen N x M.
Se transforma la imagen ruidosa utilizando el algoritmo de la transformada rápida de Fourier (FFT) para obtener el espectro del ruido F(ω).
La densidad espectral de potencia equivale al cuadrado de la amplitud normalizado por el tamaño de la imagen.
Luego se calcula y trama la mediana para bloques de 32 x 32 con el fin de elaborar las gráficas de malla de la densidad espectral de potencia.
Resulta evidente que el espectro del ruido de las cámaras digitales no es blanco, ya que muestra un pico hacia las bajas frecuencias. Probablemente, este hecho convierte el ruido de cámara en un elemento más visible para el sistema visual humano (HVS) que el ruido blanco.
Además, el ruido de cámara muestra una densidad espectral de potencia más alta para las altas frecuencias verticales y horizontales que para las diagonales, en particular en el canal de verde. Ambos resultados muestran que el espectro del ruido no es blanco, pero el espectro del grano de película es más amplio que el espectro del ruido de cámara digital y depende menos de la dirección.
Este fenómeno puede explicar porque es más sencillo para el cerebro humano aceptar el grano e incluso porque –en ocasiones– es incluso apreciado con finalidades artísticas. La densidad espectral de potencia del grano de película depende del tipo de emulsión se utilice. En la imagen que precede a este párrafo figuran las cinco clases más representativas.
A pesar de que el análisis de la densidad espectral de potencia es interesante para explicar la percepción humana, el campo de la frecuencia no resulta óptimo para la reducción del ruido de cámara. Anil Kokaram, Damien Kelly, Hugh Denman y Andrew Crawford han mostrado que se puede emplear un método basado en la transformada 3D rápida de Fourier para reducir el ruido no blanco, pero ese método no es una buena elección cuando el objetivo es el procesado de vídeo, ya que se almacena la imagen completa en la memoria antes de que se pueda aplicar la transformada rápida de Fourier.
Por lo tanto, debemos escoger una segunda representación para nuestro análisis –en el campo de la transformada de ondícula (wavelet)– para obtener una descripción del ruido de cámara que pueda ser más útil en el desarrollo de métodos de reducción de ruido. Los coeficientes de la ondícula también proporcionan información de frecuencia, pero además están localizados y se pueden computar basándose en datos adyacentes limitados espacialmente.
Ruido en el campo de la transformada de ondícula
Analizar las características del ruido de los coeficientes de ondícula –cuando el ruido de cámara está presente en las imágenes– es importante por tres razones. Primero porque los métodos que emplean la transformada de ondícula parecen especialmente prácticos para reducir el ruido de los datos de cámara. Puede ser difícil incluir la correlación espacial –de la que hablamos en nuestro artículo anterior– en los métodos de reducción de ruido en el campo del pixel. Sin embargo, los métodos de transformada de ondícula suponen una buena elección. En ellos, la correlación espacial conlleva una cantidad diferente de ruido en las diferentes bandas de frecuencia, que se representan mediante niveles de ondícula. Segundo, porque los métodos de reducción de ruido mediante transformada de ondícula han proporcionado buenos resultados por lo general. Y tercero, porque se pueden desarrollar de manera bastante eficiente para el procesado de vídeo.
El modelo de ruido de uso más común –el AWGN– tiene una distribución del ruido blanco en al campo de la frecuencia, es decir, es igualmente fuerte en todas las bandas de frecuencia. En contraposición, el ruido de cámara no es blanco a causa de la correlación especial. En el campo de la transformada de ondícula esto significa que el ruido depende del nivel.
Con un filtro Haar, el tipo de filtro de ondícula con menor complejidad, la operación de filtrado se corresponde a una media y una diferencia. Para una entrada no correlacionada, se puede calcular fácilmente la varianza de la salida de los filtros. No obstante, la señal está correlacionada espacialmente como consecuencia del proceso de debayerizado que se realiza previamente a la transformación.
En nuestra próxima entrega, realizaremos una simulación –con las imágenes generadas por ordenador que ya hemos empleado en otras ocasiones– para mostrar el verdadero efecto del debayerizado sobre la varianza del ruido en los niveles de la transformada de ondícula.