You are on page 1of 50

Tema 4.

Caractersticas de los
patrones percibidos por un SVA
Forma:
Medidas generales sobre formas
Descripcin de contornos
Momentos espaciales y descriptores de Fourier

Color:
- Diagrama cromtico y teora triestmulo
- Espacios (modelos) del color: RGB, HSI, ...

Textura:
- Anlisis estructural
- Anlisis estadstico
- Anlisis en el dominio de Fourier

Bibliografa
BSICA:
R.C. Gonzlez y R.E. Woods, Digital Image Processing,
Addison Wesley, 2 edicin, 2002. (caps. 6 y 11)
A. de la Escalera, Visin por computador: Fundamentos y
mtodos, Pearson- Prentice Hall, 2001. (caps. 3 y 6)
COMPLEMENTARIA:
G.A. Baxes, Digital Image Processing, John Wliley & Sons,
1994. (cap. 5)
J.D. Foley et al, Computer Graphics: Pinciples and Practice,
2 Edicin, Addison-Wesley, 1997. (cap. 13)
M. Sonka et al., Image Processing, Analysis, and Machine
Vision, PWS Publishing, 1999. (cap. 6)

Introduccin (I)
Para reconocer objetos en imgenes es necesario extraer
caractersticas medibles de stos.
Estas caractersticas permiten definir vectores de
caractersticas normalizados que se usan para el
reconocimiento de patrones.
Algunas de las caractersticas principales extrables de los
objetos (o de las regiones segmentadas) en una imagen,
utilizadas en la etapa de reconocimiento dentro de un
Sistema de Visin Artificial, son la forma, el color y la
textura.

Introduccin (II)
Ejemplos :

Forma

Color

Textura

Forma (I)
Medidas generales sobre formas
Definir la forma de un objeto puede resultar difcil (verbalmente
o grficamente).
Forma = figura exterior (o geometra) de un cuerpo u objeto.
Es posible describir una forma 2D por medio de algunos de sus
caractersticas y propiedades (rea, permetro, ).
Medidas sobre forma:

rea
Permetro
Dimetro
Distancias: mxima y mnima al centro de masas, media al contorno,...
Ejes mayor y menor, ngulo del eje mayor
Envolvente (bounding box)
Nmero de agujeros
Ratios: redondez=(4Area)/Perimetro2, Area Agujeros/Area Total, ...

Forma (II)
Medidas generales sobre formas

rea
Permetro

Ejes mayor y menor

Bounding box

Caracterizacin de formas: descriptores generales (I)


Medidas descritas en relacin a pxeles (que pueden convertirse a
unidades originales: metros, centmetros, etc).
tiles cuando el tamao de la forma es importante (p.ej. en
aplicaciones mdicas).
Pueden resultar afectadas por la definicin de distancia y/o por el
tipo de conectividad entre pxeles usadas.
Algunas medidas: permetro, rea, centroide, distancia media al
contorno, dimetro, ejes mayor y menor, descriptores de texturas,
descriptores topolgicos, ratios de medidas, momentos
estadsticos, descriptores de Fourier, ...

Caracterizacin de formas: descriptores generales (II)


Permetro:
Nmero de pxeles que forman el contorno de la forma
Se obtiene el contorno binarizando la imagen, y luego se cuentan sus
pxeles)
Diferente resultado si se usa 4-conectividad 8-conectividad (igual ocurre
con otros descriptores)

rea:
Nmero de pxeles de la forma (sobre la imagen binaria)

Centroide o centro de masas:


Promedio de los valores de las coordenadas de los puntos de la forma
Se obtiene separadamente para cada una de las dos dimensiones
Tambin puede calcularse a partir de los puntos del contorno.

Caracterizacin de formas: descriptores generales (III)


Eje mayor (o dimetro):
Distancia mayor entre dos puntos cualquiera de la forma

Eje menor:
Eje perpendicular al eje mayor
Ambos ejes definen los lados del MRE
Estos ejes tambin estn relacionados con los autovectores de la matriz de
covarianzas (autoejes de las formas) usando el anlisis de componentes
principales

Grado de simetra (se comprueba desde el eje mayor del objeto)


Distancias mxima y mnima entre el centroide y los puntos del
contorno
Distancia media al contorno:
Sea f una forma con N puntos, pf un punto de f, y d(p,contorno(f)) la distancia
menor entre p y todos los puntos del contorno, entonces la distancia media al
contorno se calcula como:

= ( d(p,contorno(f))) / N

Caracterizacin de formas: descriptores generales (IV)


Descriptores topolgicos:
La topologa estudia las propiedades de una figura que quedan inafectadas
por deformaciones y transformaciones geomtricas.
Las propiedades topolgicas permiten describir globalmente aspectos
estructurales (no mtricas) de un objeto.
Algunos descriptores son:
* el nmero de agujeros nA del objeto,
* el nmero de componentes conexas nC (aplicado a objetos compuestos),
* el nmero de Euler E que se define como: E = nC - nA.

E=1

E=0

E=-1

Caracterizacin de formas: descriptores generales (V)


Ratios de forma:
Sean P y A el permetro y el rea de un objeto, respectivamente. Algunos ratios
de forma son:
Compacidad: P2/A
Redondez: 4 (A/P2)
(medida inversamente proporcional a la compacidad)
Relacin rea/permetro: A/P
Rectagularidad: A/area(MRE)
Elongacin: M/N (siendo M el eje mayor y N el eje menor)

Descriptores de curvatura:
Muestras de la curvatura en puntos de inters
Estadsticos de curvatura: curvatura media, varianza, desviacin tpica,
Energa de curvatura B (donde k(t) describe el contorno y P el permetro):

1
B = k (t ) 2 dt
P

Representacin de formas 2D (I)


Clasificacin de las tcnicas de representacin
Representacin de
formas

Basadas en contornos

Contornos
paramtricos

Conjuntos
de puntos

Aproximacin
mediante
curvas

Basadas en regiones

Descomposicin
en regiones

Regiones
envolventes

Basadas en
transfomadas

Caractersticas Transformadas
internas
lineales

Transformadas
no lineales

Representacin de formas 2D (II)


Clasificacin de las tcnicas de representacin
Representaciones basadas en contornos:
Contornos paramtricos: el perfil del contorno se representa mediante una
descripcin paramtrica (implicando un orden secuencial).
Ejemplos: vectores (x(t),y(t)); seales complejas u(t)=x(t)+jy(t); cdigos de
cadena; rachas (run-lenghts);
Conjunto de puntos caractersticos (landmark points): el contorno se
describe mediante una coleccin de puntos (sin orden).
Aproximacin mediante curvas: un conjunto de primitivas geomtricas se
ajustan al contorno.
Ejemplos: aproximaciones poligonales; polgonos de permetro mnimo;
arcos circulares y elpticos; modelos autoregresivos; B-splines; ...

Representacin de formas 2D (III)


Descripciones basadas en contornos

Contornos como conjuntos de puntos caractersticos:


Es la manera ms simple de representar una forma.
Esta representacin, aunque pobre, permite obtener ciertos descriptores
estadsticos de las formas (p.ej. centroide, eje mayor, ).
Aproximacin de contornos mediante curvas:
El contorno de una forma se representa mediante interpolacin. Resulta mejor
representar un contorno por tramos que aproximen cada parte de ste mediante
una primitiva geomtrica (p.ej. un segmento), que describir el contorno
mediante una funcin global.
Un mtodo sencillo de descripcin son las aproximaciones poligonales.
Se trata de encontrar un conjunto de puntos (vrtices) sobre el contorno tales
que permitan obtener una buena aproximacin del contorno original. La
manera clsica de tratar este problema es elegir como vrtices los puntos con
mayor curvatura local.

Representacin de formas 2D (IV)


Clasificacin de las tcnicas de representacin
Representaciones basadas en regiones:
Descomposicin en regiones: una regin se divide en formas ms simples (p.
ej. polgonos) y es representada mediante estas primitivas.
Ejemplos: polgonos; Voronoi/Delaunay; quadtrees; primitivas sintcticas;
Regiones envolventes: una forma se aproxima mediante una primitiva
geomtrica predefinida (p.ej. rectngulo) que se ajusta a ella.
Ejemplos: mnimo rectngulo envolvente; cierre convexo; caja de Feret; ...
Aproximacin mediante caractersticas internas: una forma se representa
mediante un conjunto de caractersticas asociadas a su regin interna.
Ejemplos: esqueleto; transformadas de distancias; matriz de forma; momentos
espaciales; ...

Representacin de formas 2D (V)


Descripciones basadas en regiones
Dentro de la caracterizacin por divisin, una representacin
muy usada es el quadtree para almacenar la regiones resultantes
de una segmentacin mediante un proceso de divisin y unin de
regiones.
Algunas tcnicas de descomposicin (divisin) para contornos
cerrados separan sucesivamente ciertos segmentos en dos partes
hasta que se satisface un criterio determinado.

d
b

a
d
b

Representacin de formas 2D (VI)


Descripciones basadas en regiones
Una familia importante de tcnicas basadas en regiones buscan la
envolvente que encierra a una forma considerada.
Hay tres tipos de envolventes fundamentales:
Caja de Feret: menor rectngulo, orientado segn una referencia especfica
(p.ej. los ejes cartesianos), que encierra la forma.
Menor rectngulo envolvente (MRE): menor rectngulo, orientado en
cualquier direccin, que contiene la forma.
Cierre convexo: menor conjunto convexo que contiene la forma (la
deficiencia convexa es la diferencia entre el cierre convexo y la forma).

Forma

Caja de Feret

MRE

Cierre convexo

Representacin de formas 2D (VII)


Descripciones basadas en regiones
Otro grupo de tcnicas de representacin de regiones considera un
conjunto de caractersticas relativas a la regin interna de la forma.
La ms significativa de estas tcnicas es el esqueleto que permite reducir
una forma a un grafo. Esta estructura se obtiene mediante un
adelgazamiento (thinning) de la forma.
Algunos procedimientos de esqueletizacin se basan en morfologa
matemtica.
Un mtodo sencillo, aunque ineficiente, es el propuesto por Blum (1967)
llamado transformacin del eje central (MAT). El esqueleto de una forma
R con contorno C se obtiene como sigue:
1) para cada punto pR, se busca su vecino ms cercano en C,
2) si p tiene ms de un vecino en C se dice que pertenece al esqueleto (o eje
central) de R.

Forma

Esqueleto

Representacin de formas 2D (VIII)


Clasificacin de las tcnicas de representacin
Representaciones basadas en dominios transformados:
Transformaciones lineales: una transformacin T tal que, dadas dos formas A y
B y dos escalares y , se cumple: T(A+B) = T(A)+T(B). Una
aproximacin basada en transformaciones lineales representa una forma A en
trminos de T(A).
Ejemplos: transformadas de Fourier; transformada del coseno; transformadas
wavelet; firmas;
Transformaciones no lineales: una transformacin que no cumple la propiedad
anterior.
Ejemplos: transformada de Hough; operadores de morfologa matemtica;

Descriptores tpicos usados:


coeficientes de la transformada
medidas de la transformada (p.ej. energa)
estadsticos de la transformada

Representacin de formas 2D (IX)


Descripciones basadas en transformadas: firmas

Dentro de las descripciones basadas en transformadas lineales podemos mencionar


las que hacen uso de la transformada de Fourier, de las transformadas wavelet, y
de las firmas, principalmente.
Una firma (signature) es una representacin funcional 1D de un contorno.
Existen diversos mtodos de generacin de firmas; uno de los ms simples es
dibujar la distancia del centroide del objeto al contorno en funcin del ngulo.
Las firmas son invariantes a traslaciones pero dependientes de rotaciones y
escalados (pero se puede normalizar para que resulte invariante ante estas
transformaciones).
r

r()

r()

(2)A

A
/4 /2 3/4 5/4 3/2 7/4 2

/4 /2 3/4 5/4 3/2 7/4 2

Ejemplos de representaciones (I)

Cdigos de cadena (descripcin de contornos)

El cdigo de cadena de un contorno (de objeto o regin) se define


partiendo de un pxel cualquiera del contorno y encadenando la
direccin en que se encuentran los puntos adyacentes del
contorno mediante un convenio de seguimiento establecido.
Se consigue as una cadena de smbolos que determinan
unvocamente al objeto, que es invariante a traslaciones.

1
2

3
0

4
5

1
0

Direcciones del cdigo de cadena usando conectividad 4 y 8, respectivamente.

Ejemplos de representaciones (II)


Cdigos de cadena (descripcin de contornos)

Con el fin de lograr invarianza frente a rotaciones se codifican las diferencias


entre los dgitos del cdigo y no el cdigo mismo.
Para lograr invarianza respecto al punto de inicio, los dgitos del cdigo
obtenido se disponen de forma que si se lee el cdigo se obtiene el menor
entero posible con esa secuencia de dgitos.
Para evitar que pequeos cambios en el contorno de un objeto produzcan
cdigos diferentes se usa algn filtro de suavizado o algn escalado del objeto.

(a)

(b)

Ejemplo: Cdigo de cadena de conectividad 4. El punto grueso indica el nodo


de inicio. Inicialmente se obtiene: 3030012122, que desplazndolo para
obtener el mnimo queda: 0012122303. Finalmente, codificando las diferencias
se obtiene: 0113101131

Ejemplos de representaciones (III)

Momentos espaciales (descripcin de regiones)

Los momentos espaciales de un objeto son medidas estadsticas


que permiten describir regiones (objetos) en trminos de sus
puntos interiores.
Para una funcin f(x,y) continua en 2D, se define el momento de
orden (p +q) como:
m pq =

p q
x
y f ( x, y)dxdy

m pq = x p y q I ( x, y )

Para una imagen digital, la frmula queda:


x
y
El momento central de orden (p + q) de una imagen es:
pq = ( x x) ( y y ) q I ( x, y )
p

Ejemplos de representaciones (IV)

Momentos espaciales(descripcin de regiones)

Momento espacial de orden cero: Es la suma de los valores de brillo de los


pxeles del objeto. Corresponde al rea del objeto en imgenes binarias.
m00 = I ( x, y )
x

Momentos espaciales de orden uno: Corresponden a las sumas en la


direcciones x e y, respectivamente, de los valores de brillo de los pxeles del
objeto, cada una de ellas multiplicada por su respectivo valor de coordenada x
o y en la imagen.
m10 = xI ( x, y )
x

El centro de masas de un objeto se calcula:

x=

m01 = yI ( x, y )

m10
m 00

y=

m 01
m 00

Momentos espaciales de orden dos: Dan informacin sobre la orientacin del


objeto.
Hu propuso un conjunto de momentos centrales normalizados de rdenes 2 y 3
que son invariantes a traslaciones, rotaciones y escalados.

Ejemplos de representaciones (V)


Descripcin basada en la transformada de Fourier

En el dominio de la frecuencia se puede tratar el problema de la invarianza a


las transformaciones geomtricas.
Aplicar la transformada de Fourier sobre el cdigo de cadena o las coordenadas
del contorno de un objeto.
Invarianza a traslaciones: Las componentes de Fourier de dos objetos iguales,
desplazados uno respecto a otro, solo se diferencian en F(0) (componente de
frecuencia cero). Eliminando esta componente hay una descripcin invariante a
traslaciones.

Invarianza a rotaciones: Las transformada de Fourier de un objeto girado


radianes respecto a otro igual no girado se diferencia en un factor
multiplicativo e j. Por ello, suelen tomarse los mdulos que no cambian si el
objeto est girado.

Invarianza a escalado: La transformada de Fourier de dos objetos iguales pero


de diferente tamao se diferencian en que todos los elementos de las
transformada han sido multiplicados por un valor k que depende del cambio de
tamao. Dividiendo todas las componentes por una de ellas (p. ej. F(1)) se
obtiene una representacin invariante a escalado.

Color (I)
Introduccin

El sistema visual humano puede distinguir entre miles de colores y slo puede
diferenciar alrededor de 100 niveles de intensidad.
La percepcin del color depende de las caractersticas de la luz
(fundamentalmente, la luz reflejada por el objeto) y del complejo proceso de
percepcin realizado por el sistema visual humano (ojo-cerebro).
Las radiaciones electromagnticas con longitud de onda entre 400 y 700
nanmetros (luz visible) estimulan los receptores humanos y producen la
sensacin de color.

El color es un descriptor muy potente para diferenciar objetos. Importancia en


aplicaciones de segmentacin y reconocimiento de patrones.
Tratamiento imgenes color: color completo y pseudocolor.

Color (II)
Diagrama cromtico y teora triestmulo

La mezcla aditiva de la luz emitida por tres linternas, una roja (de 650 nm),
otra verde (de 530 nm) y otra azul (de 425 nm) permite obtener una amplia
gama de colores (teora triestmulo).
Muchos dispositivos que generan imgenes en color (tubos de televisores,
monitores, pantallas de cristal lquido, pantallas de plasma, etc) se
fundamentan en este principio.
En 1931 la Comisin Internacional de Iluminacin (I.C.I.) convino en expresar
qu cantidad, en Lmenes, tiene que emitir cada una de tres linternas patrn
para expresar todos los matices del espectro de manera aditiva.
2,5

C
2

Lumenes

1,5

A
B
1

0,5

0
360

440

520

600

Longitud de onda (nm)

680

760

Color (III)
Diagrama cromtico y teora triestmulo

La obtencin de un color determinado se basa en tres componentes primarios:


x=

A
A+ B +C

y =

B
A+ B +C

z =

C
A+ B +C

donde: x+y+z=1. Representando en un plano XY el color asociado a cada punto


(x,y,z) se obtiene el diagrama cromtico CIE (a):

(a)

(b)

Color (IV)
Diagrama cromtico y teora triestmulo
Los colores comprendidos dentro del tringulo definido por los
puntos R,G,B de la fig. (b) son aqullos que se pueden obtener
por mezcla aditiva de tres linternas con los colores
correspondientes a los vrtices del tringulo.
Los televisores y los monitores de ordenador, eligen
cuidadosamente la base de tres colores (rojo, verde y azul) que
usarn para construir las imgenes que presentan, de manera que
el rea del triangulo dentro del diagrama I.C.I sea mxima, y as
poder representar el mximo posible de colores en sus pantallas.
El diagrama I.C.I da lugar a otro tipo de representacin
denominado HSV (Hue-Saturation-Value). Esta representacin
puede ser un superconjunto de una representacin RGB, en ella
los valores que definen una radiacin son el color (Hue), su
saturacin (Saturation), y su luminosidad (Value).

Color (V)
Tintas

Usando tintas, no se puede realizar la mezcla aditiva de haces de luz ya que, los
colores percibidos al mezclar tintas son el resultado de una mezcla substractiva.
Al tintar un papel blanco se le van restando componentes que ya no podr
reflejar.
Se trata de escoger adecuadamente una base de colores, para que la gama de
matices, que se pueda representar mezclando componentes de esta base, sea lo
ms extensa posible.
Las impresoras, que usan papel y tinta, toman como base la los colores: cian,
magenta y amarillo (CMY).

A la izquierda mezcla aditiva de la luz tres linternas sobre una superficie negra. A la
derecha mezcla substractiva de tres tintas sobre un lienzo blanco.

Color (VI)
Espacios (modelos) de color
Una combinacin de caractersticas fsicas del mundo real determina
lo que la visin humana percibe como el color.
Un espacio (o modelo) de color es una representacin matemtica de
estas caractersticas.
Los espacios de color son siempre tridimensionales:
El espacio ms habitual en imgenes digitales (pantallas de ordenador) es el
Red/Green/Blue (RGB).
En impresin se usa el espacio Cyan/Magenta/Yellow (CYM).
El espacio Hue/Saturation/Value (HSV) se usa tpicamente en imgenes
artsticas.
Los espacios de color basados en Intensity/Chromaticity (YUV y YIQ) se usan
para transmisin de seales de televisin.

Muchas aplicaciones de tratamiento de imgenes digitales requieren


transformaciones entre el espacio RGB y otros espacios de color.

Color (VII)
Espacio de color RGB
En este espacio aditivo, cada color tema valores entre 0 y 255,
resultando una estructura de cubo.
Cada color se define dando sus coordenadas de R, G y B, en
forma de 3-tupla: (rojo, verde, azul) con respecto al cubo.

Color (VIII)
Espacio de color CMY
Espacio inverso del RGB:
C = max-R
M = max-G Y = max-B
Uso en imgenes impresas (una vez que la imagen se
convierte a CMY no se puede visualizar correctamente en
pantalla).
Tras aos de experiencia, se han desarrollado tcnicas para
crear imgenes impresas de alta calidad y a bajo coste.
El modelo CMYK, que es una modificacin del CMY donde
K representa el color negro, permite este tipo de impresin
con buen ratio: calidad/coste.

Color (XI)
Espacio de color HSV (o HSI)
Espacio de color bastante diferente al RGB y al CMY. Operar
en HSI requiere mayor precisin aritmtica (coma flotante o
16-32 bits de precisin entera).
Hue = Longitud de onda
dominante o tono del color
(ngulo entre 0 y 360)
Saturation = Saturacin o fuerza
del color (entre 0 y 1)
Value = Intensidad del color
(entre 0 correspondiente al negro
y 1 al blanco)
Procesamiento en modelo HSI:
1) Convertir de RGB a HSI,
2) Modificar parmetro H (o S o I), y
3) Volver a convertir a RGB.

Color (X)
Espacios de color YUV y YIQ (luminancia-crominancia)

Estos espacios usan las caractersticas de brillo y color. El espacio YUV se


usa para el sistema de televisin PAL (Europa) y el YIQ para el sistema
NTSC (USA).
Los dos mtodos son casi idnticos, diferencindose en las ecuaciones de
conversin entre RGB y el modelo respectivo. En ambos sistemas, Y
representa la luminancia o componente de brillo, e I y Q (o U y V), la
crominancia o color.
Estas variables (brillo, color) se pueden cambiar mediante los botones de
una televisin (u ordenador).
La ventaja de usar YUV o YIQ para enviar la seal de televisin es que se
reduce la cantidad de informacin para definir el color. Esta compresin
restringe el rango de colores en imgenes de televisin.
Ejemplo:
Y = .299R + .587G + .114B
Ecuaciones de conversin de RGB a YUV:
U = -.147R - .289G + .437B
V = .615R - .515G - .100B

Textura (I)
Introduccin
Las texturas ofrecen informacin sobre la ordenacin espacial de
los niveles de gris (o de los colores) en una imagen.
Son patrones visuales homogneos, locales y repetitivos que se
observan en ciertos tipos de materiales (telas, piedras, madera, etc).
Resulta importante para muchos aplicaciones de Visin Artificial:
segmentacin de regiones en imgenes, determinacin de formas
(o caractersticas) de objetos, clasificacin, etc.
Al observar ciertos tipos de materiales se nota que presentan un
aspecto homogneo a pesar de no tener un nivel de gris constante.
La textura no puede definirse para pxeles aislados.
La textura viene dada por distribucin espacial de los niveles de
gris en una regin (medida cuantitativa).
Esta caracterstica depende del grado de resolucin de la imagen.

Textura (Ib)
Introduccin
Textura: Uno o ms patrones locales que se repiten de
manera peridica.
Para el estudio y comparacin de los algoritmos sobre
imgenes de texturas se utilizan como referencia las
imgenes de Brodatz.

Diversas imgenes del album de Brodatz, utilizadas en el anlisis de texturas.

Textura (Ib)
Introduccin
Problemas relacionados con texturas (Forsyth y Ponce, 2003)
Segmentacin basada en textura: descomponer una imagen
en regiones cuya textura sea uniforme
Sntesis de texturas: construir regiones grandes de textura a
partir de imgenes (pequeas) de ejemplo usadas para
construir modelos de probabilidad de textura
Extraccin de la forma a partir de la textura: la
deformacin de la textura pixel a pixel se usa como una
caracterstica para descubrir la forma de una region

Textura (II)
Introduccin
Ejemplos de texturas: pavimento (izquierda) y tejido (derecha).

Mtodos de anlisis de texturas:


1) estructurales,
2) estadsticos, y
3) espectrales (uso de la transformada de Fourier).

Textura (III)
Medidas cuantitativas: informacin bordes
El nmero de pxeles borde detectados en una regin de tamao
fijo y las orientaciones de estos bordes ofrecen una informacin
bsica de textura.
Para regiones pequeas de N pxeles, cada pxel p tiene dos
propiedades generadas por un algoritmo de deteccin de bordes:
la magnitud del gradiente Mag(p) y su orientacin Dir(p).
Se puede calcular la densidad de bordes como:
FdensidadBordes =

siendo T un umbral dado.

p : Mag ( p ) T
N

Textura (IV)
Medidas cuantitativas : informacin bordes
Sea Hmag(R) el histograma normalizado de magnitudes de
gradiente en la regin R y Hdir(R) el histograma normalizado de
orientaciones de gradiente en la regin R, una medida cuantitativa
que describe la textura de la regin viene dada por:
Fmag dir = (Hmag(R), Hdir(R))
Dadas dos imgenes I1 e I2, se puede calcular para cada una de
ellas su correspondiente par de histogramas (Hmag(R), Hdir(R)), y
dichos histogramas H1 y H2 se comparan por medio de una
medida de distancia:
n

L1 ( H 1 , H 2 ) = H 1 (i ) H 2 (i )
i =1

Textura (V)
Medidas cuantitativas: Ejemplo
Sean dos imgenes de 55 (25 pxeles):

FdensidadBordes(I1) = 1 y FdensidadBordes(I2) = 0.24


Imagen I1: Hmag(I1)=(0.24, 0.76), Hdir(I1)=(0.48, 0.52, 0.00)
Imagen I2: Hmag(I2) =(0.00, 0.24), Hdir(I2)=(0.00, 0.00, 0.24)
Texturas muy distinguibles.
L1(H1,H2) = 2

Textura (VI)
Medidas cuantitativas: particin binaria local
Para cada pxel p de la imagen se examinan sus 8 vecinos.
Se construye un nmero binario de 8 dgitos a partir de dichos
vecinos:
b1b2b3b4 b5b6b7b8
siendo bi=0 si la intensidad del pxel i es menor o igual que la del
pxel p, y bi=1 en caso contrario. El valor decimal de este nmero
estar entre 0 y 255.
Se construye un histograma con estos valores, para todos los
pxeles de la imagen, con el fin de representar la textura de la
imagen.
Dos imgenes o regiones se pueden compara a nivel de textura
por la distancia L1 entre sus histogramas correspondientes.

Textura (VII)
Anlisis: Mtodos estructurales

Se basan en el uso de primitivas de textura (llamadas txeles) y de reglas


(gramaticales) de formacin.
tiles cuando las primitivas o patrones de textura son son los suficientemente
grandes y sencillos para poder ser segmentados (se habla de macrotexturas).
Para imgenes binarias, las primitivas puedes extraerse por mtodos
morfolgicos y luego obtener las reglas de formacin.
Las imgenes en niveles de gris se preprocesan primero con un filtro de tipo
laplaciana de una gausiana (LoG) para obtener las primitivas de textura, luego
se definen reglas de formacin usando medidas basadas en las co-ocurrencias
de estas primitivas.
Ejemplo: Dada la primitiva p:
, y la regla de formacin: S pS, se pueden
obtener la siguiente imagen binaria 2D aplicando la regla de formacin en las
direcciones x e y:

Textura (VIII)
Anlisis: Mtodos estadsticos

Analizan la distribucin estadstica de alguna propiedad para cada uno de los


pxeles de la imagen.
Se clasifican en: mtodos de primer orden (aqullos basados en el histograma),
mtodos de segundo orden (los basados en matrices de co-ocurrencias), y
mtodos de rdenes superiores.
Estadsticos de primer orden:
Se calcula el histograma de la imagen.
Si a cada valor del histograma se lo divide por el nmero total de pxeles de
la imagen, se tiene un histograma de probabilidades de niveles de gris h.
Propiedades que se obtienen a partir de este histograma son:
Media
Varianza
Coef. de asimetra Curtosis
Entropa
n

= ih(i )
i =1

= (i ) h(i )
2

i =1

3 =

(i ) h(i )
3
i =1

4 =

(i ) 4 h(i )
4
i =1

h(i ) log h(i )


i =1

Textura (IX)
Anlisis: Mtodos estadsticos (de segundo orden)
Los estadsticos basados en el histograma tienen el inconveniente
de perder la informacin espacial.
Se obtendra la misma informacin para una imagen de un
tablero de ajedrez con los cuadros blancos y negros
intercambiados.
Para capturar las dependencias espaciales de los valores de
niveles de gris, que contribuyen a la percepcin de las texturas
presentes en una imagen, se define una estructura 2D llamada
matriz de co-ocurrencias para analizar texturas.
La matriz de coocurrencias P[i,j] se define especificando una
direccin de desplazamiento d=(di,dj) y contando todos los pares
de pxeles separados por d y que tienen valores de gris i y j.

Textura (X)
Anlisis: Mtodos estadsticos (de segundo orden)
Ejemplo: Imagen de 55 con tres niveles de gris (0, 1 y 2).
2
0
0
1
2

1
2
1
2
0

2
1
2
2
1

0
1
2
0
0

1
2
0
1
1

Como hay tres niveles de gris, Pd[i,j] es de tamao 33. Sea, por
ejemplo d=(1,1). En la imagen existen 16 pares de pxeles que
satisfacen esta separacin espacial. La matriz Pd[i,j] resultante
para este valor de d es:
0
2
2
0

2
1
3
1
j

2
2
2
2

0
1
2

Textura (XI)
Anlisis: Mtodos estadsticos (de segundo orden)
Para analizar texturas pueden calcularse diferentes matrices de coocurrencias de la misma imagen con diferentes valores de d.
Algunas propiedades que pueden extraerse a partir de dicha
matriz son:
Energa (o segundo momento angular): Indica el grado de homogeneidad
de la imagen.
n n
Pd (i, j )2
i =1 j =1

Contraste: Indica la variacin en la imagen.


n 1

k Pd (i, j )2 , donde : i j = k

k =0

i =1 j =1

Entropa: Expresa la uniformidad de la matriz de coocurrencias.


n

Pd (i, j ) logPd (i, j )


i =1 j =1

Textura (XII)
Anlisis: Mtodos espectrales (Fourier)
Tambin a partir de la transformada de Fourier de una imagen,
se pueden analizar sus texturas predominantes.
El espectro de la transformada (su mdulo) |F(u,v)|, resulta ideal
para describir la direccin de los patrones peridicos 2D de la
imagen f(x,y). Tambin se puede utilizar la energa del espectro:
P(u,v) = |F(u,v)|2.
Se consideran dos caractersticas del espectro de Fourier de la
imagen que son tiles al describir texturas:
1) los picos prominentes del espectro indican la direccin
principal de los patrones de textura;
2) la localizacin de esos picos en el plano de frecuencias indican
el periodo espacial de los patrones.
Al expresar el espectro en coordenadas polares, se tiene: S(r,).
Por cada direccin de , S(r,) es una funcin 1D S(r), y
similarmente para cada frecuencia r, Sr().

Textura (XIII)
Anlisis: Mtodos espectrales (Fourier)
Se obtienen dos distribuciones:

S(r) = S (r)
=0

R0

S() = Sr ()
r=1

Para cada par de valores (r,), se obtiene el par [S(r),S()].


Variando estas coordenadas se pueden generar dos funciones: S(r)
y S() que constituyen una descripcin espectral de la textura para
una imagen completa.
Adems, algunos descriptores propios de estas distribuciones, S(r)
y S(), se pueden calcular para obtener para caracterizar las
texturas de forma cuantitativa.

You might also like