Professional Documents
Culture Documents
Caractersticas de los
patrones percibidos por un SVA
Forma:
Medidas generales sobre formas
Descripcin de contornos
Momentos espaciales y descriptores de Fourier
Color:
- Diagrama cromtico y teora triestmulo
- Espacios (modelos) del color: RGB, HSI, ...
Textura:
- Anlisis estructural
- Anlisis estadstico
- Anlisis en el dominio de Fourier
Bibliografa
BSICA:
R.C. Gonzlez y R.E. Woods, Digital Image Processing,
Addison Wesley, 2 edicin, 2002. (caps. 6 y 11)
A. de la Escalera, Visin por computador: Fundamentos y
mtodos, Pearson- Prentice Hall, 2001. (caps. 3 y 6)
COMPLEMENTARIA:
G.A. Baxes, Digital Image Processing, John Wliley & Sons,
1994. (cap. 5)
J.D. Foley et al, Computer Graphics: Pinciples and Practice,
2 Edicin, Addison-Wesley, 1997. (cap. 13)
M. Sonka et al., Image Processing, Analysis, and Machine
Vision, PWS Publishing, 1999. (cap. 6)
Introduccin (I)
Para reconocer objetos en imgenes es necesario extraer
caractersticas medibles de stos.
Estas caractersticas permiten definir vectores de
caractersticas normalizados que se usan para el
reconocimiento de patrones.
Algunas de las caractersticas principales extrables de los
objetos (o de las regiones segmentadas) en una imagen,
utilizadas en la etapa de reconocimiento dentro de un
Sistema de Visin Artificial, son la forma, el color y la
textura.
Introduccin (II)
Ejemplos :
Forma
Color
Textura
Forma (I)
Medidas generales sobre formas
Definir la forma de un objeto puede resultar difcil (verbalmente
o grficamente).
Forma = figura exterior (o geometra) de un cuerpo u objeto.
Es posible describir una forma 2D por medio de algunos de sus
caractersticas y propiedades (rea, permetro, ).
Medidas sobre forma:
rea
Permetro
Dimetro
Distancias: mxima y mnima al centro de masas, media al contorno,...
Ejes mayor y menor, ngulo del eje mayor
Envolvente (bounding box)
Nmero de agujeros
Ratios: redondez=(4Area)/Perimetro2, Area Agujeros/Area Total, ...
Forma (II)
Medidas generales sobre formas
rea
Permetro
Bounding box
rea:
Nmero de pxeles de la forma (sobre la imagen binaria)
Eje menor:
Eje perpendicular al eje mayor
Ambos ejes definen los lados del MRE
Estos ejes tambin estn relacionados con los autovectores de la matriz de
covarianzas (autoejes de las formas) usando el anlisis de componentes
principales
= ( d(p,contorno(f))) / N
E=1
E=0
E=-1
Descriptores de curvatura:
Muestras de la curvatura en puntos de inters
Estadsticos de curvatura: curvatura media, varianza, desviacin tpica,
Energa de curvatura B (donde k(t) describe el contorno y P el permetro):
1
B = k (t ) 2 dt
P
Basadas en contornos
Contornos
paramtricos
Conjuntos
de puntos
Aproximacin
mediante
curvas
Basadas en regiones
Descomposicin
en regiones
Regiones
envolventes
Basadas en
transfomadas
Caractersticas Transformadas
internas
lineales
Transformadas
no lineales
d
b
a
d
b
Forma
Caja de Feret
MRE
Cierre convexo
Forma
Esqueleto
r()
r()
(2)A
A
/4 /2 3/4 5/4 3/2 7/4 2
1
2
3
0
4
5
1
0
(a)
(b)
p q
x
y f ( x, y)dxdy
m pq = x p y q I ( x, y )
x=
m01 = yI ( x, y )
m10
m 00
y=
m 01
m 00
Color (I)
Introduccin
El sistema visual humano puede distinguir entre miles de colores y slo puede
diferenciar alrededor de 100 niveles de intensidad.
La percepcin del color depende de las caractersticas de la luz
(fundamentalmente, la luz reflejada por el objeto) y del complejo proceso de
percepcin realizado por el sistema visual humano (ojo-cerebro).
Las radiaciones electromagnticas con longitud de onda entre 400 y 700
nanmetros (luz visible) estimulan los receptores humanos y producen la
sensacin de color.
Color (II)
Diagrama cromtico y teora triestmulo
La mezcla aditiva de la luz emitida por tres linternas, una roja (de 650 nm),
otra verde (de 530 nm) y otra azul (de 425 nm) permite obtener una amplia
gama de colores (teora triestmulo).
Muchos dispositivos que generan imgenes en color (tubos de televisores,
monitores, pantallas de cristal lquido, pantallas de plasma, etc) se
fundamentan en este principio.
En 1931 la Comisin Internacional de Iluminacin (I.C.I.) convino en expresar
qu cantidad, en Lmenes, tiene que emitir cada una de tres linternas patrn
para expresar todos los matices del espectro de manera aditiva.
2,5
C
2
Lumenes
1,5
A
B
1
0,5
0
360
440
520
600
680
760
Color (III)
Diagrama cromtico y teora triestmulo
A
A+ B +C
y =
B
A+ B +C
z =
C
A+ B +C
(a)
(b)
Color (IV)
Diagrama cromtico y teora triestmulo
Los colores comprendidos dentro del tringulo definido por los
puntos R,G,B de la fig. (b) son aqullos que se pueden obtener
por mezcla aditiva de tres linternas con los colores
correspondientes a los vrtices del tringulo.
Los televisores y los monitores de ordenador, eligen
cuidadosamente la base de tres colores (rojo, verde y azul) que
usarn para construir las imgenes que presentan, de manera que
el rea del triangulo dentro del diagrama I.C.I sea mxima, y as
poder representar el mximo posible de colores en sus pantallas.
El diagrama I.C.I da lugar a otro tipo de representacin
denominado HSV (Hue-Saturation-Value). Esta representacin
puede ser un superconjunto de una representacin RGB, en ella
los valores que definen una radiacin son el color (Hue), su
saturacin (Saturation), y su luminosidad (Value).
Color (V)
Tintas
Usando tintas, no se puede realizar la mezcla aditiva de haces de luz ya que, los
colores percibidos al mezclar tintas son el resultado de una mezcla substractiva.
Al tintar un papel blanco se le van restando componentes que ya no podr
reflejar.
Se trata de escoger adecuadamente una base de colores, para que la gama de
matices, que se pueda representar mezclando componentes de esta base, sea lo
ms extensa posible.
Las impresoras, que usan papel y tinta, toman como base la los colores: cian,
magenta y amarillo (CMY).
A la izquierda mezcla aditiva de la luz tres linternas sobre una superficie negra. A la
derecha mezcla substractiva de tres tintas sobre un lienzo blanco.
Color (VI)
Espacios (modelos) de color
Una combinacin de caractersticas fsicas del mundo real determina
lo que la visin humana percibe como el color.
Un espacio (o modelo) de color es una representacin matemtica de
estas caractersticas.
Los espacios de color son siempre tridimensionales:
El espacio ms habitual en imgenes digitales (pantallas de ordenador) es el
Red/Green/Blue (RGB).
En impresin se usa el espacio Cyan/Magenta/Yellow (CYM).
El espacio Hue/Saturation/Value (HSV) se usa tpicamente en imgenes
artsticas.
Los espacios de color basados en Intensity/Chromaticity (YUV y YIQ) se usan
para transmisin de seales de televisin.
Color (VII)
Espacio de color RGB
En este espacio aditivo, cada color tema valores entre 0 y 255,
resultando una estructura de cubo.
Cada color se define dando sus coordenadas de R, G y B, en
forma de 3-tupla: (rojo, verde, azul) con respecto al cubo.
Color (VIII)
Espacio de color CMY
Espacio inverso del RGB:
C = max-R
M = max-G Y = max-B
Uso en imgenes impresas (una vez que la imagen se
convierte a CMY no se puede visualizar correctamente en
pantalla).
Tras aos de experiencia, se han desarrollado tcnicas para
crear imgenes impresas de alta calidad y a bajo coste.
El modelo CMYK, que es una modificacin del CMY donde
K representa el color negro, permite este tipo de impresin
con buen ratio: calidad/coste.
Color (XI)
Espacio de color HSV (o HSI)
Espacio de color bastante diferente al RGB y al CMY. Operar
en HSI requiere mayor precisin aritmtica (coma flotante o
16-32 bits de precisin entera).
Hue = Longitud de onda
dominante o tono del color
(ngulo entre 0 y 360)
Saturation = Saturacin o fuerza
del color (entre 0 y 1)
Value = Intensidad del color
(entre 0 correspondiente al negro
y 1 al blanco)
Procesamiento en modelo HSI:
1) Convertir de RGB a HSI,
2) Modificar parmetro H (o S o I), y
3) Volver a convertir a RGB.
Color (X)
Espacios de color YUV y YIQ (luminancia-crominancia)
Textura (I)
Introduccin
Las texturas ofrecen informacin sobre la ordenacin espacial de
los niveles de gris (o de los colores) en una imagen.
Son patrones visuales homogneos, locales y repetitivos que se
observan en ciertos tipos de materiales (telas, piedras, madera, etc).
Resulta importante para muchos aplicaciones de Visin Artificial:
segmentacin de regiones en imgenes, determinacin de formas
(o caractersticas) de objetos, clasificacin, etc.
Al observar ciertos tipos de materiales se nota que presentan un
aspecto homogneo a pesar de no tener un nivel de gris constante.
La textura no puede definirse para pxeles aislados.
La textura viene dada por distribucin espacial de los niveles de
gris en una regin (medida cuantitativa).
Esta caracterstica depende del grado de resolucin de la imagen.
Textura (Ib)
Introduccin
Textura: Uno o ms patrones locales que se repiten de
manera peridica.
Para el estudio y comparacin de los algoritmos sobre
imgenes de texturas se utilizan como referencia las
imgenes de Brodatz.
Textura (Ib)
Introduccin
Problemas relacionados con texturas (Forsyth y Ponce, 2003)
Segmentacin basada en textura: descomponer una imagen
en regiones cuya textura sea uniforme
Sntesis de texturas: construir regiones grandes de textura a
partir de imgenes (pequeas) de ejemplo usadas para
construir modelos de probabilidad de textura
Extraccin de la forma a partir de la textura: la
deformacin de la textura pixel a pixel se usa como una
caracterstica para descubrir la forma de una region
Textura (II)
Introduccin
Ejemplos de texturas: pavimento (izquierda) y tejido (derecha).
Textura (III)
Medidas cuantitativas: informacin bordes
El nmero de pxeles borde detectados en una regin de tamao
fijo y las orientaciones de estos bordes ofrecen una informacin
bsica de textura.
Para regiones pequeas de N pxeles, cada pxel p tiene dos
propiedades generadas por un algoritmo de deteccin de bordes:
la magnitud del gradiente Mag(p) y su orientacin Dir(p).
Se puede calcular la densidad de bordes como:
FdensidadBordes =
p : Mag ( p ) T
N
Textura (IV)
Medidas cuantitativas : informacin bordes
Sea Hmag(R) el histograma normalizado de magnitudes de
gradiente en la regin R y Hdir(R) el histograma normalizado de
orientaciones de gradiente en la regin R, una medida cuantitativa
que describe la textura de la regin viene dada por:
Fmag dir = (Hmag(R), Hdir(R))
Dadas dos imgenes I1 e I2, se puede calcular para cada una de
ellas su correspondiente par de histogramas (Hmag(R), Hdir(R)), y
dichos histogramas H1 y H2 se comparan por medio de una
medida de distancia:
n
L1 ( H 1 , H 2 ) = H 1 (i ) H 2 (i )
i =1
Textura (V)
Medidas cuantitativas: Ejemplo
Sean dos imgenes de 55 (25 pxeles):
Textura (VI)
Medidas cuantitativas: particin binaria local
Para cada pxel p de la imagen se examinan sus 8 vecinos.
Se construye un nmero binario de 8 dgitos a partir de dichos
vecinos:
b1b2b3b4 b5b6b7b8
siendo bi=0 si la intensidad del pxel i es menor o igual que la del
pxel p, y bi=1 en caso contrario. El valor decimal de este nmero
estar entre 0 y 255.
Se construye un histograma con estos valores, para todos los
pxeles de la imagen, con el fin de representar la textura de la
imagen.
Dos imgenes o regiones se pueden compara a nivel de textura
por la distancia L1 entre sus histogramas correspondientes.
Textura (VII)
Anlisis: Mtodos estructurales
Textura (VIII)
Anlisis: Mtodos estadsticos
= ih(i )
i =1
= (i ) h(i )
2
i =1
3 =
(i ) h(i )
3
i =1
4 =
(i ) 4 h(i )
4
i =1
Textura (IX)
Anlisis: Mtodos estadsticos (de segundo orden)
Los estadsticos basados en el histograma tienen el inconveniente
de perder la informacin espacial.
Se obtendra la misma informacin para una imagen de un
tablero de ajedrez con los cuadros blancos y negros
intercambiados.
Para capturar las dependencias espaciales de los valores de
niveles de gris, que contribuyen a la percepcin de las texturas
presentes en una imagen, se define una estructura 2D llamada
matriz de co-ocurrencias para analizar texturas.
La matriz de coocurrencias P[i,j] se define especificando una
direccin de desplazamiento d=(di,dj) y contando todos los pares
de pxeles separados por d y que tienen valores de gris i y j.
Textura (X)
Anlisis: Mtodos estadsticos (de segundo orden)
Ejemplo: Imagen de 55 con tres niveles de gris (0, 1 y 2).
2
0
0
1
2
1
2
1
2
0
2
1
2
2
1
0
1
2
0
0
1
2
0
1
1
Como hay tres niveles de gris, Pd[i,j] es de tamao 33. Sea, por
ejemplo d=(1,1). En la imagen existen 16 pares de pxeles que
satisfacen esta separacin espacial. La matriz Pd[i,j] resultante
para este valor de d es:
0
2
2
0
2
1
3
1
j
2
2
2
2
0
1
2
Textura (XI)
Anlisis: Mtodos estadsticos (de segundo orden)
Para analizar texturas pueden calcularse diferentes matrices de coocurrencias de la misma imagen con diferentes valores de d.
Algunas propiedades que pueden extraerse a partir de dicha
matriz son:
Energa (o segundo momento angular): Indica el grado de homogeneidad
de la imagen.
n n
Pd (i, j )2
i =1 j =1
k Pd (i, j )2 , donde : i j = k
k =0
i =1 j =1
Textura (XII)
Anlisis: Mtodos espectrales (Fourier)
Tambin a partir de la transformada de Fourier de una imagen,
se pueden analizar sus texturas predominantes.
El espectro de la transformada (su mdulo) |F(u,v)|, resulta ideal
para describir la direccin de los patrones peridicos 2D de la
imagen f(x,y). Tambin se puede utilizar la energa del espectro:
P(u,v) = |F(u,v)|2.
Se consideran dos caractersticas del espectro de Fourier de la
imagen que son tiles al describir texturas:
1) los picos prominentes del espectro indican la direccin
principal de los patrones de textura;
2) la localizacin de esos picos en el plano de frecuencias indican
el periodo espacial de los patrones.
Al expresar el espectro en coordenadas polares, se tiene: S(r,).
Por cada direccin de , S(r,) es una funcin 1D S(r), y
similarmente para cada frecuencia r, Sr().
Textura (XIII)
Anlisis: Mtodos espectrales (Fourier)
Se obtienen dos distribuciones:
S(r) = S (r)
=0
R0
S() = Sr ()
r=1