You are on page 1of 13

Informe de Laboratorio 1

Procesamiento Digital de Seales


lvarez Camilo, Dix Vernica
ledersonkmilo@hotmail.com, veronicadix@gmail.com


Abstract: In this paper we are going to present
the comprehension of audio signals, the
behavioral of SNR and the correlation, also
going to describe the signal behavior at the
time of the analogical to digital conversion by
viewing its losses using the quantization error.
Palabras Claves- Covarianza, Normalizacin,
Ruido gaussiano, SNR, Media, Desviacin
estndar, Correlacin, Convolucin, SQNR.

I. INTRODUCCIN
En este documento se plantea el anlisis de
seales de audio, para lo cual se trabaj
esperando obtener informacin como,
encontrar la similitud de seales con la
correlacin cruzada, el efecto que tiene la
normalizacin de las seales y saber qu pasa
con su SNR en los casos que se plantearon en
la gua, adems, los efectos que se tienen al
realizar una conversin A/D, tales como su
SQNR en diferentes niveles de cuantificacin
y el error o ruido de cuantificacin presente al
realizar dicha conversin.
II. desarrollo de contenido
3. Melody extraction from polyphonic music
signals, IEEE Signal Processing Magazine,
31(2), 118-134, 2014

a) Cul es el principal problema en la
deteccin de la frecuencia fundamental o
pitch de una seal de audio?

La complejidad de la tarea se debe
principalmente a dos factores: en primer
lugar, una seal de msica polifnica se
compone de la superposicin de las ondas
sonoras producidas por todos los
instrumentos en la grabacin, y gran parte del
tiempo estos instrumentos se desempean
simultneamente. Al considerar el contenido
espectral de la seal, los componentes de
frecuencia de diferentes fuentes se
superponen por lo que es muy difcil atribuir
los niveles especficos de energa en
determinadas bandas de frecuencias a las
notas de los instrumentos individuales. Otra
dificultad es la mezcla y tcnicas de
masterizacin que pueden aadir eco
(difuminando as inicios y finales de nota y
aumentando la superposicin de las fuentes
de sonido) o aplicar compresin de rango
dinmico (reduciendo as la diferencia entre
las fuentes suaves y fuertes, lo que aumenta la
interferencia). En segundo lugar, incluso
despus de que se obtiene una representacin
basada en el tono de la seal de audio,
todava tenemos que determinar qu valores
de tono pertenecen a la meloda predominante
y los que no son ms que acompaamiento.

b) Explique los pasos descritos en el artculo
para resolver el problema anterior.

Pre-procesamiento

El primer paso que se sugiere en la lectura es
algn tipo de procesamiento previo,
normalmente un filtro para mejorar el
contenido de frecuencia en la que esperamos
encontrar la meloda: aplica un filtro de paso
de banda de entre 261,6 Hz y
aproximadamente 4 kHz.
Algunos enfoques utilizan la separacin en
origen para mejorar la seal de la meloda
antes de ser procesado adicionalmente, Hsu y
Yeh utilizan una tcnica diseada
originalmente para la separacin del sonido
armnico-percusivo (HPSS) adaptados para
realizar la separacin de la meloda-
acompaamiento.

Transformacion espectral y procesamiento

La seal se corta en marcos de tiempo y una
funcin de transformacin se aplica para
obtener una representacin espectral de cada
marco. El enfoque ms sencillo es aplicar la
STFT, con una ventana de longitud entre 50 y
100 ms.

En general, estas transformaciones utilizan
ventanas ms grandes en las frecuencias bajas
(donde requerimos mayor resolucin de
frecuencia para resolver cercanos notas) y las
pequeas ventanas en las frecuencias ms
altas (en los que necesitamos de alta
resolucin temporal para rastrear rpidamente
cambiantes armnicos).

Por ltimo, observamos que algunos mtodos
utilizan transformaciones diseadas para
emular el sistema auditivo humano, tales
como el modelo utilizado por Paiva.

Despus de aplicar la transformacin, la
mayora de los enfoques slo utilizan los
picos espectrales para su posterior
procesamiento. Adems de la deteccin de los
picos s mismos, diferentes tcnicas de
procesamiento de pico se pueden aplicar:
algunos picos de mtodos basados en criterios
de magnitud. Otros enfoques se aplican
normalizacin de magnitud espectral en un
intento de reducir la influencia de timbre en
el anlisis. Tambien se pueden obtener
estimaciones de frecuencia y amplitud precisa
de cada pico espectral mediante el clculo de
su frecuencia instantnea del espectro de fase.

Salience function

En el ncleo de algoritmos basados en
prominencia se encuentra la Salience function.
Esta funcin proporciona una estimacin de
la relevancia de cada valor de paso posible
(dentro del rango en el que se espera
encontrar la meloda) con el tiempo.

Se pueden utilizar diferentes mtodos pueden
ser utilizados para obtener una funcin de
relevancia: la mayora de los enfoques
utilizan alguna forma de suma de armnicos,
por el que la prominencia de un cierto tono se
calcula como la suma ponderada de la
amplitud de sus frecuencias armnicas.

El enfoque de la funcin prominencia tiene
un principal efecto indeseable la aparicin de
los valores de tono "fantasmas" cuyos
frecuencia fundamental (f0) es un mltiplo
exacto (o submltiplo) de la f0 del sonido de
tono real. Este efecto puede llevar a lo que
comnmente se conoce como errores de
octava, en el que un algoritmo selecciona un
valor de tono que es exactamente una octava
por encima o por debajo del tono correcto de
la meloda

Algunos algoritmos, como los de Cancela y
Dressler, intentan reducir directamente el
nmero de valores de tono fantasmas
presentes en la funcin de relevancia.
Dressler hace esto mediante el examen de
pares de picos espectrales que potencialmente
pertenecen a la misma serie armnica y
atenuar el resultado de su suma si hay
muchos picos espectrales de alta amplitud
cuyas frecuencias se encuentran entre el par
que se considera.

Otro mtodo que se propone para reducir los
errores de octava en base a la suavidad
espectral. La amplitud de cada pico en la
funcin de prominencia se calcula de nuevo
despus del suavizado espectral envolvente
de sus frecuencias armnicas
correspondientes.


c) Cules son los problemas o limitaciones
con las bases de datos existentes en el campo
de extraccin de melodas a partir de seales
de audio?

Existen tres aspectos donde se presentan
limitaciones: la generacin de terreno la
verdad, la duracin de los extractos utilizados
en colecciones de ensayo, y el tamao y el
contenido de las propias colecciones.

Primero se presentan la falta de un protocolo
comn para la generacin de anotaciones
terreno la verdad podra potencialmente
conducir a errores sistemticos en la
evaluacin. Al comparar el rendimiento de
algoritmos en extractos con su desempeo
muestran que extractos menudo cortos no son
representativos de la cancin completa, lo que
implica que las colecciones de prueba deben
usar canciones completas en lugar de
extractos. Finalmente, se discute la
estabilidad y la representatividad de los
resultados en funcin del tamao de los
conjuntos de datos.

d) Explique las soluciones que proponen los
autores a los problemas o limitaciones de las
bases de datos existentes en el campo de
extraccin de melodas a partir de seales de
audio.
Para solucionar estos problemas es necesario
establecer un protocolo comn de anotacin y
compilar un nuevo conjunto de datos abierta
para su evaluacin. El conjunto de datos est
previsto incluir canciones completas, lo
suficientemente grandes como para
proporcionar resultados estadsticamente
estables y lo suficientemente variada para
representar un conjunto ms amplio de
gneros musicales que los actualmente
representados por las colecciones de
evaluacin existentes.
4.1. Anlisis de seales de audio
1.
En la actualidad para el anlisis de seales de
audio se est implementando algoritmos de
procesamiento digital de seales, el muestreo
es una de las partes del proceso de
digitalizacin de seales, el cual consiste en
tomar muestras de una seal analgica a una
frecuencia de muestreo constante.
Para lograr digitalizar la seal de audio el
coronel no tiene quien le escriba se usa la
herramienta computacional MatLab la cual
posee el comando wavread().


Fig. 1. Seal digitalizada" el coronel no tiene quien
le escriba"
La seal de audio tiene los canales L y R
exactamente igual. En la figura 1 se puede
observar que el canal L esta encima del R.

Teniendo la seal digitalizada se procede a
elaborar la matriz de covarianza, se realizara
de dos formas.


1. Usando las ecuaciones que permiten un
clculo eficiente con respecto a memoria y
tiempo.

Para garantizar el funcionamiento ptimo de
los dos mtodos expuestos anteriormente se
calcula la matriz de covarianza con la funcin
COV() de MatLab. A continuacin se
mostrara el resultado de la funcin COV():

[


]
Mtodo ineficiente
Usando el mtodo convencional e ineficiente.
De acuerdo a las siguientes ecuaciones;
(

)(

)(

)(



[


]
Mtodo eficiente
Para el mtodo ms eficiente. De acuerdo a
las siguientes ecuaciones;

)
(

)(




[


]
Con los resultados expuestos se verifica el
buen funcionamiento de los dos mtodos ya
que la matriz resultante de cada mtodo es
exactamente igual a la matriz realizada por
Matlab.
Por ltimo se calculara los tiempos que tarda
calcular la matriz de covarianza para cada
uno de los mtodos usados.



Numero
de
Pruebas
Ineficiente
(Seg.)
Eficiente
(Seg.)
T1 0.002859 0.001811
T2 0.003120 0.002267
T3 0.004953 0.003501
T4 0.003099 0.002281
T5 0.003233 0.002329
T6 0.003114 0.002288
T7 0.002239 0.001857
T8 0.003091 0.002328
T9 0.003140 0.002270
T10 0.003077 0.002366
Promedio
Total
0,0031925 0,0023298
Tabla1. Tiempo que toma calcular la matriz de
covarianza.

Revisando los datos de la tabla se puede
concluir que el tiempo que toma calcular la
matriz es diferente cada que se ejecuta el
programa, adems se corrobora que el
mtodo eficiente es ms rpido que el
ineficiente.

4.1.2. Promedio de estas M versiones de la
seal contaminada con ruido.

Fig. 2. Grafica para M=20


Fig. 3. Grafica para M=200
Como se puede observar en las figuras 2, 3, 4
y 5 se muestra la seal original de la frase El
coronel no tiene quien le escriba, con ruido
segn las especificaciones dadas en el
laboratorio, la seal original contaminada
con ruido y el efecto que ocurre al
promediarla un numero M de veces.

Como se puede observar en las figuras
mencionadas se destaca que en la seal
promediada M veces, entre ms grande sea
este nmero M, la seal se parecer o
coincidir un poco ms con la seal original,
se puede evidenciar claramente que las
figuras 4 y 5 de la seal promediada son muy
similares a su seal original, por ende,
segundo lo dicho anteriormente su parmetro
M es mayor como efectivamente se
comprob en la prctica.


Fig. 4. Grafica para M=2000


Fig. 5. Grafica para M=20000




Para la variacin del SNR en funcin de
las variaciones que le damos a M.


Fig. 6. SNR VS M

La figura 6, se puede observar la variacin
que tiene la SNR con respecto a M, siendo M
el nmero de veces que se promedia la seal
resultante.
Respecto al anlisis de esta grafica se puede
concluir que entre mayor sea el numero M de
muestras, la SNR tambin va a ser mayor, lo
que involucra que al promediar M veces la
seal, entre ms grande sea el valor de M, se
eliminara mejor el ruido, por lo tanto se tendr
una SNR mayor y la seal resultante ser muy
similar a la seal original.
Otra conclusin al respecto de la figura 6 es
que la SNR tiene a estabilizarse despus de
promediarla entre un numero M, lo que
significa que la eliminacin del ruido es casi
perfecta por lo tanto hacer N iteraciones ms,
es ineficiente, cabe resaltar que esto depende
de la aplicacin la cual se quiera desarrollar,
porque en algunos casos se puede soportar un
pequeo ruido y en otros no. (En la prctica se
evidencia que al promediar la seal entre M
=10000, la seal resultante tiene bastante
similitud con la original.
Siendo una seal de audio se hizo la prueba
al escucharla por los altoparlantes del
computador, obteniendo los resultados
esperados.)

SNR seal
contaminada
con ruido
M SNR seal
contaminada
con ruido y
promediada
M veces
5.0830 20 6.3555
4.4691 200 6.4243
4.6846 2000 6.4988
4.6024 20000 6.4661
Tabla 2.Valores de SNR con respecto a M

La tabla 2, tiene la informacin de la SNR de
la seal contaminada con ruido y la SNR de
la sea contaminada con ruido y promediada
M veces, segn la informacin se puede
concluir o evidenciar lo dicho en los puntos
anteriores, pero con datos cuantitativos.

Es evidente que los valores de SNR de la
seal con ruido y promediada son mayores
que la que no se promedia, lo que
efectivamente se espera, ya que se obtiene
una SNR mayor que dice que hubo una mejor
eliminacin del ruido.

Como se observa la SNR de la seal
contaminada con ruido y promediada M
veces tiene un valor mayor para cada caso de
M en este caso se debe aclarar que los
resultados tienen un comportamiento que
sube y en otro caso baja debido a que el ruido
que se le aade a la seal para las iteraciones
es diferente, lo que hace que la SNR en cada
iteracin vari y por ende los resultados
algunas veces sern mayores y otros muy
similares a los anteriores, adems de que
como se lo dijo en una conclusin anterior, el
valor de la SNR promediada se estabilizara en
un valor y sus resultados para M mayores
sern muy similares.

Matemticamente se puede demostrar de
la siguiente manera:


()


()

()


(

()

) (

()

()

)
(

()

) (

()

)
(

()

)
Debido a que es la seal original, y es la
misma para todos los valores de i.
Luego aplicamos la propiedad:
Var (ax)=

();
De esta manera tenemos:
(

()

)=
(


Esto dice que si se promedia N seales es
equivalente a disminuir la varianza del ruido
N veces.


5.1.1.
Correlacin de seales
La correlacin es una operacin que permite
extraer datos de una seal que est
contaminada con ruido u otra seal.
Se tom la frase El coronel no tiene quien le
escriba y extraiga el fonema tiene.
El procedimiento usado para encontrar la
palabra o fonema Tiene en la frase original
El coronel no tiene quien le escriba, se
realiz a partir de la correlacin cruzada que
hace un barrido de la seal original, dicho
mtodo encontrara que en su similitud abra
picos ms altos lo que involucra mayor
energa de la seal y coincidencia con la seal
correlacionada Tiene, a continuacin los
resultados:
A continuacin se realizara la normalizacin
de la seales El coronel no tiene quien le
escriba y Tiene a partir de dos mtodos y
se realizara la correlacin cruzada con el
resultado de las dos normalizaciones (1) y
(2).

(1)

(2)

Fig. 7. Normalizacin por los mtodos 1 y 2 de la
frase El coronel no tiene quien le escriba

Figura 8. Normalizacin por los mtodos 1 y 2 de la
palabra Tiene
La normalizacin por el mtodo 1 muestra los
datos con respecto al rango total de la seal,
de esta manera es posible determinar los
valores de la seal con respecto al mximo
valor de la seal.
La normalizacin por el mtodo 2 muestra los
datos con respecto a la desviacin estndar,
haciendo ms notable la diferencia que hay
entre todo el conjunto de datos.

Fig. 9. Seal de correlacin seales sin normalizar.

La figura 9, muestra unos picos ms altos que
otros, en este instante de tiempo se encuentra
la palabra quien, debido a que en ese instante
esta la mayor concentracin de energa.
Fig. 10. Seal de correlacin con la normalizacin 1
para cada seal

Fig. 11. Seal de correlacin con la normalizacin 1
para cada seal, ampliada en la zona de inters.

Las figuras 10 y 11 corresponden a la
correlacin cruzada entre las seales
mencionadas por el mtodo de normalizacin
1, en figura 11 se puede analizar que en la
seal existen picos altos donde est la mayor
concentracin de energa por lo tanto en ese
instante existe la mayor coincidencia entre las
seales correlacionadas.
Fig. 12. Seal de correlacin con la normalizacin 2
para cada seal
La figura 12, muestra la correlacin cruzada de
las seales, por el mtodo de normalizacin 2,
en este caso se obtiene que la palabra Tiene
seal se encuentra en el pico ms alto de la
seal en el valor de la correlacin. Ah est la
mayor energa de la seal por ende se puede
concluir que en este instante hay mayor
coincidencia entre la seales correlacionadas.




5.2. Error de cuantizacin en conversin
A/D de una seal sinusoidal.
1.
La cuantificacin es uno de los pasos para la
digitalizacin de una seal analgica, en este
caso se cuantificara la seal.
[] ()
Bsicamente lo que se hace es convertir una
sucesin de muestras de amplitud continua en
una sucesin de valores discretos.
Teniendo claro el proceso de cuantificacin
se procede a disear un cdigo en la
herramienta MatLab para cuantizar la seal
[] con amplitudes y
usando las longitudes de palabra o nmero de
bits b=3 y b=8 con los cuales se puede
calcular los niveles de cuantizacin.
Niveles de cuantizacin para 3 bits.


Para la longitud de palabra de 3 bits el
nmero de niveles de cuantizacin son 8.
Niveles de cuantizacin para 8 bits.


Para la longitud de palabra de bits el nmero
de niveles de cuantizacin son 256.
Teniendo definido los niveles de cuantizacin
se procede a calcular los pasos de
cuantizacin de la seal, que est definida
por:



Para realizar el programa de cuantizacin de
la seal senoidal usando truncamiento se
utiliz el comando round y para el
truncamiento se utiliz el comando floor de la
herramienta MatLab.






Proceso de truncamiento y redondeo para
y b=3.


Fig. 13. Grafica usando la operacin de
truncamiento para el anlisis de la secuencia de
error


Fig. 14. Grafica usando la operacin de
redondeo para el anlisis de la secuencia de
error

Proceso de truncamiento y redondeo para
y b=3.




Fig. 15. Grafica usando la operacin de
truncamiento para el anlisis de la secuencia de
error


Fig. 16. Grafica usando la operacin de redondeo
para el anlisis de la secuencia de error

Proceso de truncamiento y redondeo para
y b=8.




Fig. 17. Grafica usando la operacin de
truncamiento para el anlisis de la secuencia de
error

Fig. 18. Grafica usando la operacin de redondeo
para el anlisis de la secuencia de error


Proceso de truncamiento y redondeo para
y b=8.




Fig. 19. Grafica usando la operacin de
truncamiento para el anlisis de la secuencia de
error


Fig. 20. Grafica usando la operacin de redondeo
para el anlisis de la secuencia de error

El anlisis de la Figura13 a la Figura20, nos
muestra que entre mayor sean los niveles de
cuantizacin la seal hecha ya sea por la
operacin de redondeo o truncamiento, ser
ms parecida a la original, adems la
secuencia de error es menor.
Tambin se puede decir que el cambio de
amplitud no afecta las operaciones ya que la
seal dada sigue siendo igual a la original.
2.
Teniendo la secuencia de error calculada en el
anterior punto se puede determinar la media,
la varianza, la densidad de probabilidad y la
secuencia de autocorrelacin.

Anlisis de la media y la varianza
La media se obtiene a partir de la suma de
todos sus valores dividida entre el nmero de
datos.
La varianza es una medida de
dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable
respecto a su media.

Datos Media Varianza
Truncamie
nto
y
b=3
-1.249531e-01 6.162242e-03
Redondeo
y
b=3
-5.197204e-18 4.593647e-03
Truncamie
nto

y b=3
-3.904785e-03 6.017814e-06
Redondeo

y b=3
-1.624126e-19 4.485983e-06
Truncamie
nto
y
b=8
-3.904785e-03 5.249873e-06
Redondeo
y
b=8
-9.255118e-20 4.980506e-06
Truncamie
nto

y b=8
-1.220245e-04 5.126829e-09
Redondeo

y b=8
-2.892224e-21 4.863776e-09
Tabla3. Datos de varianza y redondeo.

La Tabla3 muestra que entre ms niveles de
cuantizacin y menor amplitud se tenga
menor ser su varianza y su media.
Anlisis de la densidad de probabilidad
La densidad de probabilidad describe la
probabilidad relativa segn la cual
dicha variable aleatoria tomar determinado
valor.

Fig. 21. Densidad de probabilidad para a=1 y b=3


Fig. 22. Densidad de probabilidad para a=1/32 y b=3

En la Figura21 y la Figura22 se observa que
para el redondeo la probabilidad mxima est
en cero. Para el truncamiento se hace
diferente gracias al cambio de amplitud.


Fig. 23. Densidad de probabilidad para a=1 y b=8


Fig. 24 Densidad de probabilidad para a=1/32 y b=8

Para la Figura 24 y Figura23 para el redondeo
se ve un pequeo pico en cero pero su
probabilidad est distribuida
aproximadamente igual en sus puntos de
error, para el caso del truncamiento tambin
la probabilidad est distribuida
aproximadamente igual en sus puntos de
error.
Se puede concluir que entre mayor sea el
nmero de niveles de cuantizacin la
probabilidad se distribuir mejor en los
puntos de error.

Secuencia de auto correlacin
La autocorrelacin se define como
la correlacin cruzada de la seal consigo
misma.

Fig. 25. Secuencia de autocorrelacin para a=1 y b=3

Fig. 26. Secuencia de autocorrelacin para a=1/32 y
b=3

Fig. 27. Secuencia de autocorrelacin para a=1 y b=8

Fig. 28. Secuencia de autocorrelacin para a=1/32 y
b=8

Para la Figura25, Figura26, Figura27 y
Figura29 se puede decir que donde est el
pico hay mayor concentracin de energa.

Conclusiones
Con los modelos matemticos podemos
simplificar expresiones matemticas que nos
ayudan a mejora el rendimiento
computacional como se demostr en el punto
1 del laboratorio analizando las tcnicas
eficientes e ineficientes.
Como se observ en el desarrollo del
informe, es posible eliminar el ruido de una
seal contaminada, promediando la seal con
ruido para obtener una mejor SNR.
La correlacin es una herramienta para el
anlisis de seales, con la cual se puede
determinar caractersticas como el retraso de
la seal, encontrar palabras o fonemas,
similitud entre seales, adems de poder
encontrar el periodo fundamental de la seal.
Aunque la correlacin nos permite ver que
tan relacionada esta una seal con otra, no por
eso se puede deducir que una es causa de la
otra.
Se determin tambin que el mejor mtodo de
normalizacin es el 2, debido a que muestra
los datos con respecto a la desviacin
estndar, haciendo ms notable la diferencia
que hay entre todo el conjunto de datos.
Para cuantizar una seal discreta se debe
tener en cuenta que entre mayor nmero de
niveles de cuantizacin tenga la seal se
parecer ms a la original sin importar el tipo
de operacin que se use ya sea de redondeo y
truncamiento.
Si el error es cero, entonces la SQNR es
infinita, lo cual quiere decir que un mayor
valor de la misma, nos indica que tenemos
una mejor cuantizacin de la seal y que por
lo tanto la calidad de la seal tratada va a ser
mejor.

Referencias

[1] Poarkis J,Monolakis D, Digital Signal
Prosesing, 4 ed., New Jersey

You might also like