You are on page 1of 12

APRENDIZAGEM POR IMITAO ATRAVS DE MAPEAMENTO VISUOMOTOR BASEADO EM IMAGENS OMNIDIRECIONAIS

Raquel Frizera Vassallo


raquel@ele.ufes.br hans@ele.ufes.br Dept. de Engenharia Eltrica UFES - Universidade Federal do Esprito Santo Av. Fernando Ferrari, 514, 29075-910, Vitria - ES, Brasil ISR - Instituto de Sistemas e Robtica IST - Instituto Superior Tecnico Av. Rovisco Paes, 1 Torre Norte, Piso 7 1049-001, Lisboa, Portugal

Jos Alberto Santos-Victor


jasv@isr.ist.utl.pt

Hans Jrg Andreas Schneebeli

ABSTRACT
We propose an approach that allows a robot to learn a task and represent/adapt it to its own motor repertoire. First the robot creates a sensorimotor map to convert sensorial information into motor data. Then learning happens through imitation, using motor representations. By imitating other agents, the robot learns a set of elementary motions that forms a motor vocabulary. That vocabulary can eventually be used to compose more complex actions, by combining basic actions, for each specic task domain. We illustrate the approach in a mobile robotics task: topological mapping and navigation. Egomotion estimation is used as a visuomotor map and allows the robot to learn a motor vocabulary coverting optical ow measurements from omnidirectional images into motor information. Then the learnt vocabulary is used for topological mapping and navigation.The approach can be extended to different robots and applications. Encouraging results are presented and discussed.

KEYWORDS: Learning through imitation, Robot Naviga-

tion, Egomotion, Omnidirectional Vision.

RESUMO
Este trabalho prope uma metodologia de aprendizagem que permite a um rob aprender uma tarefa adaptando-a e representando-a de acordo com a sua capacidade motora e sensorial. Primeiramente, um mapeamento sensoriomotor criado e converte informao sensorial em informao motora. Depois, atravs de imitao, o rob aprende um conjunto de aes elementares formando um vocabulrio motor. A imitao baseada nas representaes motoras obtidas com o mapeamento sensoriomotor. O vocabulrio motor criado ento utilizado para aprender e realizar tarefas mais sosticadas, compostas por seqncias ou combinaes de aes elementares. Esta metodologia ilustrada atravs de uma aplicao de mapeamento e navegao topolgica com um rob mvel. O automovimento utilizado como mapeamento visuomotor, convertendo o uxo ptico em imagens omnidirecionais em informao motora (translao e rotao), a qual usada para a criao de um vocabulrio motor. A seguir, o vocabulrio utilizado para mapeamento e nave-

Artigo submetido em 18/01/2006 1a. Reviso em 09/11/2006 Aceito sob recomendao do Editor Associado Prof. Jos Reinaldo Silva

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

gao topolgica. Os resultados obtidos so interessantes e a abordagem proposta pode ser estendida a diferentes robs e aplicaes.
PALAVRAS-CHAVE: Aprendizagem por imitao, Navega-

o robtica, Automovimento, Viso Omnidirecional.

INTRODUO

As primeiras aplicaes em robtica, nos anos 60, eram principalmente voltadas para a indstria, com o objetivo de automatizar e aumentar a produo. Manipuladores programados para repetir os mesmos movimentos trabalhavam em ambientes bem estruturados, com quase nenhuma incerteza. Depois, novas aplicaes, tendncias e paradigmas surgiram, trazendo a necessidade de robs mveis e mais autnomos (Murphy, 2000; Arkin, 1998; Brooks, 1986; Braitenberg, 1984). Hoje, espera-se que robs atuem em ambientes menos estruturados e mais dinmicos, interagindo com os humanos e tomando decises autonomamente. A interao com as pessoas deve ocorrer sem que se precise entender de robtica ou programao. Isto representa um desao em que se pretende alcanar adaptabilidade sem atingir um alto grau de complexidade. A adaptabilidade representa dar ao rob capacidade de aprendizagem e adaptao enquanto interage com o ambiente e com outros agentes. A complexidade est associada ao projeto e programao, e aumenta quando preciso prever todas as aes do rob, considerar mais sensores e algoritmos de controle. Na natureza, h exemplos de como este desao pode ser abordado. Animais so sistemas complexos e funcionais, que aprendem e se adaptam. Seu desenvolvimento ocorre em etapas sucessivas de aprendizagem, aumentando gradativamente o nvel de abstrao. Por isso, h um interesse em saber como isto acontece na natureza para ento se criar sistemas que atuem da mesma forma (Brooks, 2001; Fitzpatrick et al., 2003; Lungarella and Pfeifer, 2001; Metta, Sandini, Natale, Manzotti and Panerai, 2001). Quando bebs movem suas mos no seu campo visual, esto descobrindo o seu prprio corpo, sua calibrao e controle (Meltzoff and Moore, 1989), relacionando percepo e movimento. Depois desta etapa de auto-conhecimento, integram viso, tato, audio, para focar sua ateno, acompanhar movimentos e alcanar objetos de interesse. Seguem continuamente aprimorando os movimentos e aprendendo movimentos mais complexos. Estas idias podem ser aplicadas robtica, criando sistemas que se desenvolvam, aprendam e adaptem-se atravs da interao com outros agentes e o ambiente, sem uma programao rgida, a qual pode ser ampliada medida que o rob conhece a si mesmo e aprende novas tarefas. Esta a principal motivao para este trabalho, o qual prope uma me2

todologia que possibilita um rob, com pouca programao prvia, aprender a realizar tarefas atravs de um aprendizado gradativo de aes, enquanto interage com pessoas e com o ambiente. O aprendizado estimulado pela viso e imitao. Inicialmente, h uma etapa de auto-conhecimento em que se dene um mapeamento visuomotor, que relaciona informao visual e motora, facilitando o reconhecimento de aes. Em seguida, este mapeamento utilizado nas etapas seguintes de aprendizagem por imitao, onde um vocabulrio de aes bsicas adquirido e aes mais complexas (tarefas) so aprendidas pelo rob.

1.1

Trabalhos relacionados

A imitao um mecanismo poderoso de aprendizagem social que permite evitar a tentativa e erro (Call and Carpenter, 2002). vantajosa quando errar representa um alto custo, ou aprender por experincia prpria demorado (Visalberghi and Fragaszy, 2002; Meltzoff and Moore, 1989). Entretanto, para haver imitao, preciso que o observador relacione os movimentos e o corpo do demonstrador com o seu prprio corpo e movimentos, ou seja, resolva o chamado Problema da Correspondncia (Nehaniv and Dautenhahn, 2002). Algumas teorias e hipteses no estudo cognitvo sugerem a existncia de uma representao comum entre ao e percepo que facilita o entendimento e a repetio de movimentos observados (Decety, 2002; Prinz, 2002). Descobertas da neurosiologia reforam esta hiptese e podem ser uma soluo natural para o problema da correspondncia. So neurnios visuomotores, relacionados a movimentos de boca e mos, que disparam quando se executa uma determinada ao ou se observa um indivduo executla independente da posio ou orientao em que realizada (Fadiga et al., 2000). Chamados de mirror neurons, encontram-se na rea F5 do crtex premotor do crebro dos macacos. H tambm evidncias da sua existncia no crebro humano, na rea de Brocca, homloga rea F5. Aparentemente, caraterizam o signicado da ao e no simplesmente o movimento. Por estarem numa rea motora do crebro, sugerem que a ao reconhecida no espao motor, independente do ponto de observao, ou seja, sem um referencial xo; o que parece ser bem vantajoso. Supe-se que estabeleam uma relao entre a ao observada e a capacidade motora para realiz-la, formando um vocabulrio motor interno de aes elementares (Rizzolatti et al., 2002). Podem ser a base para a imitao e o aprendizado de aes mais complexas, como gestos ou aes constitudas pela combinao, seqncia ou mistura de aes bsicas. O aprendizado por imitao j vem sendo explorado em muitos trabalhos de robtica (Dautenhahn and Nehaniv, 2002). A chamada Programao por Exemplo/Demonstrao (Lieberman, 2002; Kasper et al., 2001), tenta capacitar um

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

rob para imitar humanos e aprender atravs de exemplos, sem que se programe novas linhas de cdigo. Em (Billard, 2002), a imitao usada para criar uma proto-linguagem de comunicao entre dois robs mveis e tambm entre um rob e um ser humano. Em (Arbib et al., 2000; Schaal et al., 2003), modelos de aprendizagem baseados nos mirror neurons so criados, usando-se redes neurais para denir mdulos de percepo, sensoriomotores e motores, semelhantes ao que se acredita ser um modelo biolgico. Em (Matric, 2002), um modelo denido atravs de primitivas sensoriomotoras e usado para a aprendizagem de aes por imitao entre robs do mesmo tipo, tipos diferentes e entre robs e seres humanos. Alguns trabalhos j sugerem um desenvolvimento gradativo baseado em mapeamentos sensoriomotores. Em (Metta, Sandini, Natale and Panerai, 2001), um rob humanide usa sensores (viso estreo, sensores acsticos e inerciais) para aprender causalidade. Observa os efeitos de seus movimentos e realiza um processo contnuo de adaptao e coordenao sensoriomotora. Em (Lopes and Santos-Victor, 2003b), um manipulador deve imitar gestos feitos por uma pessoa usando um mapeamento visuomotor e uma transformao de ponto de vista, que converte a imagem do brao da pessoa em uma ego-imagem, transferindo informao de juntas, como o ombro e o cotovelo, da imagem para o referencial do rob. J em (Lopes and Santos-Victor, 2003a), o mapeamento visuomotor implementado com uma rede neural, a qual utilizada num processo Bayesiano para reconhecimento de movimentos. Assim como nos trabalhos citados e motivado pelo desao de complexidade e adaptabilidade no projeto de robs mais autnomos, o problema aqui abordado encontrar um mecanismo de aprendizagem que funcione a partir de pouca programao prvia e que permita a um rob aprender e se adaptar tarefa que dever realizar. Nossa proposta uma metodologia de adaptao e aprendizagem inspirada no processo de desenvolvimento que se observa na natureza. baseada num aprendizado gradativo de aes, iniciando-se com uma etapa de auto-conhecimento em que se dene um mapeamento visuomotor. Em seguida, este mapeamento age como facilitador das etapas seguintes de aprendizagem por imitao, onde aes mais complexas e tarefas so aprendidas pelo rob. A seguir, na Seo 2 ser descrita a metodologia proposta neste trabalho. Depois, na Seo 3 o mapeamento sensoriomotor discutido, enquanto que a Seo 4 descreve o aprendizado de um vocabulrio motor bsico atravs de imitao. Depois este vocabulrio utilizado para a realizao de tarefas de mapeamento e navegao topolgica descritas na Seo 5, que representa o aprendizado de aes mais sosticadas. Alguns resultados experimentais so mostrados na

Seo 6 e as concluses e contribuies do trabalho so discutidas na Seo 7.

A METODOLOGIA PROPOSTA

A metodologia proposta considera uma hierarquia de aes, onde a complexidade aumenta medida que se sobe na hierarquia. Esta idia est ilustrada de forma resumida na Figura 1. No primeiro nvel aprende-se um mapeamento sensoriomotor que relaciona informao sensorial e motora possibilitando a compreenso da prpria ao, da ao de outros agentes e, conseqentemente, a aprendizagem por imitao nas etapas seguintes. O mapeamento pode ser denido analiticamente ou adquirido atravs da auto-explorao, durante a qual o rob se move e aprende a relacionar os movimentos executados (espao motor) com os efeitos na sua percepo (espao sensorial). O espao sensorial denido de acordo com os sensores utilizados, enquanto o espao motor depende da forma e estrutura mecnica do rob.
~ Aoes Sofisticadas

Aprendizagem Social

GESTOS E TAREFAS

~ Hierarquia de aoes

VOCABULARIO MOTOR

~ Aoes Elementares

Auto conhecimento

MAPEAMENTO SENSORIOMOTOR

Sinais Motores e Sensoriais

Figura 1: Aprendizado atravs de uma hierarquia de aes. A segunda etapa inclui aprendizagem por imitao. O mapeamento sensoriomotor usado para perceber e denir de forma motora os movimentos realizados pelo rob enquanto imita algum. Aes bsicas so aprendidas e denem um vocabulrio motor, j possuindo um certo signicado, representando mais que os sinais motores do nvel anterior. Cada ao bsica corresponde a uma palavra motora e representada no espao motor segundo a capacidade do rob utilizado. Depois de aprender tais aes bsicas, o rob capaz de reconhecer aes quando as realiza ou as observa e imita outro agente. No nvel mais alto, aes mais sosticadas so denidas a partir do vocabulrio motor aprendido, sendo normalmente formadas por combinaes ou seqncias de aes bsicas. Tambm so aprendidas atravs de imitao enquanto o rob interage com outros agentes para aprender uma nova tarefa. Desta forma, o rob aprende e se adapta realizao de tarefas, sem a necessidade de programao prvia dos seus movimentos. Neste nvel, se enquadram aes mais complexas
3

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

como gestos ou ir de um local A at um local B. Esta abordagem pode ser aplicada a diferentes robs. Para um manipulador ou rob com patas, o espao motor pode ser denido por posies e ngulos de juntas, alm de velocidades de motores. Para um rob a rodas, pode ser dado pelas suas velocidades linear e angular. Sensores como infravermelho, ultra-som ou laser, formam um espao sensorial dado por distncias e profundidades, enquanto cmeras, geram posies de pontos numa imagem ou uxo ptico. Com manipuladores, o problema da correspondncia pode ser resolvido atravs de uma transformao entre referenciais (Lopes and Santos-Victor, 2003b); no caso de robs mveis, pode ser conseguido com um controle servo-visual ou outra forma de transferir informao sensorial para motora. Para ilustrar a metodologia proposta, foi implementada uma tarefa de mapeamento e navegao topolgica com um rob mvel a rodas diferencial. O rob utilizado foi um Pioneer2DX diferencial com um computador a bordo e dois sistemas de viso: uma cmera perspectiva colorida, apontada para a frente, e um sistema de viso omnidirecional, formado por um espelho esfrico e uma cmera monocromtica, alinhado com o centro de rotao da plataforma. O sistema de coordenadas adotado para o rob est alinhado com o referencial da cmera omnidirecional, tendo o eixo Z como o eixo de rotao e coincidente com o eixo ptico da cmera, que aponta para cima. Desta forma o rob possui velocidades Ty de translao e z de rotao. Veja Figura 2. Inicialmente, foi denido um mapeamento visuomotor, implementado como automovimento1, que converte uxo ptico de imagens omnidirecionais para as velocidades linear e angular do rob. Depois, o mapeamento foi utilizado na imitao para o aprendizado de um vocabulrio motor bsico. A imitao foi implementada atravs do seguimento de pessoas, usando-se a cmera perspectiva do rob e resolvendo-se o problema da correspondncia atravs de um controle servovisual. O vocabulrio motor cou formado por aes aprendidas (palavras motoras) atravs da converso de informaes visuais em sinais motores. Assim, o rob pde reconhecer aes quando as executava ou repetia durante novas imitaes. Finalmente, o vocabulrio motor foi usado para mapeamento e navegao topolgica no ambiente. O mapa topolgico foi criado como um grafo, tendo imagens omnidirecionais como ns, e palavras motoras associadas aos arcos. O mapa criado desta forma possibilitou a realizao das aes mais complexas como ir at A ou ir de A at B no mapa.
Y Frente

Rodas Motorizadas

Roda Livre

Figura 2: O rob e o referencial adotado.

MAPEAMENTO VISUOMOTOR

Um mapeamento visuomotor deve relacionar informao visual com informao motora. Desta forma, o automovimento ou egomotion pode ser visto como um tipo de mapeamento visuomotor, pois recupera o movimento de uma cmera a partir da informao visual adquirida. Estando a cmera acoplada a um rob, estimar o seu automovimento signica recuperar o movimento do rob. Neste trabalho, o autovimento foi implementado de duas formas: uma forma analtica, atravs de equaes para a estimativa do movimento a partir de imagens omnidirecionais; e por redes neurais, como uma etapa de auto-conhecimento (Vassallo, 2004). Entretanto, aqui ser relatada apenas a forma analtica, que trouxe contribuies novas no estudo de imagens omnidirecionais. Para cmeras perspectivas, estimativar o automovimento normalmente mais difcil, pois, devido ao campo de viso reduzido, comum que diferentes movimentos produzam uxos semelhantes na imagem, gerando ambigidades entre rotao e translao (Daniilidis and Nagel, 1993) (Ex: uma rotao perpendicular ao eixo ptico produz efeito similar a

1 Recuperar o movimento executado por uma cmera a partir de uma seqncia de imagens capturadas durante o movimento

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

uma translao paralela ao plano da imagem). Porm, com um campo de movimento esfrico, o automovimento ca facilitado (Nelson and Aloimonos, 1988), porque tanto o foco de expanso (FOE) quanto o foco de contrao (FOC) aparecem na imagem. Nestes casos, raramente movimentos diferentes produzem o mesmo campo de vetores e a estimativa do automovimento quase nunca ambgua. possvel obter um campo de movimento hemisfrico usando-se imagens omnidirecionais, e com isso, realizar melhores estimativas de automovimento do que as obtidas com cmeras perspectivas convencionais. Assim como em (Gluckman and Nayar, 1998; Vassallo et al., 2002a), uma seqncia de imagens omnidirecionais usada para calcular o uxo ptico2 , cujos vetores so reprojetados na superfcie da esfera unitria, atravs de uma matriz Jacobiano. A seguir, o uxo esfrico usado para estimar o automovimento, adaptando-se algoritmos de projeo perspectiva para a projeo esfrica. Entretanto, em (Gluckman and Nayar, 1998), o Jacobiano depende da equao de projeo do conjunto cmera/espelho, alterando-se a sua expresso sempre que um sistema diferente usado. Ao invs disto, neste trabalho apresentada uma expresso geral para o Jacobiano, que pode ser aplicada a diferentes sistemas omnidirecionais com centro nico de projeo ou que se aproximam de sistemas deste gnero (Vassallo et al., 2002a). A expresso para o Jacobiano Geral foi denida a partir do Modelo Geral de Projeo de Geyer e Daniilidis (Geyer and Daniilidis, 2000), mostrado na Figura 3, o qual representa vrios sistemas omnidirecionais com centro nico de projeo variando-se os parmetros l e m.
P(X, Y, Z) O l m B p(x, y) plano da imagem C

distncia entre os focos da curva que dene o espelho (Geyer and Daniilidis, 2001). Considerando-se a esfera na origem, a projeo p(x, y) de um ponto P (X, Y, Z) denida pela Equao 1.

x y R

= =

l+m X lR Z Y

com

(1)

X2 + Y 2 + Z2

Para calcular o Jacobiano Geral preciso, primeiramente, obter a projeo inversa. A projeo inversa de um ponto (x, y) na imagem dene um ponto na esfera unitria (X, Y , Z), j que no possvel recuperar a profundidade de pontos 3D com apenas uma imagem, e representa a direo do raio proveniente do ponto 3D original. Veja Equao 2.

lA + sinal(A) (x2 + y 2 )(1 l2 ) + A2 x X = y x2 + y 2 + A 2 Y com A = l + m e Z = 1 X 2 Y 2

(2)

onde Z ser negativo se |l + m|/l > x2 + y 2 e positivo caso contrrio. Vale ressaltar que os parmetros intrnsecos da cmera, no foram includos nas Equaes 1 e 2, devendo ser considerados quando se utilizam estas equaes. A seguir, o Jacobiano Geral obtido atravs da derivada temporal da Equao 2. Ele converte as velocidades na imagem (x, y) para vetores na superfcie da esfera unitria (X, Y, Z), segundo a Equao 3. A projeo inversa de pontos de uma imagem omnidirecional e o remapeamento de vetores de uxo podem ser vistos na Figura 4.

[X Y Z]T com J

= J[x y]T =
X x X y Y x Y y Z x Z y T

(3)

Figura 3: Modelo geral de projeo. Neste modelo, um ponto P projetado na esfera unitria atravs do seu centro C. Depois, P projetado a partir do centro de projeo O para o plano da imagem. As distncias de C ao ponto O e ao plano da imagem representam os parmetros l e m, que para espelhos hiperblicos, elpticos ou parablicos, assumem valores relacionados excentricidade e
2 Aqui

Para o automovimento, preciso denir a equao do campo de movimento esfrico com relao s velocidades linear e angular da cmera/rob, e depois us-la juntamente com os vetores calculados, a partir das imagens, para a estimativa das velocidades. Para uma cmera com velocidade linear T e velocidade angular , a velocidade de um ponto P na esfera unitria com relao cmera dada pela Equao 4. U (P ) = 1 ((T P )P T ) P P

considerado equivalente ao campo de movimento

(4)
5

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

dois modelos dados pelas Equaes 5 e 6. Para se decidir entre um modelo e outro, deniu-se uma metodologia em que, inicialmente, o modelo 6 usado para a estimativa. A seguir, o resduo r entre o uxo observado, obtido a partir das imagens omnidirecionais, e o uxo reconstrudo com a rotao estimada calculado. Este resduo assume valores bem diferentes quando o movimento inclui ou no uma parcela de translao e calculado como
0 0 0.5 0.5 0.5

0 0.5 1 1.5

0.5

r =U +P

(7)

onde a velocidade angular estimada e r e U so, respec tivamente, o resduo e o uxo observado em cada ponto P da esfera unitria.
0 0.5

1.5 0.5 0 0.5 0.5 1 1 0 1 0.5

A norma da mdia do resduo r e o seu desvio padro r representam a qualidade da estimativa obtida com o modelo 6. Ao se observar os valores que essas duas variveis assumem para os diferentes tipos de movimento, possvel distinguir movimentos que incluem translao de movimentos em que h apenas rotao e escolher empiricamente valores limite para se determinar a escolha do modelo. Se r e r excederem os limites estabelecidos, ento o mo vimento em questo possivelmente contm uma componente de translao e, portanto, o modelo 5 dever ser empregado. Caso contrrio, o movimento basicamente de rotao e o modelo 6 j satisfaz (Vassallo et al., 2002a; Vassallo, 2004).

Figura 4: Projeo inversa dos pontos e remapeamento de vetores de uxo para a esfera unitria. O objetivo encontrar T e a partir do campo de movimento esfrico U , dado pelos vetores de uxo calculados com as imagens omnidirecionais e remapeados para a esfera unitria atravs do Jacobiano. Como a profundidade P no pode ser recuperada pela projeo inversa dos pontos, a Equao 4 no pode ser usada diretamente. Entretanto, quando T = 0, possvel eliminar a dependncia de P atravs de um pro duto vetorial com P e um produto interno com T , chegandose Equao 5. A nova expresso pode ser usada para a estimativa do automovimento usando-se um algoritmo baseado no de Bruss e Horn (Bruss and Horn, 1983). Os valores de T e so estimados por mnimos quadrados no-linear, considerando-se a restrio T = 1. A rotao recuperada completamente, enquanto a translao recuperada a menos de um fator de escala, estimando-se apenas a sua direo e sentido. O processo iterativo e similar a (Tian et al., 1996). Para movimentos com apenas rotao, a Equao 4 pode ser reescrita como a Equao 6. Neste caso, calculado com uma estimativa simples por mnimos quadrados. T (P (U + ( P ))) = 0 U (P ) = P (5) (6)

APRENDENDO UM VOCABULRIO MOTOR ATRAVS DE IMITAO

A capacidade de imitao do rob foi implementada como o seguimento de pessoas, usando-se a cmera perspectiva colorida que aponta para a frente (Vassallo et al., 2002b). Sem prejuzo para a idia central do trabalho, considerou-se que a pessoa deve segurar um retngulo verde enquanto o rob a segue e aprende movimentos bsicos. O problema da correspondncia foi resolvido com uma estratgia de controle servo-visual, em que as coordenadas dos vrtices do retngulo so comparadas com posies de referncia e o erro usado para corrigir as velocidades linear e angular do rob. O rob procura seguir o retngulo a uma distncia xa e sempre orientado para o seu centro. A deteco do retngulo feita com segmentao por cor no formato HSV (Hue-Saturation-Value), utilizando-se o canal hue ou matiz. Os pontos verdes da imagem so detectados e a imagem binria resultante ltrada atravs de operaes morfolgicas para se eliminar parte do rudo. O maior conjunto de pixels considerado como o retngulo. O seu contorno detectado e os seus vrtices encontrados atravs da interseo das retas estimadas por um mtodo de ajuste ro-

Desta forma, o automovimento pode ser estimado atravs dos


6

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

busto (Fischler and Bolles, 1981). A Figura 5 mostra o processo de deteco dos vrtices do retngulo.

Desta forma, o rob torna-se capaz de imitar/seguir algum e, assim, pode aprender movimentos elementares. Durante a imitao, a pessoa executa as aes que pretende ensinar e, enquanto repete os movimentos, o rob usa o mapeamento visuomotor para converter sua percepo visual em informao motora, armazenando suas caractersticas. Depois, os movimentos so classicados em clusters de forma nosupervisionada baseada no mtodo de K-mdias. A classicao feita no espao motor considerando o sentido/direo de translao e a velocidade de rotao. Esta classicao indica os movimentos executados com maior freqncia e o centride de cada classe representa as aes bsicas aprendidas. Estas aes constituem as palavras do vocabulrio motor bsico e diferem de simples sinais motores porque j possuem um signicado, um objetivo. Posteriormente, para reconhecer aes j aprendidas, quando o rob se move, os sinais motores, obtidos atravs do automovimento, so comparados com os centrides de cada palavra motora usando-se uma funo de discriminao baseada na distncia Euclidiana.

Figura 5: Deteco dos vrtices do retngulo verde.

5
O controle servo-visual para o seguimento do retngulo denido considerando-se o referencial da cmera no centro de projeo e o eixo-Y coincidente com o eixo ptico. Com isso, a matriz que relaciona os vrtices do retngulo na imagem com as velocidades Ty e z do rob dada pela Equao 8. Os ndices de 1 a 4 das variveis indicam a sua relao com os vrtices correspondentes.
x1 z1 ... x4 z4 ... ... T = J82
x4 Y4 l

MAPEAMENTO E NAVEGAO TOPOLGICA

Ty z

com #T (8)

J82 =

"

Y1 Y1 l

x1 Y1 l

+ x2 1

z1 Y1 l

x1 z1

Y4 Y4 l

+ x2 4

z4 Y4 l

x4 z4

O prximo passo aprender tarefas que incluem aes mais complexas, executadas atravs de uma seqncia ou combinaoes de aes bsicas. Para um rob mvel realizar aes do tipo V at A ou V de A at B no ambiente de trabalho, preciso que ele saiba se localizar e encontrar um caminho possvel entre estes pontos. A aplicao escolhida para ilustrar este trabalho foi mapeamento e navegao topolgica. O mapeamento corresponde ao aprendizado do mapa e de novas aes mais complexas, enquanto navegar no mapa criado representa executar essas tarefas depois de aprendidas. Para a criao do mapa, o rob guiado no ambiente por uma pessoa. O mapa topolgico ser um grafo tendo imagens omnidirecionais como ns e palavras motoras associadas aos arcos, representando a ao executada com mais freqncia entre cada par de ns. Durante o mapeamento, imagens so constantemente capturadas e comparadas com o ltimo n armazenado, ao mesmo tempo que o movimento realizado reconhecido usando-se o vocabulrio motor bsico. Um novo n e um novo arco so criados quando acontece uma grande mudana no movimento executado pelo rob, ou quando a diferena entre as imagens comparadas ultrapassa um valor pr-denido. A comparao entre imagens feita por uma mtrica de correlao que permite calcular a diferena entre pontos das imagens e tambm a diferena angular entre elas. As imagens omnidirecionais facilitam a localizao e navegao, pois contm mais informaes no ambiente e possibilitam uma navegao em qualquer direo (Winters et al.,
7

As velocidade Ty e z so obtidas a partir do erro entre as posies atuais e as posies de referncia dos vrtices, segundo a Equao 9. x1 x1d z1 z1d . . = C28 . x4 x4d z4 z4d

Ty z

(9)

onde d indica as coordenadas desejadas e C a pseudo inversa de J, com Yi = Yd , que a distncia desejada para o retngulo. Os parmetros intrnsecos da cmera devem ser considerados e os valores de Ty e z , assim como a sua variao temporal, so aplicados em dois controladores PID, denindo os sinais motores do rob (Vassallo, 2004).

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

2000; Rizzi and Cassinis, 2001). A associao de palavras motoras aos arcos do mapa, resulta numa representao motora denida segundo a capacidade do rob e a estrutura do ambiente. Desta forma, o mapa topolgico criado guarda o aspecto qualitativo do ambiente, atravs de imagens, e o aspecto motor, atravs de palavras motoras (Vassallo et al., 2004b; Vassallo et al., 2004a). Criado o mapa, o rob pode realizar tarefas mais sosticadas. Quando lhe for solicitado ir a um determinado n, o rob se auto-localiza e escolhe um caminho denido por uma seqncia de ns e arcos at o seu destino nal. Durante a navegao, a sua posio atual monitorada comparandose imagens capturadas no caminho com as imagens dos ns, enquanto os seus movimentos so denidos pelas palavras motoras contida nos arcos.

0 0.2 0.4 Z 0.6 0.8 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 Y 0 0.5 1 X 0.5 1

(a)

RESULTADOS EXPERIMENTAIS
Z

0.2 0.4 0.6 0.8 1 0.5 0 0 0.5 Y 1 1 0.5 X 0.5 1

O primeiro passo na metodologia proposta denir o mapeamento viosuomotor que permitir a aprendizagem por imitao. Neste trabalho, o mapeamento visuomotor foi implementado como automovimento a partir do uxo ptico calculado nas imagens omnidirecionais. Alguns exemplos das estimativas de automovimento podem ser vistos na Figura 6. Como forma de avaliao do mtodo usado, os valores estimados foram comparados com o movimento original e os erros para a translao e rotao foram denidos conforme a Equao 10, onde T e ; T e so, respectivamente, os valores de referncia e as estimativas.

(b)

0 0.2 Z 0.4 0.6

et e

= arccos(T T ) =

(10)

0.8 1 0.5 1 0 0 0.5 Y 1 1 0.5 X 0.5

Os valores para os experimentos mostrados na Figura 6 esto listados na Tabela 1. Foram realizados ainda outros 608 experimentos. Os resultados obtidos e uma discusso sobre o desempenho do mtodo usado podem ser vistos em (Vassallo, 2004). Para a aprendizagem do vocabulrio, vrias etapas de seguimento e imitao foram realizadas, estimando-se sempre o automovimento. Apesar de Tx e Ty serem estimadas, apenas Ty , a direo possvel de translao do rob, foi considerada para a classicao dos movimentos juntamente com z . Os valores obtidos para Tx geralmente se devem a deslizamentos das rodas ou rudo no processo de automovimento. Os valores de Ty e z foram normalizados e classicados em clusters, que correspondem s aes bsicas aprendidas. Os centrides, calculados por uma mdia robusta, representam as aes no espao motor (Ty ,z ), conforme mostrado na Figura 7. Os pontos maiores e cheios indicam os centrides.
8

(c) Figura 6: Campo de movimento para (a) Translao, (b) Rotao e (c) Movimento Composto.

Os pontos menores e pretos representam as medidas relevantes, enquanto os pontos cinzas so as medidas descartadas. Foi traado um diagrama de Voronoi sobre o grco para uma melhor visualizao da separao entre os movimentos classicados. Cada ao aprendida corresponde a uma palavra motora e foi identicada atravs de um nome, conforme mostrado na Tabela 2. Este vocabulrio motor foi, ento, utilizado para o mapea-

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

(a) odometria estimativa erro (b) odometria estimativa erro (c) odometria estimativa erro

Translao T (Tx Ty )
T = [0 1] T = [0, 013 0, 999] et = 0, 734o

Rotao (z ) (o /s)
= [0] = [0, 0132] e = [0, 0132]

T (Tx Ty )
T = [0 0] T = [0 0] e t = 0o

(z ) (o /s)
= [3, 8776] = [4, 3284] e = [0, 4508]

T (Tx Ty )
T = [0 1] T = [0, 025 0, 999] et = 1, 45o

(z ) (o /s)
= [3, 1255] = [3, 4965] e = [0, 3710]

N W1 W2 W3 W4 W5 W6 W7 W8 W9

Palavra Motora virar esquerda arco frente-direita arco trs-esquerda arco trs-direita virar direita trs arco frente-esquerda frente parado

Ty 0 0.9948 -0.9927 -0.9927 0 -0.9972 0.9973 0.9974 0

z (graus/s) 4.4722 -2.4749 3.8223 -3.6440 -4.3646 0.0386 2.1350 0.0488 0

Tabela 2: As palavras motoras para cada ao bsica. localizao global do rob no ambiente. Nos experimentos, o rob navegou facilmente nos dois sentidos possveis, no sentido de criao do mapa e no sentido contrrio. Isso se deve utilizao de imagens omnidirecionais, que possibilitam visualizar qualquer direo de navegao e permitem que a regio ao redor do rob seja observada.

Tabela 1: Estimativas de automovimento para (a) Translao, (b) Rotao e (c) Movimento Composto.
Aes bsicas
6

Velocidade angular (graus/s)

1
4

3 7 6 8

CONCLUSES

2 4 5

6 2

1.5

Sentido de Translao

0.5

0.5

1.5

Figura 7: Vocabulrio motor aprendido.

Foi proposta uma metodologia para a adaptao e aprendizagem de aes e tarefas na robtica. A idia que um sistema com pouca programao prvia possa se desenvolver, aprendendo e adaptando-se medida que interage com o prprio corpo e com outros agentes. O aprendizado progressivo, atravs de uma hierarquia de aes, incluindo etapas de auto-explorao e aprendizagem por imitao. Na imitao, o reconhecimento de aes acontece diretamente no espao motor por meio de um mapeamento sensoriomotor, que converte informaes sensoriais em motoras. Resumidamente, as contribuies desta abordagem so: Pode ser aplicada com diferentes robs e representa uma forma exvel de se adaptar a tarefa ao rob utilizado, pois o mapeamento sensoriomotor, o vocabulrio motor e, consequentemente, as aes aprendidas so representados de acordo com a capacidade motora e sensorial envolvidas. Pode ser utilizada com diferentes aplicaes e ambientes. Se a aplicao ou ambiente de trabalho muda, um novo vocabulrio bsico ou novas aes de nvel mais alto podem ser aprendidos. No necessria uma programao a priori completa do rob. O auto-conhecimento e a denio do vocabulrio motor permitem que novas tarefas sejam aprendidas, sem a incluso de mais linhas de cdigo. Permite a denio e o reconhecimento de aes e tarefas de forma motora, independente de qualquer referencial adotado, graas ao mapeamento sensoriomotor que
9

mento e navegao topolgica. O rob foi guiado atravs do ambiente e imagens omnidirecionais foram capturadas e selecionadas autonomamente para formar os ns do mapa, enquanto as aes bsicas, executadas pelo rob e representadas por palavras motoras, foram associadas aos arcos. A Figura 8-a mostra uma vista superior do ambiente e o mapa topolgico criado. Para este caso, foram selecionadas 16 imagens para o mapa, as quais esto mostradas nos pontos onde foram capturadas. Depois de se criar o mapa, foram realizadas experincias de navegao entre diferentes ns, do tipo V at o n A ou V de A at B, subindo mais um nvel na hierarquia de aes. A Figura 8-b traz alguns dos resultados obtidos. Esto ilustrados 8 experimentos diferentes. Os asteriscos correspondem aos pontos onde a posio do rob no mapa foi atualizada, atingindo-se um novo n. A falta de exatido na posio dos ns ilustra o aspecto qualitativo do mapa topolgico. Apesar de no ser exata, a localizao dos ns acontece sempre em uma regio em torno da posio real e permite a

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

Im14 Im13 Im6 Im7 Im8

Im12

Im11

Im15

Im4

Im5

vel e da estrutura do ambiente, que dene os movimentos necessrios e possveis de serem realizados. Com isso, o ambiente representado de maneira simples atravs de referncias e aes bsicas conhecidas pelo rob (Vassallo et al., 2004b; Vassallo et al., 2004a). A utilizao de imitao para mapeamento e navegao topolgica representa uma nova aplicao a ser explorada, diferente das aplicaes realizadas em trabalhos anteriores.

Im16

Im10

Im2

Im3

Im9

Im1

AGRADECIMENTOS
(a)
Experimentos (cm)
50 100 150 200 250 300 350 400 450 500 100 200 300 400 500 600

Este trabalho contou com o apoio da CAPES, atravs da concesso de uma bolsa de doutorado sanduche a Raquel Frizera Vassallo, e do IST-Instituto Superior Tcnico, em Lisboa, que disponibilizou recursos do labratrio VISLAB para o desenvolvimento da investigao.

REFERNCIAS
Arbib, M. A., Billard, A., Iacoboni, M. and Oztop, E. (2000). Synthetic brain imaging: grasping, mirror neurons and imitation, Neural Networks 13: 975997. Arkin, R. (1998). Behavior-based Robotics, The MIT Press. Billard, A. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter 11 - Imitation: A Means to Enhance Learning of a Synthetic Protolanguage in Autonomous Robots, pp. 281310. Braitenberg, V. (1984). Vehicles, experiments in Synthetic Psychology, The MIT Press. Brooks, R. A. (1986). A robust layered control system for a mobile robot, IEEE Journal of Robotics and Automation 2(1): 1423. Brooks, R. A. (2001). The relationship between matter and life, Nature 409: 409411. Bruss, A. and Horn, B. K. P. (1983). Passive navigation, Computer Vision, Graphics and Image Processing 21: 320. Call, J. and Carpenter, M. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter 9 - Three Sources of Information in Social Learning, pp. 211228. Daniilidis, K. and Nagel, H. (1993). The coupling of rotation and translation in motion estimation of planar surfaces, IEEE Conf. on Computer Vision and Pattern Recognition, pp. 188193. Dautenhahn, K. and Nehaniv, C. L. (eds) (2002). Imitation in Animals and Artifacts, The MIT Press.

(b) Figura 8: O mapa topolgico (a) e experimentos de navegao (b).

permite converter informao sensorial em informao motora, conforme sugerido pelos mirror neurons. H ainda algumas contribuies interessantes quanto estimativa de automovimento e aplicao de mapeamento e navegao topolgica para ilustrar a abordagem proposta: Foram denidas estratgias de automovimento, mapeamento e navegao explorando-se as vantagens do campo de viso das imagens omnidirecionais. Foi denido um Jacobiano Geral para a estimativa de automovimento, o qual poder ser usado com diferentes sistemas omnidirecionais (Vassallo et al., 2002a). O uso de representaes motoras para o mapeamento do ambiente permite a adaptao natural do mapa ao rob. O vocabulrio motor, aprendido no prprio local de trabalho, inclui inuncias da capacidade motora dispon10

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

Decety, J. (2002). The Imitative Mind: development, evolution, and brain bases, Cambridge University Press, chapter 16 - Is there such a thing as functional equivalence between imagined, observed, and executed action?, pp. 291309. Fadiga, L., Fogassi, L., Gallase, V. and Rizzolatti, G. (2000). Visuomotor neurons: ambiguity of the discharge or motor perception?, International Journal of Psychophysiology 35: 165177. Fischler, M. A. and Bolles, R. C. (1981). Random sample consensus: A paradigm for model tting with applications to image analysis and automated cartography., Communications of ACM 24(6): 381395. Fitzpatrick, P., Metta, G., Natale, L., Rao, S. and Sandini, G. (2003). Learning about objects through action - initial steps towards articial cognition, IEEE International Conference on Robotics and Automation - ICRA 2003. Geyer, C. and Daniilidis, K. (2000). Equivalence of catadioptric projections and mappings of the sphere, Proc. of IEEE Workshops on Omnidirectional Vision, pp. 9196. Geyer, C. and Daniilidis, K. (2001). Catadioptric projective geometry, International Journal of Computer Vision 2: 223243. Gluckman, J. and Nayar, S. K. (1998). Ego-motion and omnidirectional cameras, Proc. of 6th International Conference on Computer Vision - ICCV98, pp. 9991005. Kasper, M., Fricke, G., Steuernagel, K. and von Puttkamer, E. (2001). A behavior-based mobile robot architecture for learning from demonstration, Robotics and Autonomous Systems 34: 153164. Lieberman, H. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter 7 - Art Imitates Life: Programming by Example as an Imitation Game, pp. 157169. Lopes, M. C. and Santos-Victor, J. (2003a). Motor representations for hand gesture recognition and imitation, IROS Workshop on Robot Programming by Demonstration. Lopes, M. C. and Santos-Victor, J. (2003b). Visual transformations in gesture imitation: what you see is what you do, IEEE International Conference on Robotics and Automation - ICRA 2003. Lungarella, M. and Pfeifer, R. (2001). Robot as cognitive tools: Information theoretic analysis of sensory(-motor) data, EDEC 2001 - Symposium at the International Conference on Cognitive Science.

Matric, M. J. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter Sensory-Motor Primitives as a Basis for Imitation: Linking Perception to Action and Biology to Robotics, pp. 391422. Meltzoff, A. N. and Moore, M. K. (1989). Imitation in newborn infants: Exploring the range of gestures imitated and the underlying mechanisms, Developmental Psychology 25: 954962. Metta, G., Sandini, G., Natale, L., Manzotti, R. and Panerai, F. (2001). Development in articial systems, EDEC 2001 - Symposium at the International Conference on Cognitive Science. Metta, G., Sandini, G., Natale, L. and Panerai, F. (2001). Sensorimotor interaction in a developing robot, 1st International Workshop on Epigenetic Robotics, pp. 53 60. Murphy, R. R. (2000). Introduction to AI Robotics, The MIT Press. Nehaniv, C. L. and Dautenhahn, K. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter 2 - The Correspondence Problem. Nelson, R. C. and Aloimonos, J. (1988). Finding motion parameters from spherical motion elds (or the advanntages of having eyes in the back of your head), Biological Cybernetics 58: 261273. Prinz, W. (2002). The Imitative Mind: development, evolution, and brain bases, Cambridge University Press, chapter 8 - Experimental approaches to imitation, pp. 143162. Rizzi, A. and Cassinis, R. (2001). A robot self-localization system based on omnidirectional color images, Robotics and Autonomous Systems 34: 2338. Rizzolatti, G., Fadiga, L., Fogassi, L. and Gallese, V. (2002). The Imitative Mind: development, evolution, and brain bases, Cambridge University Press, chapter 14 - From mirror neurons to imitation: facts and speculations, pp. 247266. Schaal, S., Ijspeert, A. and Billard, A. (2003). Computational approaches to motor learning by imitation, Philosophical Transactions: Biological Sciences (The Royal Society) 358:1431: 537547. Tian, T. Y., Tomasi, C. and Heeger, D. (1996). Comparison of approaches to egomotion computation, CVPR96 - Computer Vision and Pattern Recognition, pp. 315 320.
11

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

Vassallo, R. F. (2004). Uso de Mapeamentos Visuomotores com Imagens Omnidirecionais para Aprendizagem por Imitao em Robtica, PhD thesis, Universidade Federal do Esprito Santo. Vassallo, R. F., Santos-Victor, J. and Schneebeli, H. (2002a). A general approach for egomotion estimation with omnidirectional images, IEEE Workshop on Omnidirectional Vision 2002 (with ECCV), pp. 97103. Vassallo, R. F., Santos-Victor, J. and Schneebeli, H. (2002b). Learning motor representations for robot navigation, MED 2002 - 10th IEEE Mediterranean Conference on Control and Automation. Vassallo, R. F., Santos-Victor, J. and Schneebeli, H. J. (2004a). Task learning and adaptation based on visuomotor mapping, CBA 2004 - XV Congresso da Sociedade Brasileira de Automtica. Vassallo, R. F., Santos-Victor, J. and Schneebeli, H. J. (2004b). Visuomotor maps for robot task learning through imitation, 5th IFAC/EURON Symposium on Intelligent Autonomous Vehicles - IAV2004. Visalberghi, E. and Fragaszy, D. (2002). Imitation in Animals and Artifacts, The MIT Press, chapter 18 - Do Monkeys Ape? - Ten Years After, pp. 471499. Winters, N., Gaspar, J., Lacey, G. and Santos-Victor, J. (2000). Omni-directional vision for robot navigation, IEEE Workshop on Omnidirectional Vision (held with CVPR).

12

Revista Controle & Automao/Vol.18 no.1/Janeiro, Fevereiro e Maro 2007

You might also like