quarta-feira, 4 de julho de 2012

Como funciona a tecnologia do Google Street View


Para fotografar as ruas de cidades brasileiras e de outros países, o projeto usa inteligência artificial, câmeras digitais sem disparador mecânico (pois quebram depois de 200.000 cliques), computadores com Ubuntu e até sensores de medição de distância a laser.

Os automóveis do Street View Brasil circularam por 150.000 quilômetros e gravaram 135 milhões de imagens em JPG. Como cada uma delas pode ter entre 0,5 e 1 megabyte, estima-se que tenham sido gerados entre 70 e 140 terabytes de dados.


O trabalho depende de duas equipes. A primeira, formada por funcionários do Google Brasil, cuidando das operações dos carros. O outro time conta com engenheiros que ficam na sede do Google, em Mountain View, Califórnia, nos Estados Unidos. Eles tem a missão de processar o material bruto, borrar faces e placas de veículos e associar o conteúdo aos mapas. A mesma divisão de tarefas é adotada em todos os países em que o Street View está sendo feito.

Os carros são projetados para suportar o equipamento - o chamado câmera kit - formado por uma armação metálica, as câmeras e um computador. Eles são adaptados para suportar até 90 quilos de equipamentos no teto.

Mas as mudanças não se limitaram à parte física. Foi preciso fazer a CPU do câmera kit conversar com o computador de bordo, além de instalar equipamentos capazes de medir a velocidade e a rotação do motor. A parafernália eletrônica exigiu um reforço no sistema elétrico do carro. Uma bateria tradicional jamais conseguiria dar conta do recado.

Os carros contam com nove câmeras, com resoluções de 5 megapixels cada. Oito ficam alinhadas horizontalmente, cobrindo um ângulo de 360 graus, enquanto outra, no topo, usa uma lente olho de peixe para capitar imagens do céu e de edificios altos. Por isso, os modelos registram nove imagens automaticamente a cada dez metros. As máquinas têm sensores CMOS, que garantem boa qualidade em equipamentos menores.

O projeto adota sensores de medição de distância a laser, fabricados pela Sick, cujas informações ajudam a alinhar as fotos.

No carro, as imagens são gravadas num computador com sistema operacional Ubuntu, que cuida da navegação e transmite informações (a equipe de operação pode checar se os veículos estão dirigindo onde deveriam). Também podem ser enviadas para eles algumas das fotos, em baixa resolução. Um operador pode ver se a câmera está embaçada ou se há algum disturbio.

A medida que é feita a captação das imagens, os discos rigidos, quem tem o conteúdo criptografado, são retirados dos carros e guardados nos escritórios do Google Brasil. Depois de armazenado um volume de imagens suficientes, os HDs são enviados para a sede da empresa, em Mountain View.

Os engenheiros configuram o software que processa as imagens para identificar o modelo de placa adotado em veículos de cada país. Para isso, são aplicadas duas técnicas: visão computacional e aprendizado de máquina, ambas ligadas à inteligência artificial. Depois a base de dados é submetida aos algoritmos e verifica-se, por amostragem, se o processo funcionou. Para ocultar os rostos, outro software é executado, e, os resultados conferidos.

A partir dos dados de GPS armazenados, as fotos são associadas aos mapas. Só quando está tudo pronto a equipe brasileira vai ver o resultado e decidir se algum local precisará ser refeito.


Nenhum comentário:

Postar um comentário

Related Posts Plugin for WordPress, Blogger...