Hola!
Ahora que por fin he vuelto a Madrid después del MWC, me toca ponerme al día con los posts atrasados. El otro día mucha gente se quedó asombrada cuando comenté que el algoritmo “base” para la detección de rostros es del 2001. Eso mismo, más de 10 años del trabajo de Paul Viola y Michael Jones. Este algoritmo ha madurado tanto que ahora ya podemos encontrarlo como ejemplo en muchos lenguajes de programación, y casi todas las cámaras de fotos y smartphones con cámaras de fotos lo tienen integrado para detectar rostros en tiempo real.
Si alguien está interesado en ver como funciona el algoritmo de Viola-Jones, la entrada que posee en la wikipedia es una obra de arte.
Ahora bien, la base de este algoritmo es que los rostros deben estar “de frente” en la imagen que se procesa. Esto es ya que lo que se busca son las sombras y líneas imaginarias que se crean entre los ojos y con la nariz. Esto nos deja fuera de los resultados de detección, a los rostros que no estén de frente.
Hace unos días, Sachin Farfade y Mohammad Saberian en los Laboratorios de Yahoo en California, además de Li-Jia Li en la Universidad de Stanford han mostrado una nueva aproximación para la detección de rostros, que incluye además los rostros que no estén de frente. El nombre de este algoritmo es “Deep Dense Face Detector” y se destaca entre otros similares por la velocidad y “simplicidad”. Eso sí, la depuración y refinación del mismo se está realizando con unos algoritmos de Machine Learning bastante complejos.
Si alguien tiene ganas de pegarse un rato entretenido leyendo artículos científicos, en el paper oficial se explica como se llega a esta aproximación.
Saludos Finally @ Madrid
/El Bruno
Referencias
Multi-view Face Detection Using Deep Convolutional Neural Networks, http://arxiv.org/abs/1502.02766
Viola-Jones face detection, http://en.wikipedia.org/wiki/Viola%E2%80%93Jones_object_detection_framework
1 comment