¿No sabes la raza de tu perro? enfócalo con el móvil y la descubres
Un estudiante diseña un sistema de inteligencia artificial para reconocer la raza de las mascotas a través de su imagen.
Con el tratamiento de más de 20.000 imágenes de perros de diferentes razas, un ingeniero informático de la Politécnica de Valencia ha realizado un sistema automático capaz de reconocer hasta 120 razas con solo recibir la imagen de los canes.Por Carlos Xestal
El proyecto, realizado como trabajo de Fin de Grado por Marcos Rodríguez y tutorizado por Carlos David Martínez y que ha sido publicado el 4 de enero en el repositorio de la UPV, tiene como objetivo “la creación de un sistema automático que reciba como input una imagen de un perro y que nos devuelva como output su correspondiente raza, determinada a su vez por un modelo de Aprendizaje Automático”.
El aprendizaje automático es un tipo de inteligencia artificial (AI) que proporciona a las computadoras la capacidad de aprender, sin ser programadas explícitamente. Se centra en el desarrollo de programas informáticos que pueden cambiar cuando se exponen a nuevos datos. Este tipo de aprendizaje, Machine Learning en inglés, nos hace la vida más sencilla día a día en cosas tan generalizadas como el reconocimiento de nuestra huella para encender un ordenador o la detección del rostro para desbloquear el teléfono móvil.
La base de su funcionamiento es un “conjunto de algoritmos y técnicas utilizados para diseñar sistemas que aprenden de los datos que reciben como entrada”, indica en el ingeniero en la introducción de su proyecto.
En este caso, para que el programa a desarrollar sea capaz de reconocer hasta un total de 120 razas caninas necesita recibir una amplia base de datos, conocida como dataset. El estudiante valenciano ha incluido en su proyecto un total de 10.222 imágenes etiquetadas que actuarán como conjunto de entrenamiento para su modelo además de que ha dispuesto de otro conjunto de 10.357 imágenes no etiquetadas que ha clasificado.
Para ello, ha recurrido al uso de un dataset con 20.580 imágenes de perros de diferentes razas extraído de la web de Kaggle, a su vez basado en el famoso dataset de perros de Stanford (Stanford Dogs Dataset).
El hecho de que no todas las imágenes tenían la misma calidad y luminosidad ha ocasionado problemas en algunos modelos de Machine Learning. Otra dificultad que ha tenido que solventar el estudiante es que el tamaño de cada imagen también varía. Por estos motivos tuvo que normalizar los inputs “con la finalidad de evitar problemas de escalado que nos introduzcan retrasos y problemas en la computación”, indica el ingeniero en su proyecto.
En un principio, una de las características para diferenciar unas razas de otras fue el color, “utilizando como característica de cada imagen una lista con los colores de cada píxel. Sin embargo, este modelo no resulta ser muy eficaz debido a dos razones: por un lado en las imágenes hay otros elementos como personas o muebles y la calidad no es igual en todas, por lo que los píxeles que reconoce no son de gran utilidad; y por otro, porque aunque no hubiese otros elementos distorsionadores o la calidad fuese la adecuada, “el uso exclusivo del color de cada imagen con el objetivo de diferenciar cada raza (aunque las imágenes tuvieran una máxima calidad y no hubiera elementos que interfirieran) puede no ser suficiente para implementar un clasificador válido para las 120 razas, dado que no solo por el color se distinguen las razas, ya que también hay que tener en cuenta factores como las formas”.
Esto ha llevado a implementar el proyecto con un segundo modelo “en el que además de utilizar el color como factor diferencial trataremos también de identificar patrones en las imágenes de cada clase extrayendo características con el objetivo de poder reconocer formas entre las distintas razas de perros como las orejas, el hocico, la cola, etc.”.
Por último, para complementar y mejorar los resultados de estos modelos, el estudiante propone la integración de un tercer modelo basado en el uso de “transfer learning” que a efectos prácticos realizan tareas de clasificación al utilizarse como extractores de otros modelos ya entrenados, lo que aumenta la precisión de la clasificación”, llegando a una precisión que roza el 95% de efectividad.
Estas tres “capas” en el proyecto es lo que lleva a alcanzar el principal objetivo de este trabajo: “la implementación de un clasificador que reciba como entrada la imagen de un perro y sea capaz de determinar su raza de forma correcta con la mayor efectividad posible”.
Y llegar a cumplir la tarea inicial: “la búsqueda de un conjunto de datos representativo con imágenes de perros de diferente raza que nos permitan entrenar adecuadamente nuestro modelo de Aprendizaje Automático elegido”.Los datos
120 razas caninas son las que se podrán reconocer si este proyecto se pone en marcha(Páginas 18-19)
Walkee, la App que mejora la vida canina
Razas de perros reconocidas por el American Kennel Club