Entrenar OpenCV en Detección de Objetos

diciembre 06, 2015

OpenCV cuenta con varios clasificadores en cascada entrenados que podemos encontrar en el directorio opencv\build\etc\haarcascades ó en opencv\build\etc\lbpcascades estos clasificadores nos sirven para la detección de caras o rostros, nariz, boca, placas de autos, rostros de gatos, entre otras cosas, en caso de que deseemos detectar otro tipo de objeto podemos entrenas nuestros propios clasificadores para que detecte por ejemplo, un animal determinado, un automóvil, un teléfono celular o lo que deseemos según lo requiera el proyecto que realicemos.

En la carpeta opencv\build\x86\vc11\bin podemos encontrar los ejecutables opencv_createsamples.exe y opencv_traincascade.exe que nos ayudaran ha realizar el trabajo de entrenamiento de manera sencilla, el primero prepara el conjunto de imágenes positivas y el otro genera el clasificador en cascada.

La primera tarea que debemos realizar es recolectar el conjunto de imágenes, necesitaremos un conjunto positivo y uno negativo, el conjunto de imágenes positivas en aquel que contiene varias imágenes con el objeto que deseamos detectar con OpenCV y el negativo son todas aquellas imágenes que no contengan el objeto.

Detección de Autos con OpenCV

Para construir este ejemplo usaremos el conjunto de imágenes obtenidos de Datasets for Computer Vision Research donde encontraremos varios bases de datos de imágenes que podemos utilizar para entrenar OpenCV, seleccionaremos las imágenes para detectar autos UIUC Image Database for Car Detection

Lo primero que haremos será abrir CMD y ejecutar con el comando:
cd C:\opencv\build\x86\vc11\bin
Nos movemos a la carpeta que contiene las aplicaciones opencv_createsamples.exe y opencv_traincascade.exe.

Usaremos el siguiente comando para crear el archivo binario cars.vec correspondiente a las imágenes positivas, usaremos la aplicación opencv_createsamples.exe también requerimos la carpeta con las imágenes positivas, la llamaremos pos, además del archivo de texto cars.info que nos indica donde localizarlas.

Por facilidad copiamos el archivo cars.info y la carpeta pos en la misma carpeta donde se encuentra el ejecutable opencv_createsamples.exe

opencv_createsamples -info cars.info -num 550 -w 48 -h 24 -vec cars.vec

Una vez tenemos el binario cars.vec procedemos a crear el cascade.xml esta vez usaremos la aplicación opencv_traincascade.exe, esta vez necesitaremos el archivo neg.info y la carpeta neg con las imágenes negativas.

Copiamos neg.info y carpeta neg en el directorio donde anterior, además creamos una carpeta llamada data, donde se almacenara nuestro cascade.xml.

opencv_traincascade -data data -vec cars.vec -bg neg.info -numPos 500 -numNeg 500 -numStages 10 -w 48 -h 24 -featureType LBP

Para conocer detalles sobre las aplicaciones opencv_createsamples, opencv_traincascade y sus parámetros visitar la documentación: Cascade Classifier Training

Cargar Clasificador en Cascada

El siguiente código nos muestra como cargar el clasificador que acabamos de crear, funciona igual que cualquier otro clasificador, incluso podemos usar el código del proyecto Detección de Rostros en Tiempo Real solo cambiamos el clasificador .xml y podremos detectar autos con la webcam.

Para este ejemplo usaremos las imágenes de prueba que vienen con la base de datos que descargamos, haremos que la aplicación pruebe con un grupo de las primera 20 imágenes, las mismas irán cambiando al presionar una tecla.

#include <opencv2/opencv.hpp>

using namespace cv;
using namespace std;

int main(int argc, char** argv)
{

	String TEST_DIR = "data\\data_file\\test";
	String CAR_CXML = "data\\data_file\\cascade.xml";
	String NAME_WIN = "Entrenar OpenCV";

	CascadeClassifier car_detector;

	if (!car_detector.load(CAR_CXML)) { cout << "Error en el archivo: " + CAR_CXML << endl; return -1; };

	for (int i = 0; i < 20; i++)
	{
		std::stringstream number;
		number << i;

		String image_test = TEST_DIR + "\\test-" + number.str() + ".pgm";
		Mat image = imread(image_test, 1);

		if (!image.data) { cout << "No image data." << endl; return -1; }

		std::vector<Rect> rc;

		car_detector.detectMultiScale(image, rc, 1.1, 8);

		for (size_t i = 0; i < rc.size(); i++)
		{
			rectangle(image, Point(rc[i].x, rc[i].y), Point(rc[i].x + rc[i].width, rc[i].y + rc[i].height), CV_RGB(0, 255, 0), 1);
		}

		namedWindow(NAME_WIN, WINDOW_AUTOSIZE);
		imshow(NAME_WIN, image);
		waitKey(0);
	}

	return 0;
}

Debemos tener en cuenta que nuestro clasificador no es perfecto, está construido de la manera más simple posible, un clasificador bueno requiere de una colección de imágenes positivas y negativas bastante amplia.

Especificando los parámetros adecuados a la hora de crear el clasificador podemos mejoras su eficacia, pero debemos tener en cuenta que un buen entrenamiento puede tardar muchas horas o hasta días.

Puedes encontrar el proyecto completo en: GitHub Tutor de Programación

Comentarios

Unknown7 de diciembre de 2015, 5:42
hola! no encuentro el archivo cars.info... sólo he encontrado un readme.txt...
ResponderEliminar
Respuestas
Unknown7 de diciembre de 2015, 8:03
gracias, es que encontré el archivo de otro repositorio, pero creo que no es el mismo... y las carpetas neg y pos, las he hecho partiendo en dos el archivo donde están todas las fotos. Bueno, voy a intentarlo de nuevo con los nuevos archivos...-porque me está dando error en el .exe de createsamples y en el array.cpp Gracias.Un saludo
ResponderEliminar
Respuestas
Unknown7 de diciembre de 2015, 8:43
Ya he cambiado los archivos, gracias. Una última pregunta: Para el test de "entrenamiento", el .cpp lo ejecuto desde dónde? Gracias de antemano
ResponderEliminar
Respuestas
Unknown8 de diciembre de 2015, 6:10
Hola de nuevo, lo he compilado y ejecutado con Dev_Cpp, pero no encuentra opencv.hpp-
ResponderEliminar
Respuestas
Unknown8 de diciembre de 2015, 7:50
He puesto todo el camino para que encuentre el archivo y parece que funciona, pero todavía no lo he conseguido del todo...
ResponderEliminar
Respuestas
Unknown13 de diciembre de 2015, 6:51
Ya lo he solucionado. Gracias, era la plataforma al hacer el build.
ResponderEliminar
Respuestas
Unknown14 de diciembre de 2015, 7:17
Si, es verdad, gracias!
ResponderEliminar
Respuestas
Unknown12 de febrero de 2016, 7:36
Hola, no tienen este ejemplo en Python? :c
ResponderEliminar
Respuestas
nelson24 de febrero de 2016, 20:17
Puedes hacer tutoriales de Reconocimiento Facial, Pero usando el Lenguaje Java, pues he visto varios tutoriales suyos, escritos en c++, pero se me dificulta traducirlo a java. Tambien seria bueno que hicieras un tutorial en donde se explique como detectar si la persona está dormida, y hacer sonar una alarma. Yo he realizado parte de los dos proyectos que he mencionado, pero no he podido terminarmlos.. No encuentro la solucion. Gracias.
ResponderEliminar
Respuestas
grogi18 de mayo de 2016, 10:56
Buenas, estoy trabajando en la version 3.1 y con ubuntu. Al ejecutarlo el codigo se me queda colgado. Tengo unos printf para ver hasta donde ejecuta y se para en : "Mat image = imread(image_test, 1);"

Sabes por que puede ser?
Muchas gracias.
ResponderEliminar
Respuestas
Jaime Andres7 de mayo de 2017, 15:57
Todos estos tutoriales se los puede trabajar con python tambien ?
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 5:34
hola muy buenos dias profe, estoy tratando de crear un clasificador que reconozca las manos , he seguido algunos tutoriales pero en el momentos de crear el vector me arroja un error de analisis sobre al archivo indice, en este caso se utiliza es un archivo positive.txt, he compilado su ejemplo del tutorial sin ningun problema el cual trae un archivo cars.info y la carpeta pos y muestra la creacion del vector , las imagenes tienen que tener un tratamiento en especial o un peso en especial? yo utilizo las fotos en formato bmp de 320x240 y creo el archivo indice con objectmarker , no he podido encontrar el error
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 5:37
y otra inquietud como se hace para crear el archivo .info o no varia al trabajar con .txt
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 8:56
buenos dias lo he intentado ya varias veces pero me crea el vector vacio se presenta un error parse errorDone , yo utilizo objectmarkert y despues creo el directorio para el archivo positivo.txt pero me presenta ese error al intentar crear el vector
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 8:57
ya lo he intentado con otras fotos y tampoco, pero en cambio el que esta en el tutorial si crea el vector sin ningun tipo de error
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 9:00
si el formato de las fotos es de 240x320 como calculo el w y h para el comando shell o serian las mismas medidas?
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 9:08
ahi un medio de tener contacto donde pueda enviarte pantallazos del procedimiento y el error que se presenta al tratar de crear el vector , para hallar una solucion al problema
ResponderEliminar
Respuestas
Miguel Angel31 de marzo de 2018, 9:37
o si tu me puedes enviar los pasos a seguir , de pronto los tutoriales que he seguido hace falta algo ,
ResponderEliminar
Respuestas
Miguel Angel1 de abril de 2018, 8:51
listo hare el link con la imagenes mas detalladas, encontre un documento en el cual viene un poco mas explicado los parametros de objectmarket y de createsamples, donde habla de unas dll que debe tener el create samples para funcionar , lo extraño es que los datos que tu proporcionas en el tutorial de clasificador de carros, con ellos logro crear los samples sin ningun error, sin esas dll.
cxcore097.dll, highgui097.dll, libguide40.dll
ResponderEliminar
Respuestas
Miguel Angel3 de abril de 2018, 22:11
No he podido dar con el error , al parecer es el ingreso de los imágenes , pero son imágenes del mismo tamaño, en escala de gris y tampoco me deja crear los samples, tan pronto pueda te envio el link
ResponderEliminar
Respuestas
Miguel Angel4 de abril de 2018, 18:47
Bueno profe ya he solucionado el problema , revise los direcciones y los tamaños pero el error estaba era que la version del createsamples que venia en el tool zip de haartraining son de versiones diferentes a la que estoy utilizando .
ResponderEliminar
Respuestas
Miguel Angel5 de abril de 2018, 20:35
bueno profe hasta el momento he llegado hasta ahi porque estoy intentando crear el archivo xml pero me esta presentando un error , y me pide revisar los parametros de training, voy a tratar de enviarle un link, bueno tambien estoy trabajando en encontrar el error .
Profe tenia una pregunta acerca del codigo de entrenamiento de rostros , y el de clasificacion de genero , si bien estos codigos estas adecuados para entrenar rostros y tambien detectar e identificar rostros, en el caso de querer reconocer gestos manuales como lenguaje de señas, podria hacerlo cambiando el archivo xml , y modificando parte del codigo para que entrene señas

,
ResponderEliminar
Respuestas
Miguel Angel3 de mayo de 2018, 19:49
hola profe queria saber si una pagina en la que usted ofrece asesorias que se llama workana , que tal confiable es ya que un desarrollador esta interesado en colaborarme con el proyecto. pero no tengo la informacion suficiente de esta pagina para decidirme a depositar
ResponderEliminar
Respuestas
Miguel Angel4 de mayo de 2018, 11:27
ok . si pues la pregunta es si la pagina era de confianza, ya sabes por tanto fraude electronico en la actualidad
ResponderEliminar
Respuestas
Miguel Angel4 de mayo de 2018, 11:28
revisare con calma el perfil del profesional, muchas gracias..
ResponderEliminar
Respuestas
Unknown8 de mayo de 2018, 11:53
Tienen que ser imagenes pgm o pueden ir en otro formato?
Que significan los numeros 1 0 0 100 40 al final de cada linea en el archvo cars.info?
ResponderEliminar
Respuestas
Unknown12 de octubre de 2018, 13:05
Hola he realizado estos paso pero no me crea el archivo .vec? que estoy haciendo mal?
ResponderEliminar
Respuestas
diego5 de abril de 2019, 8:37
como puedo crear los archivos con terminación .info
ResponderEliminar
Respuestas
Unknown5 de mayo de 2019, 21:40
como puedo hacerlo en java
ResponderEliminar
Respuestas
alpauul4 de junio de 2019, 7:14
Enlace roto >> http://www-cvr.ai.uiuc.edu/ponce_grp/data/
ResponderEliminar
Respuestas
Unknown23 de junio de 2019, 13:15
He instalado opencv a través de Anaconda y no soy capaz de encontrar los directorios que comentas, no tengo ningún directorio con el nombre de opencv
ResponderEliminar
Respuestas
Unknown9 de abril de 2020, 18:02
el archivo cars.info , imagino que funciona solamente para el fin de detectar carros, ¿Como creo con la informacion correcta mi propio .info?
ResponderEliminar
Respuestas

Añadir comentario

Buscar en este blog

Tutor de Programación