»ùÓÚѧϰµÄÄ¿±ê¼ì²â¼°Ó¦ÓÃ
Ä¿±ê¼ì²â(Object Detection)ÊǼÆËã»úÊÓ¾õÁìÓòµÄÒ»¸ö»ù±¾ÎÊÌâ,ÔÚ·ÇÊÜ¿Ø×ÔÈ»³¡¾°ÖпìËÙ׼ȷµØ¶¨Î»ºÍʶ±ðÌض¨Ä¿±êÊÇÐí¶àÈ˹¤ÖÇÄÜÓ¦Óó¡¾°µÄÖØÒª¹¦ÄÜ»ù´¡¡£½üÄêÀ´,Ëæ×ÅÉî¶Èѧϰ(Deep Learning)¼¼ÊõµÄ¿ìËÙ·¢Õ¹,»ùÓÚ¾í»ýÉñ¾ÍøÂç(Convolutional Neural Network,CNN)µÄÄ¿±ê¼ì²âËã·¨»ñµÃÁ˹Ø×¢ºÍ¹ã·ºÑо¿,³öÏÖÁ˺ܶàÐÔÄÜÓÅÁ¼¡¢¼ò½à¸ßЧµÄÍøÂç½á¹¹,ʹËã·¨µÄ´ó¹æģʵ¼ÊÓ¦ÓóÉΪ¿ÉÄÜ¡£
µ±Ç°,Ä¿±ê¼ì²âÁìÓòÓм¸¸öÖ÷ÒªµÄÄѵ㡣Ê×ÏÈ,ÊÓ¾õ³¡¾°Öй㷺·Ö²¼×ÅÐí¶àСÎïÌå,ÕâЩСĿ±êµÄ´æÔÚ¸ø¼ì²âËã·¨µÄÃô½ÝÐÔ¡¢¿É¿¿ÐÔ´øÀ´ÁËÌôÕ½;Æä´Î,¼ì²â¾«¶ÈºÍËٶȴæÔÚ×Å´ËÏû±Ë³¤µÄ¹Øϵ,¼æ¹ËÕâÁ½ÏîÐÔÄÜÉÐÐèÍ»ÆÆÐí¶à¼¼ÊõÆ¿¾±;×îºó,¹æÄ£ÅÓ´óµÄÄ£ÐͲÎÊýÊÇÖÆÔ¼Éî¶ÈÍøÂçƬÉÏ×°ÔصÄÖØÒªÔÒò,ÔÚ±£Ö¤¼ì²â¾«¶ÈµÄͬʱѹËõÄ£ÐÍ´óСÊÇÒ»¸öÓÐÒâÒå²¢ÇÒؽ´ý½â¾öµÄÎÊÌâ¡£
±¾ÎÄÖ÷ÒªÕë¶Ô¼ì²âÄ£Ð;ֲ¿ÓÅ»¯¡¢Ð¡Ä¿±ê¼ì²â¡¢ÇáÁ¿¼¶¼ì²âÍøÂçµÄÉè¼ÆºÍÄ£ÐÍѹËõÈý¸öÎÊÌâÕ¹¿ªÑо¿,¾ßÌåÑо¿¹¤×÷ÈçÏÂ:1.ÔÚÉî¶Èѧϰ¿ò¼ÜCaffeÉÏʵÏÖÁ˺òÑ¡ÇøÓòÆ¥Åä³Ø»¯Ëã·¨²¢ÑéÖ¤ÁËËã·¨µÄÓÐЧÐÔ¡£Í¬Ê±½«ÇøÓòÆ¥ÅäµÄ˼ÏëÍƹ㵽»ùÓÚÇøÓòµÄÈ«¾í»ýÉñ¾ÍøÂçÖÐ,Ìá³öÁËλÖÃÃô¸ÐµÄºòÑ¡ÇøÓòÆ¥Åä³Ø»¯Ëã·¨,½øÒ»²½ÓÅ»¯Á˵±Ç°Ëã·¨ÔÚСĿ±ê¼ì²âÉϵÄÐÔÄÜ:2.»ùÓÚSqueezeNetºÍFaster R-CNN¼ì²â¿ò¼Ü´î½¨ÁËС¹æÄ£µÄͨÓÃÄ¿±ê¼ì²âÍøÂç,ÔÚPASCAL VOC 2007Êý¾Ý¼¯ÉÏmAP´ïµ½0.533¶øÄ£ÐÍ´óС¿ØÖÆÔÚÁË 10MB×óÓÒ¡£
¼ò»¯²¢ÊµÏÖÁË»ùÓÚȨֵ¾ÛÀàµÄÄ£ÐÍѹËõËã·¨,½«Ä£ÐͽøÒ»²½Ñ¹Ëõµ½ÁË 1.5MB¶ø¼ì²âÐÔÄܽöÓÐ΢ÈõµÄËðʧ;3.Éè¼Æ´î½¨ÁË°üº¬·´¾í»ý²ãºÍ¿ç²ãÌØÕ÷ÈںϵÄFaster R-CNN¼ì²âÍøÂç²¢½«ÆäÓ¦Óõ½Ð¡Ä¿±ê·Ö²¼½Ï¶àµÄ½»Í¨±êʶ¼ì²âÈÎÎñÖÐ,ʵ
Ñé±íÃ÷ÕâÒ»½á¹¹¶ÔÓÅ»¯Ð¡Ä¿±ê¼ì²âÐÔÄܾßÓдٽø×÷Óá£ÔÚÉî¶Èѧϰ¿ò¼ÜCaffeÉϴÁËÄ¿±ê¼ì²âÁìÓò½ÏеÄÍøÂç½á¹¹¡ª¡ªÌØÕ÷½ð×ÖËþÍøÂç(Feature Pyramid Network,FPN)²¢³¢ÊÔ¸´ÏÖÆäЧ¹û,ÔÚ¸´ÏÖ¹ý³ÌÖÐ̽ÌÖÁ˹ؼü¼¼Êõϸ½ÚµÄʵÏÖ·½Ê½¡£
ʵÑé±íÃ÷¸´ÏÖÇé¿ö²¢²»ÀíÏë¡£±¾ÎÄÏêϸ·ÖÎöÁË¿ÉÄÜ´æÔÚµÄÎÊÌâ²¢ÇÒÌá³öÁ˸Ľø·½Ïò¡£