龙源期刊网 http://www.qikan.com.cn
基于深度学习的人体行为识别研究
作者:李宗妮
来源:《农家科技中旬刊》2024年第05期
摘 要:人体行为识别和深度学习是当今智能视频分析领域的研究热点,在这几年受到了学术界和工程界的高度关注,在公共安全、人机交互、运动分析和视频监控等方面有着广阔的应用前景和研究价值。本文概述了人体行为识别的流程,识别过程各阶段的方法,最后对常用的人体行为识别数据集进行了介绍。
关键词:行为识别;深度学习;视频数据集 1.概述
近年来,虚拟现实及增强现实技术逐渐走入大众视野,通过人体行为识别可以辨别出人体行为动作的指令。智能汽车的概念日渐兴起,对行人的行为进行有效而准确的识别,可以起到交通预警作用,有效防止交通事故的发生。行为识别技术在智能监控、人机交互、运动分析、医疗健康等众多领域扮演着越来越重要的角色,已经广泛应用于智能监控、人机交互、视频检索等领域中。人体行为识别技术广泛的应用,大大促进了科学技术的发展,提高人们的生活水平和生活质量。
Turaga[1]将人体行为识别分为移动识别,动作识别和行为识别3部分,移动识别部分相当于低层视觉,动作识别相当于中层视觉,行为识别相当于高层视觉。人体行为识别的识别准确率依然有很大的改进和提升的空间。人体行为识别还需要考虑环境的差异,像镜头角度转换的快慢、光照和色彩的变化、人物移动的快慢和噪声背景等诸多因素。识别人体行为还容易出现多个行为相似和混淆的情况,例如跑步与慢跑的动作易混淆,慢跑又与走路的动作易混淆,很多行为都容易混淆,难以实现良好的区分,得到准确的识别结果。目前对行为识别的研究基本还处于动作识别这一层。
一般的动作识别系统通常分为底层,中间层和高层。底层通常是背景/前景分割、运动目标跟踪、运动目标检测模块,中间层为动作识别模块,高层则是实现行为的理解及动作的识别模块[2]。
动作行为有简单规则的行为,例如走、慢跑、躺、挥手、起立、跳跃等动作。还有是在特定场景中特定的行为,例如恐怖分子的行为检测,马路上行人的行为识别等。在这种场景下对行为的描述有严格的限制。现今对于这两种行为识别的研究离高层部分即行为识别的实现期望要求还有很大的差距,因此高层视觉的识别还是一个研究难点。 2.行为识别的流程和方法