多视角视频数据集与广域持续机载视频:特点、挑战与应用
在计算机视觉和模式识别领域,视频数据集和机载视频技术的发展对于推动相关算法和应用的进步至关重要。本文将介绍两个重要的视频资源:VideoWeb 多摄像头活动和非语言交流数据集,以及广域持续机载视频系统,并探讨它们的特点、面临的挑战和潜在应用。
1. VideoWeb 数据集
1.1 数据集概述
VideoWeb 数据集是为了满足视频活动识别研究中对标注视频数据集的需求而创建的。目前,活动识别研究常受限于缺乏能描绘实际场景中真实活动的标注视频数据集,且现有数据集很少关注多人之间的非语言交流(NVC)以及提供多视角的活动片段。VideoWeb 数据集通过提供多样化的标注多摄像头视频片段来填补这一空白,数据在真实环境中收集,由真实演员模拟日常 NVC 活动。
该数据集包含 2.5 小时、51 个手动标注的场景,活动由至少四组、每组四人的演员进行。数据由四到八个摄像头同时以 640×480 的全分辨率和大约 30 帧/秒的速度录制。数据集可在 http://vwdata.ee.ucr.edu/ 公开下载,适用于自动活动识别、事件搜索和检索、场景分析以及多摄像头人员跟踪等应用。
1.2 数据收集
- 收集时间与设备 :VideoWeb 活动数据集在四天内使用 VideoWeb 摄像头网络中的 37 个室外无线摄像头的子集进行收集。在 51 个标注数据场景中,每个场景使用四到八个摄像头。每天有 6 - 18 个场景,每个场景平均时长 4 分钟。
- 场景特点 :前三天
超级会员免费看
订阅专栏 解锁全文
8389

被折叠的 条评论
为什么被折叠?



