吴恩达创立的公司 Landing AI 开发了一款社交距离监控工具,通过摄像头监控行人之间的距离,要求至少保持 6 英尺(接近两米)。
Social Distancing Detector:用机器学习监控社交距离
近日,吴恩达创立的 AI 公司 Landing AI 在其官方博客平台上宣布了一款社交距离监控工具,其中包含一个演示视频,基于公开街景数据集 The Oxford Town Centre 展示了这个新的社交距离探测器。
上图源自演示视频的一个截图,当行人之间的社交距离满足要求,也就是两米(WHO 倡议人与人应保持至少 3 英尺(0.9 米)的距离,我国则建议至少 1.5 米)时,行人周围是绿框,当彼此之间的距离不符合要求时(如上图红框所示),则会出现红色提醒。
在当前危机中,减少传播的措施之一是隔离。虽然很多公司已经要求员工在家办公,但制造业等领域还有很多员工不得不继续工作,保持社交距离可能不容易被执行,这就是 Landing AI 公司创建 AI 工具来确保彼此之间保持安全距离的原因。根据介绍,Landing AI 公司的许多客户来自制造业和制药业,每天都在生产重要物品,他们的技术人员只需要将该软件集成到安全摄像头中,就可以轻松监控工作场所。
内部工作原理:校准,检测和测量
在博客文章中,Landing AI 解释了该工具的内部工作原理。
校准
由于输入视频是从透视角度拍摄的,因此第一步是利用计算将视图角度转换为鸟瞰角度(自上而下),这个过程被称作校准。由于输入帧是从单个摄像头拍摄的单眼图像,最简单的校准方法之一就是在透视图中选择四个点并将其映射到鸟瞰图中矩形的各个角上,假设每个人都站在同一平面上。以此类推,可以将这种方式应用在整个透视视图上。这种方法虽然广为人知,但想要在实际中正确应用却并不容易。因此,开发者们构建了一个轻量级工具,即使非技术用户也可以实时校准系统。
在校准步骤中,他们还考虑了鸟瞰图的比例问题,例如,在现实中,6 英尺是多少像素。
检测
第二步涉及将行人检测器应用到透视图上,以便能够在每个行人周围绘制边界框。为简单起见,使用基于 Faster R-CNN 的开源行人检测网络。为了清除输出边界框,使用了一些算法简化后处理程序,例如非极大值抑制(NMS)和各种基于规则的启发式算法;开发者应该基于实际生活假设来选择使用哪种规则(例如识别人时应该识别他的高度而不是宽度),这样才能最大程度降低过度拟合的风险。
测量
现在,在给定每个人边界框的情况下,在鸟瞰图中估计他们的坐标位置(X 轴、Y 轴)。由于校准步骤输出了平面图的转换,因此将上述转换应用到每个人的边界框的底部中心点,从而得出其在鸟瞰图中的位置。最后一步是计算每两人之间的鸟瞰图距离,并根据校准中估算的缩放系数来缩放距离。将低于最小可接受距离的人用红色突出标记,并在两者之间画一条线进行强调。
网友不太买账
针对该工具的推出,吴恩达第一时间在 Twitter 上发布了该消息,并受到了很多用户的关注。
评论区的态度褒贬不一,但大部分网友的评论表明他们对此并不买账,有人认为单就人眼估计短距离就足够了,也有人担心隐私问题,并认为这是技术的滥用,也有部分网友怀疑当前版本是否真的可用,还是说这仅仅是概念证明。但 Landing AI 在其官方博客称,正如医学专家所说,在获得疫苗之前,保持适当的社交距离是我们保护自己的最好的方式之一,也可有助于缓解疫情扩散并加快经济恢复的步伐。公司在早期阶段创建并共享此工具是希望能为用户提供帮助并想鼓励其他人来探索新的方法来抗击疫情。
对于隐私相关的问题,Landing AI 在文章最后进行了简单阐述,并提醒大家注意:
计算机视觉的兴起引发了有关隐私和个人权利的重要问题,我们当前的系统无法识别个人,因此我们敦促使用此系统的任何人必须公开透明且仅在知情人同意的情况下使用。
参考链接: