Facebook 推出了一个名为 SoundSpaces 的新的开源工具,专为所谓的 "嵌入式AI "而设计。该工具旨在通过允许机器人分析环境声音,帮助他们更有效地找到自己的方向。
图片来源:siliconangle
音频对导航很有用。例如,如果用户要求假想的机器人家庭助理取回正在响铃的智能手机,则将声音追踪到其来源可能比目视检查设备可能位于的每个房间要快得多。
SoundSpaces 是一个主要基于 3D 环境声学模拟的音频渲染信息集。该信息集设计用于 Facebook 的开放供应模拟平台 AI Habitat,它提供了一个软件程序传感器,使其可以在扫描的真实世界环境中插入声源的模拟。
SoundSpaces 提供了一系列音频文件,AI 开发者可以用这些文件在模拟中训练声音感知的 AI 模型。Facebook 方面表示,这些音频文件不是简单的录音,而是 "几何声学模拟"。这些模拟包括关于波浪如何从墙壁等表面反射的信息、它们如何与不同的材料相互作用、以及一些其他数据,开发人员可以使用这些数据来创建听起来很真实的模拟,以训练 AI 模型。
Facebook 研究科学家 Kristen Grauman 和 Dhruv Batra 在博客中写道,"据我们所知,这是第一次尝试训练既能看到又能听到的深度强化学习代理,以映射新环境并定位发声目标。通过这种方法,我们在导航方面实现了比使用单模态同行更快的训练和更高的准确性。"
此外,Facebook 方面还表示,他们已经开源了一个名为“Semantic MapNet”的工具,开发人员可以用来为模型提供某种空间内存以改善导航的软件模块。