大多数人对于预测三维人体姿态可能不太关注,但机器人、计算机图形学和有关物体运动的力学分支等其它关注运动学的领域,将能从这点系统中受益。
姿势预测是人工智能(AI)以前就已经应用的一项任务,最近,谷歌在一定程度上开始应用,但之前的一些工作遇到了障碍:它以非自然的方向拉伸数字关节和骨骼,尤其是当关节旋转时。
幸运的是,Facebook人工智能研究部门、谷歌大脑以及苏黎世联邦理工学院的最新研究都承诺将解决这个问题。本周,在Arxiv.org上发表的一篇论文“模拟人类运动的模型”中,研究人员描述了一个人工智能系统,它通过将关节旋转作为一种复杂的数字系统,并通过惩罚关节位置错误来改进姿态的生成。
图:AI系统生成的人体姿态
作为论文的合著者解释,复发性神经网络——一种人工智能算法具有学习能力的长期依赖,历来都被用来执行短期和长期预测,而卷积神经网络算法非常善于分析视觉表象,已经成功地应用于长期代运动(从一个位置到另一个位置的运动)。但由于人体姿势的固有随机性,完美的模型仍然难以获得。
“人类的运动是一个具有高度不确定性的随机过程,”研究人员写道,“对于给定的过去,未来可能会有多个框架序列,不确定性会随着时间的推移而增加。”
大多数模型都运用了过渡运算来预测下一个姿势,它们从摄取的记录帧中输出记录的目标帧,这在很大程度上是有效的。但它不会让他们暴露自己的错误,因此会阻止他们从这些错误中恢复。
图:AI模型生成的姿态
相比之下,研究人员提出的系统使用了一个卷积神经网络,该网络可以查看过去的帧,随着时间的推移,逐渐暴露在自己的预测中,并学习如何进行长期预测。同时,损失函数——将一个或多个变量的值映射到实数上的函数,作为输入关节旋转并计算每个关节的位置。这两位作者说,这既提高了模型的稳定性,又减少了误差。
为了验证模型的短期姿态预测能力,研究人员搜集了360万份人体姿态数据,这是一个开源的三维人体姿态数据集,其中360万份人体姿态来自于7位演员执行15个动作时的姿态,以及相应的图像,并对包含运动样本的不同数据集进行了长期生成测试。
在短期预测任务中,合著者报告了人类3.6米基线的改善。在长期姿态生成的情况下,目标是生成给定平均速度和地面轨迹的姿态序列,他们将模型描述为与最近的工作相比具有“定性”,同时允许更好地控制时间和空间约束。他们把四元数神经网络扩展到其他与运动相关的任务,如视频中的动作识别或姿态估计,并使用“直接在四元数领域执行计算”的神经网络。
【来源:千家网】