Scidown文献预览系统!
利用四元数输出改进声事件定位与检测中的DOA估计( Improvement of DOA Estimation by using Quaternion Output in Sound Event Localization and Detection )
Y Sudo K Itoyama K Nishida K Nakadai
本文描述了在声场景和事件检测与分类(DCASE)2019任务3中使用四元数输出改进波达方向(DOA)估计性能。DCASE 2019 Task3的重点是声音事件定位和检测(SELD),它是一个除了传统的声音事件检测(SED)之外,还可以同时估计声源方向的任务。基线法直接回归声源方向角。然而,角是一个周期函数,它具有不连续性,这可能会使学习不稳定。具体而言,即使-180°和180°在相同的温度下,也会计算出较大的损失。用分类方法代替回归方法估计DOA角可以解决这种不连续性的不稳定性,但这也造成了计算的局限性。本文提出在神经网络输出层引入连续函数四元数,而不是直接估计声源方向角。该方法只需改变现有神经网络的输出即可实现,且不显著增加中间层的参数数。实验结果表明,该方法在不明显增加参量的前提下,提高了DOA估计精度。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】