Scidown文献预览系统!
数据Imputation方法的一个基准( A Benchmark for Data Imputation Methods )
S Jger A Allhorn F Biemann
随着数据管道的重要性和复杂性的增加,数据质量成为现代软件应用中的关键挑战之一。数据质量的重要性已经超越了数据工程和数据库管理系统(DBMSs)的领域。此外,对于机器学习(ML)应用,高数据质量标准对于确保稳健的预测性能和负责任地使用自动决策至关重要。最常见的数据质量问题之一是缺少值。不完整的数据集可能会破坏数据管道,并且在未被检测到时会对下游的ML应用程序产生毁灭性的影响。虽然统计学家和最近的ML研究人员引入了各种方法来估算缺失值,但在公平和现实的条件下比较古典和现代估算方法的综合基准却没有得到充分的体现。在这里,我们旨在填补这一空白。我们在大量具有异构数据和实际缺失条件的数据集上进行了一套全面的实验,比较了在只有测试或训练测试数据受到缺失数据影响时,新的深度学习方法和经典的ML估算方法。根据估算质量和估算对下游ML任务的影响来评估每个估算方法。我们的结果对各种归责方法在现实条件下的性能提供了有价值的见解。我们希望我们的结果能够帮助研究人员和工程师指导他们的数据预处理方法的选择,以自动提高数据质量。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】