KD2021最佳论文等奖项出炉,首尔大学、斯坦福获奖,北京理工大学上榜。

机器心脏报告
机器之心编辑部
国际数据挖掘峰会KDD 2021刚刚公布了最佳论文和其他奖项。最引人注目的最佳论文奖由首尔国立大学和斯坦福大学的研究人员获得,最佳学生论文奖由维也纳大学的研究团队获得。
KDD会议始于1989年,是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。这也是首次介绍大数据、数据科学、预测分析和众包概念的会议。
目前,KDD 2021大会正在网上如火如荼地举行,议程包括主题演讲、焦点小组、特邀报告、专题研究、研讨会等。共收到有效投稿1541篇,其中论文238篇,录取率15.4%,低于去年的录取率16.9%。
在2021在线开放之前,已经公布了多个奖项,包括创新奖、服务奖、论文奖(亚军和荣誉提名)、新星奖、时间测试研究奖和时间测试应用科学奖,其中北航校友夏“本”胡(胡夏)获得新星奖,字节跳动反洗钱研究团队的一篇2011论文获得时间测试研究奖。
刚刚,KDD 2021公布了研究方向和应用数据科学方向的最佳论文和最佳学生论文,具体如下:
首尔大学的研究人员获得研究方向最佳论文奖,斯坦福大学等机构的研究人员获得应用数据科学最佳论文,北京理工大学和美的集团的研究人员获得应用数据科学最佳论文,维也纳大学的研究人员获得研究方向和学生论文亚军。
今年的“研究方向最佳论文奖”由首尔国立大学的Jun-gi Jang和U Kang获得。获奖论文是《Fast and Memory-Efficient Tucker Decomposition for Answering Diverse Time Range Queries》。
地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467290
摘要:给定一个时间密集型张量和一个任意的时间范围,如何有效地得到这个范围内的潜在因子?Tucker分解是分析稠密张量以发现隐藏因素的基本工具,已被应用于许多数据挖掘应用中。然而,现有的分解方法不提供分析特定范围内的时间张量的功能。现有的方法是一次性的,主要集中在整个输入张量的Tucker分解。现有的一些预处理方法虽然可以处理时间范围的查询,但仍然非常耗时且准确率较低。
本文提出了Zoom-Tucker分解方法,这是一种快速且节省内存的Tucker分解方法,可用于寻找任意时间范围内时间张量数据的隐藏因子。Zoom-Tucker充分利用块结构对给定张量进行压缩,支持有效查询,捕捉局部信息。Zoom-Tucker通过仔细解耦包含在范围中的预处理结果,并仔细确定计算顺序,可以快速高效地回答各种时间范围查询。研究证明,与现有方法相比,Zoom-Tucker的速度快171.9倍,所需空间少230倍,并提供相当的准确性。
Zoom-Tucker预处理过程。
查询时间和重建误差权衡的比较结果。
成本比较:与其他方法相比,Zoom-Tucker需要的空间少230倍。
最佳研究方向的学生论文
维也纳大学计算机学院的Ylli Sadikaj等人获得研究方向最佳学生论文,获奖论文为《Spectral Clustering of Attributed Multi-relational Graphs》。
地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467381
摘要:图聚类旨在发现节点的自然分组,从而将相似的节点分配到一个共同的簇中。一些研究针对各种图提出了各种算法,包括简单图、节点具有相关属性的图、边具有不同类型关系的图等。然而,许多领域的复杂数据可以同时表征为属性网络和多关系网络。在本文中,研究人员提出了SpectralMix,这是一种针对具有分类节点属性的多关系图的联合降维技术。SpectralMix整合了来自属性、关系类型和图结构的所有可用信息,以实现对聚类结果的合理解释。此外,SpectralMix对现有方法进行了概括:当仅应用于单个图时,它被简化为谱嵌入和聚类,当应用于分类数据时,它被转换为同质性分析。在几个真实数据集上进行了实验,以检测图结构和分类属性之间的依赖关系,并展示了SpectralMix与现有方法相比的优势。
上图显示了ACM数据集上几个模型的实验结果的可视化。从中可以观察到,ANRL、克罗斯姆纳、DMGC、马琳表现不佳,是因为属于不同研究领域的节点混杂在一起;而SpectralMix、韩、能较好地区分不同类型的节点。显然,SpectralMix能够以更清晰的边界和更多的节点正确地聚类不同研究领域的节点。此外,值得注意的是,在图4(h)中的嵌入式SpectralMix节点上,右侧有一组不同的节点,代表噪声数据或异常值,这表明SpectralMix对异常值具有鲁棒性。
应用数据科学最佳论文奖
今年的“应用数据科学最佳论文奖”由斯坦福大学和其他机构的芹那常等人获得。获奖论文是《Supporting COVID-19 policy response with large-scale mobility-based modeling》。
地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467182
摘要:限制流动一直是控制新冠肺炎传播的主要干预措施,但也给个人和企业带来了经济负担。为了平衡这些相互竞争的需求,决策者需要分析工具来评估不同流动性措施的成本和收益。
在本文中,该研究人员介绍了受与弗吉尼亚卫生部在决策支持工具方面的互动启发而开展的工作,该工作使用大规模数据和流行病学模型来量化移动性变化对感染率的影响。研究模型通过使用细粒度的动态移动网络来捕捉新冠肺炎的传播,该网络每小时对人们从社区到各个地方的移动进行编码,每小时超过30亿条边。通过破坏移动网络,这项研究可以模拟各种重新开放计划,并预测它们对每个部门新感染和就诊损失的影响。为了在实践中部署这一模型,该研究建立了一个强大的计算基础设施来运行数百万个模型,并且该研究与政策制定者合作开发了一个交互式仪表板,用于传达该模型对数千个潜在政策的预测。
方法概述。
交互式仪表盘由5部分组成,分别是POI导航条(左)、地图面板(右上)、表格面板(右下)、数据面板(右下)和移动历史面板(弹出窗口)。
应用数据科学最佳论文亚军
来自北京理工大学和美的集团的、Chi Harold Liu和获得应用数据科学最佳论文亚军,获奖论文为《Energy-Efficient 3D Vehicular Crowdsourcing For Disaster Response by Distributed Deep Reinforcement Learning》。
地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467070
成功应对灾害的关键是快速有效地获取环境和生活数据。车辆众包(VC)由无人机、无人驾驶汽车等无人车(UV)组成,从兴趣点(PoI)收集数据,如可能有幸存者的地方、火灾现场等,为协助救灾提供了有效途径。在本文中,研究人员考虑在3D灾难工作空间中导航一组UV,以最大化收集的数据量、地理公平性和能量效率,同时最小化有限的传输速率造成的数据丢失。
本研究提出了一种分布式深度强化学习框架DRL-DisasterVC(3D),该框架具有重复的经验回放(RER)以提高学习效率,并使用量身定制的目标网络来提高学习稳定性。本研究采用多头关系注意(MHRA)的三维卷积神经网络进行空间建模,并加入辅助像素控制(PC)进行空间探索。研究人员设计了一个名为DisasterSim的新灾难响应模拟器,并进行了大量实验,以表明当UV,PoI和SNR阈值的数量发生变化时,DRL灾难VC (3D)在能效方面优于所有五种基线方法。
研究人员提出的DRL-灾难。

其他教程

视频剪辑到底需要多大内存(视频剪辑到底需不需要配音)

2022-8-30 21:05:05

其他教程

元宇宙营销(数字营销概念板块)

2022-8-30 21:07:08

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索