计算未来轻沙龙：大规模数据存储与挖掘 | PaperWeekly × 清华大学预约报名-PaperWeekly活动-活动行

活动内容收起 展开

11月10日（周六），PaperWeekly将携手清华大学计算机系带来“计算未来轻沙龙——大规模数据存储与挖掘”专题线下分享会。

【活动时间】

报名时间：即日起至 11 月 8 日 24:00

活动时间：11 月 10 日（本周六）13:30 - 17:30

【活动地点】

清华大学信息科学技术大楼（FIT楼）二层多功能报告厅，请由FIT楼西门进入

【特邀嘉宾】

1. 张凯 / SmartX 联合创始人 & CTO

张凯，毕业于清华大学计算机系高性能所，SmartX 联合创始人 & CTO。

报告题目：存储技术热点和趋势总结

近年来，存储技术的发展成为了热门话题，无论在存储硬件、存储协议、还是存储软件架构等领域，都出现了新的产品和技术。例如 NVMe SSD，NVM over Fabric，Persistent Memory，Software Defined Storage 等等。此外，也产生了一些新的应用场景，例如虚拟化、容器等等。在本次报告中，我们将对近年来学术界和工业界的存储技术热点和趋势进行总结，并介绍软件定义存储产品面临的挑战。

2. 李开宇 / 清华大学计算机系博士生

李开宇，清华大学计算机系，硕转博四年级在读博士生，主要研究方向为数据库下的近似查询、众包数据管理和时空数据库，在国际会议 ACM SIGMOD、国际期刊 IEEE TKDE、国际期刊 CSE，均有一作文章发表。

报告题目：众包数据库中基于rating-ranking模型的Top-k查询

在这个 talk 中，我将会展示如何在众包数据库与中，基于概率模型 rating-ranking 推理给出 n 个实体的 Top-k 查询结果。并展示如何优化算法和节约查询代价。

3. 李秀星 / 清华大学计算机系博士生

李秀星，博士在读，主要研究方向为数据库上的数据管理，相似度匹配与查询。硕士期间曾经在国际顶级会议 ICDE 上有论文发表。

报告题目：An Efficient Framework for Exact Set Similarity Search Using Tree Structure Indexes

在这个 talk 里，我将会讨论现代数据库中的一个关键技术：相似集合查询。即给定一个集合，找到数据库中所有与其相近的记录。我提出了一种树状结构对其进行索引并且应用哈希算法对其过滤操作进行优化。进一步地，我提出了一种基于数据分块的多索引结构对查询过程进行了优化。

4. 袁海涛 /清华大学计算机系硕士生

袁海涛，硕士在读，本科毕业于北京航空航天大学，研究方向为时空大数据管理（包含轨迹大数据的管理与查询），硕士期间曾在国际顶级会议 ICDE 上发表文章。

报告题目：基于路网的出行轨迹大数据相似性查询与连接

在这个 talk 中，我们将讨论如何在时空数据库当中，基于路网提高出行轨迹数据在相似性查询和链接的效率。具体来说，我们重新定义了时空数据中基于路网的轨迹表达以及轨迹相似性的计算方式，然后设计相应的索引和查询算法。最后，我们将介绍如何在 Spark 上实现相应的分布式查询框架。

5. 孙佶 / 清华大学计算机系博士生

孙佶，博士在读，本科毕业于北京邮电大学计算机学院，研究领域为可扩展数据融合。博士期间曾经在顶级会议 VLDB 发表文章。

报告题目：分布式可扩展字符串相似查询系统

本次报告，我将介绍一个易部署可扩展分布式字符串查询系统的设计原理以及其在实际数据融合、查询推荐中的应用。

6. 骆昱宇 / 清华大学计算机系硕士生

骆昱宇，硕士在读，研究领域为数据可视化和数据清洗。曾经在 SIGMOD、ICDE、EDBT 发表文章。

报告题目：Towards Automatic Data Visualization

This talk mainly introduces the key techniques of automatic data visualization. (I) Visualization Recognition: given a visualization, is it "good" or "bad"? (II) Visualization Ranking: given two visualizations, which one is better? (III) Visualization Selection: given a dataset, how to recommend top-k visualizations?

7. 秦雪迪 / 清华大学计算机系博士生

秦雪迪，博士在读，本科毕业于哈尔滨工业大学计算机科学与技术系，主要研究数据库管理中如何高效的进行数据可视化。博士期间曾经在 EDBT、BIG DATA MINING AND ANALYTICS 发表文章。

报告题目：Visualizing Your Data by Keyword Search

在这个 talk 中，我们会讨论如何使用关键字搜索来为用户推荐感兴趣的可视化图。并讨论在用户得到感兴趣的可视化图之后，如何进行进一步的数据探索，来发现更多有意义的信息。

8. 刘宁 / 清华大学计算机系博士生

在这个 talk 中，我们将介绍实体知识在医疗文本分类的一些应用，以及如何更好地利用现有的知识库中的实体提高预测系统的性能。

报告题目：知识驱动的基于文本的病人死亡预测

9. 冉晨伟 / 清华大学计算机系博士生

冉晨伟，博士在读，本科毕业于清华大学计算机系，研究兴趣围绕知识图谱的扩充与推理。博士期间曾经在顶级会议 WWW、ICDM 发表文章。

报告题目：针对微博实体链接的注意力因子图模型

在这次报告中，我们将关注微博中的实体链接问题。我们将介绍如何将因子图应用于该任务，并通过引入注意力机制，使模型拥有更高的效率。

【如何报名】

1. 因场地有限，本次活动仅接受 120 位用户凭电子门票二维码入场；

2. 为了公平起见，我们将在 11 月 6 日至 11 月 8 日期间，每天 13:00 放出 40 个报名名额；

3. 活动采取审核制报名，我们将根据用户研究方向与当期主题的契合度进行筛选，通过审核的用户将收到包含电子门票二维码的短信通知；

4. 如您无法按时到场参与活动，请于活动开始前 24 小时在 PaperWeekly 微信公众号后台留言告知，留言格式为放弃报名 + 报名电话；无故缺席者，将不再享有后续活动的报名资格。

【主办单位】

清华大学计算机科学与技术系

PaperWeekly

中国中文信息学会青年工作委员会

【支持单位】

未命名文件.jpg

举报活动

活动标签

IT互联网

您还可能感兴趣

您有任何问题，在这里提问！

为营造良好网络环境，评价信息将在审核通过后显示，请规范用语。

全部讨论

还木有人评论，赶快抢个沙发！

热门站点

精选推荐

更多服务

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起 展开

活动标签

最近参与

您还可能感兴趣

中国运动健身创业者研学汇

培养孩子面向未来的核心能力，脑科学引领的未来教育理念，家长分享沙龙，终身学习

从流量到留量长沙何以成为连锁品牌向荣的沃野？

您有任何问题，在这里提问！

全部讨论

活动主办方更多

PaperWeekly

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起展开

活动标签

最近参与

您还可能感兴趣

中国运动健身创业者研学汇

培养孩子面向未来的核心能力，脑科学引领的未来教育理念，家长分享沙龙，终身学习

从流量到留量 长沙何以成为连锁品牌向荣的沃野？

您有任何问题，在这里提问！

全部讨论

活动主办方更多

PaperWeekly

使用第三方账号登录

使用手机号/邮箱登录

举报

让批评和口水来的更猛烈些吧！

从流量到留量长沙何以成为连锁品牌向荣的沃野？