DataFusion 是基于 Apache Arrow 的高性能查询引擎,适用于基础设施领域的实时数据处理。它利用列式内存格式,实现快速查询,适合网络监控和遥测数据分析。
DataFusion 支持水平扩展,适应云环境的性能需求。它兼容多种存储和数据格式,在复杂环境中表现出色。实际应用中,DataFusion 能在 IoT 部署中收集和分析数据,并与 Kubernetes 等工具集成,便于管理。
技术亮点包括可扩展查询引擎、云优化和强大的生态系统。DataFusion 是提高基础设施效率和可靠性的理想选择。
本次 Meetup 我们邀请了来自 Greptime、eBay 和蚂蚁集团的系统研发工程师,分享他们基于 DataFusion 构建出来的多样系统,参与 DataFusion 社群的故事,以及对 DataFusion 未来的看法。
本次活动将于 7 月 21 日(周六)下午两点半开始,场地开放至五点半。
预计每位讲师将会进行 25-30 分钟的内容分享,我们也会预留出更多的时间给参与者来自由交流和提问。
同时,我们欢迎任何正在使用 DataFusion 构建软件系统的开发者向我们提交议题并在 Meetup 上做分享。
目前的演讲议程如下:
介绍Apache DataFusion 发展历史与基本概念;Apache DataFusion 提供什么样的能力和扩展方法;DataFusion使用场景与eBay使用案例等。
Ruihang Xia at Greptime Build a distributed execution engine in GreptimeDB with DataFusion
介绍在 GreptimeDB 中是如何通过 DataFusion 来构建一个分布式的执行系统的。包括设计与实现中的细节,和其他系统的参考与比较,以及未来演进的方向等等。
Apache HoraeDB 如何使用 Datafusion 构建自己的时序查询引擎(单机与分布式);遇到的问题与挑战。
(10个月前)
(10个月前)
(10个月前)
(10个月前)
(10个月前)
(10个月前)
1、本活动具体服务及内容由主办方【Greptime 格睿科技】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。
2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。