免费发布

南京大数据技术Meetup第十二次会议

Sat, 21 Jul 2018 14:00:00 GMT+08 ~ Sat, 21 Jul 2018 18:00:00 GMT+08
顾荣

Hide

Event Price
    Please select the order price

    第三方登录:

    More Details

    Event DetailsHide...

    活动标题

    京大数据技术Meetup第十二次会议

    活动时间

    2018年7月21日 下午14:00-18:00

    活动地点

    南京市栖霞区仙林大道163号南京大学(仙林校区)计算机科学技术楼221多功能报告厅

    南京地铁2号线 南大仙林校区站 下车直达  (百度地图: http://j.map.baidu.com/3gzAb)

    活动主持:顾荣

    活动内容

    1. 曹建军(副研究员,国防科技大学、陆军工程大学软件工程学科硕士生导师):数据质量控制与数据治理方法研究与实践

    2. 王文广(达观数据副总裁):深度学习在自然语言理解和文本智能处理上的应用

    3. 李光跃星环科技高级工程师):大数据云的数据交换共享平台的架构探索

    中场茶歇 & 参展海报自由交流(20分钟,请有意参展的单位与我们联系,联系邮箱gurong@nju.edu.cn

    4. 孙斌(南京小安科技创始人):企业复杂关系网络大数据系统 (Lightning Speech)

    5. 刘文杰牛帆数据研发总监):资本市场智能大数据挖掘系统NiuFind

    6. 麦丞程(南京大学计算机系PASA大数据实验室 在读博士生):基于关键词抽取的大规模事件发现研究


    活动注意事项

    1. 本活动免费参加。请提前在线报名并后台审核,活动入场需签到,人数较多,请于尽量与13:25前抵达会场签到。

    2. 根据会场要求, 请务必认真填写报名问题,主办方有权取消恶意填写者的报名资格;

    3. 如果希望分享相关话题或赞助后续活动, 请发送邮件到 gurong@nju.edu.cn


    活动承办方:
    南京大学PASA大数据实验室

    指导与支持单位:

    中国计算机学会大数据专家委员会

    江苏省软件新技术与产业化协同创新中心

    江苏省计算机学会大数据专家委员会

    活动合作媒体:

    CSDN


    南京大数据技术Meetup历次赞助单位(持续添加):

    金牌赞助商:

    华泰证券股份有限公司

    苏宁云商集团股份有限公司

    烽火通信科技股份有限公司

    南京杰世欣计算机科技有限公司

    深圳纳实大数据技术有限公司

    银牌赞助商

    星环信息科技(上海)有限公司

    南京维数软件股份有限公司

    南京领添信息技术有限公司

    小黑鱼科技有限公司

    南京天数智芯科技有限公司

    达而观信息科技(上海)有限公司

    南京小安信息科技有限公司

    江苏百舸数据技术有限公司

    南京览笛信息技术有限公司

    江苏数加数据科技有限公司

    北京灵犀联云科技有限公司

    先智数据科技股份有限公司

    天泽信息产业股份有限公司

    北京瀚思安信科技有限公司

    Alluxio.Inc


    附录:本次活动讲者简介

    题目A数据质量控制与数据治理方法研究与实践

    讲者简介:曹建军,副研究员,国防科技大学、陆军工程大学软件工程学科硕士生导师,原解放军理工大学学术方向带头人,曾获全国优秀博士学位论文提名奖、中国博士后科学基金特别资助,主要从事数据质量控制与数据治理方面的研究工作。先后主持省部级重点项目8项,获省部级奖励4项,获授权发明专利6项,注册软件著作权2项,出版专译著4本,发表学术论文90余篇。

    演讲内容简介:在简要介绍数据质量研究框架,并分析大数据质量带来的新挑战的基础上,重点汇报信息质量研究组(Information Quality Research Group, IQRG)的数据质量控制与数据治理研究与实践总体思路、关键技术研究进展,以及相关系统平台研发和应用情况。


    题目B深度学习在自然语言理解和文本智能处理上的应用

    讲者简介:王文广,达观数据副总裁,浙江大学计算机系硕士,在系统架构设计及研发方面有十余年工作经验。曾在百度负责MP3搜索的架构设计和开发,及百度第一版的语音搜索系统和百度音频指纹系统;曾负责盛大创新院搜索、推荐、广告等多个项目的架构设计工作,所参与开发的系统具备海量数据的快速处理和高精度的挖掘能力,多次获得嘉奖;曾担任互联网金融企业首席架构师,将人工智能和文本挖掘技术用于金融、证券、量化交易等领域,技术效果得到美国大型基金公司认可。

    演讲内容简介:人工智能在近几年高速发展,理论与技术日益成熟,并逐步向每一个领域渗透,在图像处理,语音识别和合成,以及文本智能处理等领域广泛应用。在这个过程中,深度学习的发展功不可没。深度学习是机器学习的一种,源于对人脑认知过程的模拟,由于GPU计算和大数据的发展而来。在深度学习诞生之初就被广泛认可,并在图像,语音和文本等领域超越传统机器学习的方法,代表了当前AI领域发展的最先进的水平和最前沿的发展动向。人工智能的核心课题之一『自然语言理解NLP』在最近几年也逐步采用深度学习技术,在字,词,句,篇等多个层次达到最高的水准,并逐步被产业界所认可和使用,在诸如文本分类,文档审核,智能比对,问答对话等文本智能处理上被广泛应用。本报告将介绍深度学习的发展情况,对自编码器,深度网络,卷积神经网络(CNN),递归神经网络(RNN)及其变种LSTM,GRU,残差网络,注意力机制等进行介绍。并且结合报告者在自然语言理解和文本智能处理方面的实践,介绍深度学习下的表示学习,深度学习在自然语言理解(NLU)上的应用,以及结合深度学习和自然语言理解技术在金融,科技,法律,媒体等各个行业的具体应用。


    题目C大数据云的数据交换共享平台的架构探索

    讲者简介:李光跃,星环科技高级工程师,现主要负责容器云平台上数据相关技术的研究,内容大致涵盖数据共享交换,数据治理,数据资产化等等。2015年于南京大学计算机科学与技术系毕业后加入星环工作至今。

    演讲内容简介:在本次分享中,将会着重介绍在分布式文件系统、分布式数据库上的大数据共享交换的架构和实现。主要从多租户模型,权限管控,数据管理,任务调度和生命周期管理,工单审批/通知系统以及数据应用等对架构进行阐述,同时描述该架构在高性能、高可用、高并发的方面所做的工作以及下一步迭代改进的方向。


    题目D(Lightning Speech)企业复杂关系网络大数据系统

    讲者简介:孙斌,小安科技创始人,多年互联网行业从业经历,擅长大数据搜索产品架构,熟悉相关市场业务开拓。

    演讲内容简介:  企业图谱大数据系统涉及企业之间、知识产权、主要管理人员之间、法律诉讼原被告等复杂网络分析,有模型 6 种:企业图谱、核心族群、关联探寻、最短路径、实际控制路径、最终控制主体构建了最为完整的企业社交关系,直观描绘了企业族群之间千丝万缕的关系,洞悉企业关联谱系,评估整体风险。整合全量社会主体,从企业发展扩张、知识产权、合规表现、商业贸易、人才需求等方面对企业进行多维画像,全方位多角度的动态监控发展变化。


    题目E资本市场智能大数据挖掘系统NiuFind

    讲者简介:刘文杰,牛帆数据(835462)研发总监。2012年毕业于扬州大学计算机系。曾就职于亚信科技、中软国际,2015年至今担任牛帆数据研发总监。在自然语言处理、机器学习、神经网络方面进行了多年的研究和实践,取得了丰硕的成果,并在NiuFind产品上成功落地。在大数据、人工智能技术与产业知识进行结合方面具备独到的见解与丰富的实战经验。

    演讲内容简介:本报告将介绍我们研发的NiuFind系统,该系统于资本市场智能大数据挖掘,主要为券商、投资机构、银行提供资本市场大数据服务、投融/并购业务挖掘、投资研究与退出管理服务。处理的数据包括来自于数据提供商和网络的结构化数据、半结构化数据以及公告、新闻、自媒体、UGC内容、机构研报等非结构化数据。数据具有范围广、来源多、噪声大、更新快的特点,要求基于语义实时建立数据间的逻辑关系。报告中,我将介绍NiuFind设计实现过程中采用的一些技术,包括神经网络、决策树、OCR识别、自然语言处理、Hadoop、粗粒度索引技术、ETL高并发计算、Spark框架、监督型机器学习等。


    题目F基于关键词抽取的大规模事件发现研究

    讲者简介:麦丞程,南京大学计算机科学与技术系PASA大数据实验室在读博士生,导师黄宜华教授。在PASA大数据实验室从事大规模文本语义分析与应用系统的研究。

    演讲内容简介:随着“互联网+政务服务”政策的深入推进,从海量政务文本数据中发现民生、社会等热点问题具有重要的社会价值、经济价值和科研价值。本研究以江苏省政府推出的“江苏12345在线”服务平台的实际需求为导向,旨在通过大数据与人工智能技术,对海量的工单数据进行分析,发现其中的热点事件、紧急突发事件及其演变过程,为政府决策提供依据。首先,提出了一种基于改进的点互信息与邻接熵的新词发现方法;然后,提出了一种基于关键词抽取的事件发现方法,从时间、地点、语义以及事件主题等不同的视角对事件进行发现与聚合;最后,提出了一种基于Spark的大规模事件并行化发现算法,形成处理大规模政务文本数据的能力。实验结果表明,上述方法是有效可行的。


    Event Tags

    Recent Participation

    Perhaps you'd be interested in

    Question

    All Questions

    Haven't posted any questions yet, grab a sofa!

    WeChat Scan

    Share to WeChat→

    Event Calendar   Mar
    M T W Th F Sat Sun
    26 27 28 29 1 2 3
    4 5 6 7 8 9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31