收起
立即使用
DataFunTalk
2019人工智能年终论坛
2019年马上就要结束了,回顾全年,无论外部的环境有多复杂(国内外、资本市场),从长远来看,AI在各行各业获得越来越广泛的应用已经成为社会发展的趋势。从 AI 技术进展的角度来看,尤其是NLP领域,随着Bert模型被提出,今年涌现出了大批效果明显的改进模型,如 XLNet、RoBERTa、ALBert、Google T5 等。而在推荐、广告、搜索等业务场景下,深度学习模型的应用也得到了广泛的尝试,如用户兴趣挖掘、广告实时竞价、智能时尚搭配等等。
12月21日,DataFun将举办2019人工智能年终论坛,将针对业界最前沿、最实用、最有价值、最有趣的算法模型在实际业务中的落地实践,邀请一线的资深专家,进行专题分享。届时还将邀请数百位社区往期的嘉宾和爱好者,共同参与盛会!
关注DataFunTalk公众号,回复:“年终论坛”,可获得精选合集电子书,一份哦!识别下方二维码即可参与:
主办方:DataFun、人民邮电出版社
协办方:中关村壹号
独家合作投资机构:将门创投
独家合作媒体:机器之心
时间:2019年12月21日 9:00 - 17:00
地点:中关村壹号
地址:北京市海淀区北清路81号中关村壹号 A1 座 26层
论坛日程
嘉宾详细简介
1. 张俊林 微博AI Labs负责人
分享题目:推荐系统技术发展趋势及模型召回
内容摘要: 本报告将系统梳理推荐系统的若干技术发展趋势,比如细粒度特征、新型特征抽取器、特征组合模式、新型多目标优化技术、兴趣点建模、长短期兴趣联合建模、迁移学习等。推荐系统包含典型的几个阶段:召回,排序,Reranker。在召回阶段使用FM/FFM/DNN等模型来进行召回,也是一个典型的技术发展趋势。本报告将展开介绍召回阶段可能采用的推荐模型,并分享一些相关的实践经验。
听众收益:
1. 可以比较系统的了解推荐系统目前面临的主要问题及技术发展趋势;
2. 熟悉及了解召回阶段如何使用推荐模型(FM/DNN等)来增进业务效果;
新技术/实用技术点:
推荐技术发展趋势/FM/DNN等模型召回技术
嘉宾介绍:
张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队AI Lab负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。
他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL2006、COLING2004、IJCNLP2004等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在Recsys2019以及ICDM2019等国际会议发表多篇深度学习推荐系统相关论文。
2. 曾敏 微软 高级技术总监
分享题目:微软小冰:如何构建人格化的对话系统
内容摘要:微软小冰是领先的跨平台人工智能机器人,本报告将介绍微软小冰最新的对话技术框架,以及在这套框架的基础之上,如何一步步构建人格化的对话机器人,并且在社交娱乐及实用场景当中的具体运用。
听众收益:
1. 了解对话系统的最新进展
2. 了解为什么对话系统需要逐步人格化
3. 了解如何一步步构建人格化机器人
新技术/实用技术点:
对话系统的话题引导,文本挖掘,文本预训练等对话技术的一些实践
嘉宾介绍:曾敏,微软小冰对话系统负责人,主要研究方向包括开放域聊天、情感分析、知识图谱、推荐系统、定制化对话系统等。曾敏毕业于北京航空航天大学,于2012年加入微软互联网工程院,在Bing中国团队从事Bing Answer, 搜索相关性、英文搜索等工作,并于2014年初开始设计并研发小冰的开放域对话系统。
3. 李先刚 滴滴出行 AI Labs 首席算法工程师
分享题目:滴滴端到端语音AI技术实践-从算法到应用
内容摘要:语音识别作为深度学习序列识别算法的应用领域,多种序列建模算法(从端到端的CTC,到Attention乃至于近些年来的Transformer以及无监督预训练)在语音领域中得到的广泛应用,一方面带来了识别性能的显著提升,另外也带来了多种新的应用的挑战。本报告将结合滴滴在端到端语音AI技术在业务落地过程中的一些探索和实践,介绍语音技术近些年来的发展趋势。
听众收益:
1. 对于语音识别的技术发展趋势将会有所了解;
2. 对深度学习算法在实际业务落地中将客服的挑战有所了解;
新技术/实用技术点:
1. 滴滴的端到端语音识别系统;
2. 无监督预训练在语音领域中的应用。
嘉宾介绍:李先刚博士,滴滴出行AILABS首席算法工程师,滴滴语音技术负责人。他长期从事语音识别、语音合成、说话人识别和口语对话理解的研究。曾参加Blizzard Challenge 2013国际语音合成比赛,搭建了当时最好的英语语音合成系统。加入滴滴前,他曾是百度语音技术部语音识别技术负责人,推动了包括DeepSpeech、DeepSpeaker等系统的研发迭代,以及其语音识别、说话人识别的产品性能的提升。其中DeepSpeech 2被 MIT Tech Review 评为 2016 十大技术突破之一。
4. 冯知凡 百度 主任研发架构师
分享题目:从文本到多模:基于知识图谱的语义理解技术及应用
内容摘要:知识图谱在人工智能应用中的重要价值日益突显。百度构建了超大规模的通用知识图谱,并在搜索、推荐、智能交互等多项产品中广泛应用。同时,随着文本、语音、视觉等智能技术的不断深入,知识图谱在复杂知识表示、多模语义理解技术与应用等方面都面临新的挑战与机遇。本报告将介绍百度基于知识图谱,从文本到多模态内容的理解技术及应用的最新进展。
听众收益:
1. 了解百度基于知识图谱对多模内容理解方面的技术与智能应用
2. 了解百度在搜索、推荐、内容生成等实践中积累的知识图谱最新进展;
3. 相应的项目、产品、技术合作机会
新技术/实用技术点:
文本理解、认知图谱、多模认知
嘉宾介绍:冯知凡,现任百度知识图谱部主任架构师。2011年至2013年任职于百度互联网数据研发部,曾负责百度网页搜索内容价值、视频及图片的场景化推荐。2013年至今,任职于百度知识图谱部,参与了百度知识图谱设计及构建的整体流程,具有丰富的知识图谱实践经验,并主要负责Query理解、知识融合、知识消歧、知识图谱文本理解、知识图谱表示学习、知识图谱多模态认知等技术。
5. 刘水 腾讯 资深研究员
分享题目:语义搜索技术与实践
内容摘要: 基于关键词的相关搜索和基于语义理解的搜索是搜索引擎对搜索query的2种主要满足方式;同时,近些年来,随着智能硬件的蓬勃发展,语义层面的满足方式越来越广泛的覆盖到各种应用端;本报告将从应用层面和技术层面为学员总结一下工业环境下语义搜索应用的相关技术以及算法架构。
听众收益:
理解搜索中应用的各种文本分析方式,了解工业级别语义搜索的开发范式。
新技术/实用技术点:
搜索中主要的文本处理技术,以及腾讯视频在多模态实体链接的一点探索。
嘉宾介绍:刘水,2011年哈工大机器翻译实验室博士毕业。主要研究方向是机器翻译和完全句法分析,毕业后就职雅虎、百度和腾讯,参与美国雅虎搜索引擎的语言理解组的工作,负责度秘的重点垂类的语义解析,目前在腾讯视频负责语义搜索和知识图谱方向。
6. 于恒 阿里巴巴 达摩院 高级算法专家
分享题目:大规模预训练模型在机器翻译中应用
内容摘要:本报告将介绍阿里翻译在大规模预训练模型上的最新应用成果,从最大程度利用单语数据的角度,显著提升翻译质量。 相关内容被AAAI2020接收。
听众收益:了解大规模预训练模型在下游任务应用上的最新进展,同时了解工业界对于BERT等模型的落地方式和收益。
新技术/实用技术点: 大规模预训练模型在机器翻译上的应用。
嘉宾介绍:于恒,阿里巴巴达摩院机器智能技术事业部高级算法专家。中科院计算所博士,CCF中文信息技术专委会委员。主要从事机器翻译方向的研究,在自然语言处理和人工智能领域顶级国际会议ACL、AAAI、EMNLP 等发表论文十余篇。 目前在阿里翻译平台组担任翻译模型组负责人,主持上线了阿里神经网络翻译系统,为阿里巴巴国际化战略提供丰富的语言支持。
7. 王金刚 美团点评 算法专家
分享题目:美团BERT的探索和实践
内容摘要: 美团点评作为中国领先的生活服务电子商务平台,涵盖搜索、推荐、广告、配送等多种业务场景,几乎涉及到各种类型的自然语言处理任务。在我们的平台上,迄今为止积累了近40亿条用户公开评价(UGC),如何高效而准确地完成对海量UGC的自然语言理解和处理是美团点评技术团队面临的挑战之一。美团NLP中心一直紧跟业界前沿技术,开展了基于美团点评业务数据的预训练研究工作,训练了更适配美团点评业务场景的MT-BERT模型,通过微调将MT-BERT落地到多个业务场景中,并取得了不错的业务效果。
听众收益:
1. 预训练语言模型研究历史和现状
2. 美团BERT预训练工作介绍
3. BERT在美团业务场景中的应用
新技术/实用技术点:
1. BERT预训练加速和改进
2. BERT适用业务场景和实践
嘉宾介绍:王金刚,博士,美团点评搜索与NLP部算法专家。研究方向为自然语言处理,相关成果发表在TKDE、SIGIR、AAAI、IJCAI、EMNLP等顶级期刊和会议;2016年博士毕业后加入阿里巴巴,任职于搜索事业部,达摩院机器智能技术实验室NLP团队和机器翻译团队,先后参与了智能问答、文本摘要和机器翻译等方向工作。2018年9月底加入美团,负责语言模型预训练和情感分析相关工作。
DataFun简介:
DataFun专注于数据智能在工业界落地经验分享,发起于2017.12,至今已在全国7个数据智能企业和人才集中的城市举办了近100场线下技术分享和两场千人规模的行业峰会,邀请近400位工业界专家和40位知名学者参与分享,近30000人次从业者参与线下交流。合作企业包含BAT等大厂,以及知名互联网公司和数据智能创业公司。其运营的公众号DataFunTalk共生产原创文章近300篇,近百万阅读,3万+精准粉丝。
DataFun专注于数据智能在工业界落地经验分享,发起于2017.12,至今已在全国7个数据智能企业和人才集中的城市举办了近100场线下技术分享和两场千人规模的行业峰会,邀请近400位工业界专家和40位知名学者参与分享,近30000人次从业者参与线下交流。合作企业包含BAT等大厂,以及知名互联网公司和数据智能创业公司。 其运营的公众号DataFunTalk共生产原创文章近300篇,了解往期活动文章,微信搜索DataFunTalk获取