免费发布

LiveVideoStack Meet杭州:多媒体新黄金时代

Sun, 14 Nov 2021 14:00:00 GMT+08 ~ Sun, 14 Nov 2021 17:30:00 GMT+08
Limited 90
LiveVideoStack直播技术社区

Show

Please select the order price

第三方登录:

More Details

Event DetailsHide...

从PPTV、六间房、土豆网,到小米、美团、滴滴、快手、字节跳动,过去20年流媒体应用从PC互联网和宽带时代,过渡到智能手机和4G时代。未来随着基础设施不断升级,新的流媒体创新将会不断涌现。

LiveVideoStack Meet杭州站,我们邀请到粤港澳大湾区数字经济研究院(简称IDEA)计算机视觉资深研究员 曹成坤博士、峰畅科技联合创始人兼CTO 段先德、上海交通大学副教授 邹丹平、阿里巴巴达摩院XR实验室高级算法专家 李宏华四位技术大牛进行演讲。圆桌环节阵容豪华,视见睿来创始人兼CEO 周昌印博士、线性资本董事总经理 黄松延、灵长智能科技(杭州)有限公司CEO 苑志超、微帧科技联合创始人兼CEO 朱政一同分享关于多媒体的新黄金时代,快来报名吧!



活动时间

2021年11月14日 14:00-17:30


活动地点

浙江省杭州市萧山区平澜路518号 | 中国(杭州)5G创新谷


杭州KV.jpg


讲师与议题


曹成坤.jpg

曹成坤博士现任粤港澳大湾区数字经济研究院(简称IDEA)计算机视觉资深研究员,是最早加入CTO Labs计划-光场实验室的研究员,毕业于北京大学信息科学技术学院。曹成坤博士现阶段研究方向为实时人脸重建和深度图估计算法,以及低成本光场相机技术的落地应用。曾为虎牙数字人技术团队的核心成员,参与3D数字人制作算法的研发,并主导了4D数字人高精度采集系统的软硬件搭建以及高精度4D重建算法的研发。曾参与大规模城市场景的3D重建,提出了高效的点云数据压缩算法及精简的建筑3D几何表示方法。曾参与国家973项目几何造型系统的研发,参与核心算法的开发和主导系统架构优化,同时成功申请模型表示国家标准。


Topic 1:光场相机与新视角合成

本次分享讲介绍如何利用光场相机进行新视角合成,包括光场相机的成像原理与技术应用,利用图形学几何方法进行3D重建和4D人脸重建技术在视频合成中的应用,以及利用深度学习方法进行新视角合成的应用和挑战。




段先德1.jpg

段先德,峰畅科技联合创始人&CTO。十几年来一直从事电信领域系统设备软件、VoIP系统软件、webRTC媒体服务器系统软件的一线开发工作。是《面对软件错误构建可靠的分布式系统》中文译者、OWT(Open WebRTC Toolkit)开源项目的前架构师和主程序员,一直致力于用软件设计技术化解RTC系统的核心复杂性。


Topic 2:5G VoNR + WebRTC的视频通话落地实践

在B2C远程服务的场景中,存在大量传统语音客户服务视频化升级的需求,一般的升级方案需要客户安装app,导致服务推广困难。随着5G业务的推广和三大运营商之间VoNR(原4G VoLTE的升级版)业务的互通,以及主流移动端浏览器和iOS内置WebView对WebRTC的支持,可以将原有语音通话轻微升级为视频通话,针对没有开通和不支持VoNR业务的终端,通过短信链接打开WebRTC视频的方式在原有语音通话上叠加视频。这样就以最小的系统改造将语音服务升级为视频服务。本次分享将系统性介绍这种升级的技术方案。




邹丹平.jpeg

邹丹平副教授,目前就职于上海交通大学。他的研究兴趣为实时计算机三维视觉、同步定位与地图构建(SLAM)、无人系统自主导航。他2010年于复旦大学计算机学院获计算机应用技术博士学位,2010-2013年任新加坡国立大学博士后研究员。2013年加入上海交通大学感知与导航研究所,他在SLAM方面的代表工作有动态环境下群体协同CoSLAM (TPAMI, 2012),面向人造环境下的StructSLAM (TVT,2015) 以及StructVIO (TRO, 2019)等。他发起并连续策划了五届上海交通大学无人飞行器智能感知技术挑战赛,并在2017年推广为全国性赛事。


Topic 3:视觉SLAM发展历程、新进展与未来趋势

聚焦AR/VR应用,首先介绍视觉SLAM基本原理、技术发展历程以及现有传统方案与一些成功产品,其次介绍目前基于数据驱动的视觉SLAM新进展与突破,最后讨论视觉SLAM在AI边缘算力爆发下的未来发展可能趋势。




1李宏华.jpg

李宏华,阿里巴巴达摩院XR实验室高级算法专家,长期致力于三维几何处理与三维智能设计研究,曾在ACM TOG、ICCV、CGF、SGP等顶级期刊和会议上发表论文十余篇。


Topic 4:面向全景符号识别的超大规模CAD图纸数据集

从 CAD 图纸中准确的识别各类符号,在三维建模和图纸审查等领域具有广泛的应用价值。我们建立了一个大规模CAD矢量数据集,称为 FloorPlanCAD ,包含超过一万张建筑平面图块,覆盖了包括居民塔楼、商业地产、学校医院等各种类型的场景。通过人工标注,我们赋予每个矢量元素线段级别的语义标签以及实例标签,标签类别超过三十个。

我们定义了一个全新的全景符号识别问题(Panoptic Symbol Spotting),并开创性的使用GCN和CNN相结合的方法,分别捕捉拓扑空间和欧式空间的特征。该方法可以端到端的进行训练,打败诸多传统算法,取得了当前最好的结果。




圆桌PI:挑战与机遇,现实与理想


周昌印2.jpg

周昌印博士是视见睿来公司Vistring Inc.的创始人和CEO,也是计算机视觉、计算摄影、虚拟现实等领域的知名科学家与连续创业者。十几年来,他一直在全球领先的多家机构和公司研究开发最前沿的计算机视觉技术与产品。作为硅谷知名超高清VR视频技术企业Visbit的创始人&CTO,他主导研发了VVOS技术的研发与产品化,大幅提升VR视频体验;作为原Google X 实验室的高级科学家,他是谷歌眼镜采集和处理算法以及Google HDR+技术主要作者之一,参与并推动Android HAL3标准的设计与普及。在加入谷歌之前,他还在微软亚洲研究院、微软雷德蒙研究院、与 Nvidia 英伟达研究院工作过。周昌印毕业于美国哥伦比亚大学计算机系,在计算机视觉、图形学与虚拟视觉领域拥有30多项专利,在顶级学术期刊或国际会议上发表近二十篇学术论文



黄松延.jpg

黄松延博士,线性资本董事总经理、deep tech方向投资负责人,主导完成对思灵机器人、全应科技、海飞科、蔚建、时谛等项目的投资。担任IEEE学会多个顶刊的审稿人。曾就职于华为,任数据科学家职位。黄松延博士毕业于浙江大学信电学院,机器学习方向。



苑志超.jpg.jpeg

苑志超,毕业于牛津大学工程系,多年从事网络通信产品研发、管理与市场开发;在爱立信美国硅谷总部担任IP产品线项目总监期间,曾带领团队成功实现公司IP产品的标准化和成本优化转型以及全球推广等工作。2018年创立灵长智能科技(杭州)有限公司,带领团队以提高用户应用体验为目标针对数据传输层进行智能优化,开发出一系列极具创新型的基于人工智能的网络传输和可视化产品。



朱政1.jpg

15年多媒体开发经验,曾从事芯片设计、语音识别,改进OpenH264码率控制。2014年作为联合创始人创立仟壹视讯,是QY265/KSC265核心作者。在金山云主导过编解码、美颜、VR/AR、连麦、AI+视频等多个研发方向。 2018年创立微帧,主导研发微帧智能编转码技术产品和服务。申请发明专利30余篇。





关于我们


LiveVideoStack是专注在音视频领域的技术社区,聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、旅游、电商、社交、智能设备等行业领域,旨在推动相关开源项目与最佳实践普及和传播,让技术改变我们的交流、学习、娱乐和工作。


关于LiveVideoStack Meet你可以查看此文档(https://shimo.im/docs/gVygrWtq9K9CPg9P),我们会在此更新各个城市的活动信息、报名入口以及城市特使名单等。

如果你想在LiveVideoStack Meet上输出talk、参与讨论,请联系 editors@livevideostack.com 。

咨询电话(同微信):13691133797

市场合作:media@livevideostack.com


112c78d381c6a20b1e109860695f866.png



Event Tags

Recent Participation

Perhaps you'd be interested in

Question

All Questions

Haven't posted any questions yet, grab a sofa!

Location...(Map Detail)

OrganizersMore

WeChat Scan

Share to WeChat→

Event Calendar   Nov
M T W Th F Sat Sun
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 1 2 3 4 5