北京 | 分析师必备的统计思维入门课 | 5月19日
收起
立即使用
我们关注每一个人的学习效果,允许同一课程付费一次可以线下或者远程参加所有城市所有场次,直到完全掌握,也方便参与后续课程更新的部分。线下加入和远程加入(通过专业会议直播工具)价格一样,结束后都会收到录播。
“统计学是我们在大数据时代读懂、听懂和看懂一切事实真相的基础。”
—谷歌公司首席经济学家哈尔·瓦里安
当年在你报考大学志愿的时候,一定扫过一眼一门叫“统计学”的专业。谁能知道,如今的大数据时代,概率统计以及由其衍生发展的数据科学已经成为了每个人必不可少的知识储备。
根据哈佛商业评论分析,21世纪最Sexy的工作非数据科学家莫属!
LinkedIn也发布了2007~2017年上升最快的职位,第一名和第二名分别被机器学习工程师及数据科学家占领!
可能你会说,我当年读大学的时候还没有数据科学这门课呢!好不容易有一个成为科学家的机会,也因为生不逢时没有赶上。我这生也许和数据科学家没有缘分了吧! 其实,小编想偷偷告诉大家,数据科学家只是一件马甲,统计学才是基础。成为一个数据科学家固然不容易,但是你需要的基本技能都能各个击破,其中以概率统计知识为基础,再加上沟通能力,编程基础以及商业洞察力,你就能入门“数据科学”了。并且,这些能力也是成为一个合格的商业分析师所不可或缺的。 正是因为这波数据科学及商业分析的热潮,统计学再次站上了学术派的风口浪尖。掌握统计思维,无论对职业还是人生都是一次极大的提升。 此次我们精心为大家准备了统计基础课程,希望在大家走向成功的商业分析师/数据科学家/人生赢家的路上,给大家助一臂之力! 统计学到底研究些什么? 想要知道统计学到底研究什么,不如让我们先从身边的问题开始思考。 抛硬币问题 抛硬币问题通常是入门概率统计的第一题。大家可以思考一下下列问题,由简入难,测试一下自己的直觉以及科学思维水平。 1. 如果将一硬币随机抛落三次,其中有两次正面朝上的概率是多少? 2. 平均需要抛掷多少次硬币,才会首次出现连续的两个正面? 3. 连续抛硬币,直到第一次出现连续两次正面为止,恰好抛了N次的概率是多少? 4. 一堆硬币,每天都随便捡一枚抛,如果抛到正面,就把它翻过来;如果抛到反面,就再抛一下,问很长很长时间以后,硬币正面和反面的比例会趋近于多少? 你也许会问,就算把抛硬币的问题研究透了,能派什么用场?其实,抛硬币只是抛砖引玉。这问题的背后是严谨的概率统计思维,如果熟练掌握,能应用在生活各种场景中。 澳门的赌场赚钱的商业模型非常之简单,不要看赌场中赌局种类众多,其背后都是靠概率优势保证在大样本(赌局)的情况下有盈利的绝对优势。 投资决策问题 《美国新闻与世界报道》期刊曾经有过一次关于股票基金经理绩效的报道。文中说到,在某次测评900位基金经理所管理的股票基金回报率时发现,只有14位基金经理在过去的6年中连续每年都能跑赢S&P500指数的回报率。 假设每位基金经理设计的复杂交易策略能赢过S&P500指数的概率只不过是和扔硬币拿到正面一样的概率,也就是说50%的概率可以跑赢,并且每一年的绩效都各自独立。那么一个基金经理能连续6年跑赢S&P500指数的概率是多少? 基于这个概率,这900位基金经理中有多少位能够连续6年跑赢S&P500指数? 基于以上计算,你是否会考虑投资股票基金? 如果说刚才抛硬币的问题不能让你很快地联想到实际作用,那么这道投资决策问题想必可以吸引到你的兴趣了。在面临投资选择的时候,如果只是通过道听途说或是凭一己之直觉来操作,很容易会失手。学会概率统计思维,可以帮助你在做重要决策的时候用事实来判断,并且帮助你始终站在概率最优侧,增加成功机率。 概率、统计,与概率统计思维 概率:是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。其实质是客观论证,而非主观验证。 统计学:是指研究如何搜集、整理和分析统计资料的理论与方法。统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。 统计概率思维:即运用概率和统计学知识把不确定的预期根据数学知识进行量化,用数值表示某种可能性的大小,再根据具体量化值大小做出最优的选择和判断。 概率统计知识来源于生活,同时也必将指导生活实践。就好比哲学,每个行业处于金字塔顶端的人才都在运用哲学思维打破自己的认知瓶颈,开拓新的思维;概率统计知识也同样如此,学习相关知识是为了建立概率统计思维,指导我们具体的生活。 学了统计学能做什么? 为成为商业分析师/数据科学家铺路 统计学是成为商业分析师/数据科学家的基础。一千个人的心里有一千个哈姆雷特,一千个人诠释数据也会有一千种方式。但其背后支持这些数据科学性的规则确是普世的——这就是统计学。 如果你已经是一个商业分析师,再有了概率统计基础,就能成为一个特别优秀的商业分析师。 如果你还不是商业分析师,那学了概率统计,你会有更大的机会成为一个合格的商业分析师。 概率统计思维助力人生决策 外汇期权交易员升级成为哲学家的Nassim Taleb所著的《Fooled By Randomness》一书中提到,大多数所谓成功者实际上只是随机性运气的结果而其中很多人还没有意识到这一点,我们想要做的是成为一个清醒的、能够决定自己命运的成功者。 天赋秉异和出身位置,我们无法改变。但“随机的运气”属于后天可改变因素。看到这里,我们会明白,选择比努力更重要,而选择需要概率知识。因为多数人在面临选择甚至是人生的重大选择的时候,靠的是感觉而不是理性的思考和分析,可事实证明靠“感觉”的东西常常不准。因为靠感觉你依托的更多是以往的思维惯性。 发现并拥有了概率统计思维这个超级武器,你就拥有了人生更高的胜率。 课程介绍 本课程由6年以上工作经验的数据专家亲力打造,通过一天的强化课程带你入门概率统计,掌握统计学基础理论知识,并通过案例分析来一步一步引导你形成一套行之有效的概率统计思维,培养独立完成一个统计学项目的基本能力。 你能获得什么? 学员完成该课程的授课部分以及小组毕业项目之后,将学会用统计术语描述数据和不确定性,具有独立进行数据统计、概率计算、以及预测模型建模和调整参数的能力,能够了解统计在商业中的应用,并掌握如何用数据去验证直觉,做出更有效的商业决策。 适合人群 北京 | 分析师必备的Excel案例分析决策课 | 5月18日(或Excel达到此课程毕业水平) 对数据分析及概率统计思维感兴趣的人群 希望向数据科学以及商业分析等更高薪资岗位转型的人群 希望打下扎实的概率统计基础,并打算深入学习Tableau、Python、R等数据可视化分析工具及数据科学分析编程语言的用户 (无需编程基础,即学即用) 课程安排 8小时授课+录播提供+2周在线问答+毕业项目指导+结业证书 课程大纲 一、统计学基础 1. 认知偏差与统计学的重要性:了解一些常见的认知偏差,例如幸存者偏差、锚定效应、损失趋避、框架效应等,以及认知偏差为何会影响商业决策,概率统计如何帮助你避免掉入直觉的陷阱。 2. 数据呈现: 了解平均数(mean)、中位数(median)、众数(mode) 如何用区间(range)、箱线图 (box plot)等分析数据的对称性及分布的分散程度等信息 了解方差(variance)及标准差(standard deviation)在统计中的重要性及实用性 熟悉如何用直方图等统计图表描述数据分布 二、概率统计 熟悉各类概率分布模型及其应用场景,通过实际案例分析掌握以下概率分布模型: 1. 二项分布:在心理与教育研究中有重要地位,主要用于解决含有机遇性质的问题。 2. 泊松分布:适合于描述单位时间(或空间)内随机事件发生的次数,在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位。 3. 正态分布:概率论中最重要的分布。正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。 三、假设检验 1. 了解什么是假设检验、原假设(Null Hypothesis)和备择假设(Alternative Hypothesis) 2. 了解什么是第一类错误(TypeI error)、第二类错误(TypeII error),以及在各种实际场景下两者间的取舍 3. 在进行假设检验时需要注意样本大小(Sample Size)以及隐含假设(Implicit Assumptions)对计算过程的影响 四、线性回归分析模型 1. 相关性和线性回归: 相关关系(Correlation)不蕴含因果关系(Causation) 了解构成数据的线性及非线性关系和其对应的回归模型 从最简单的线性模型开始:含有两个变量的线性模型 如何用Excel构建线性回归模型 2. 模型参数: 如何判断一个线性回归模型的拟合度是否够好——R square, Adjusted R square 如何判断变量是否对模型的结果有统计意义上重要的影响——P-value, T-test, Z-score 置信区间(Confidence Interval)及其在实际应用中的重要性 毕业项目 在课程结束2周内,独立完成一个商业案例分析的毕业项目——《Jack or Linda》是一个非常有意思的商业决策案例分析,动用大家学到的统计学知识,来做出一个关乎团队未来发展方向相关的商业决策。内容会涵盖所有课程内的知识点和用Excel建线性回归模型的部分。 课程研发团队 Qixin DataGirls联合创始人,7年数据分析及咨询经验,为世界五百强企业提供大数据营销解决方案。拥有数据挖掘硕士学位及INSEAD(欧洲工商管理学院)MBA学位 刘顺祥 统计学硕士,9年统计领域经验。目前担任头部互联网公司的高级数据分析师。曾就职于唯品会电商平台和云像数字咨询,擅长数据库、Python、R语言、Tableau等工具的操作,对数据分析与数据挖掘领域有丰富的实战经验。出版作品《从零开始学Python数据分析与挖掘》。