简单理解一下什么是统计思维。
我国当代著名经济学家、教育家马寅初曾说:“学者不能没有统计而学习,实业家不能没有统计而实践,政治家不能没有统计而执政。”
统计是了解真实存在的一种方式。大到一个国家,小到一个公司甚至个人,都会用到。谁能获得准确的统计信息,谁就能掌握真实的当下,为后续决策提供依据。然而,学生人数的统计并不容易。各种数字、公式、函数、曲线对大多数人来说太难了,不知道学习统计学能得到什么帮助。
日本人西野馨一直想写一本通俗易懂的统计学书籍,帮助普通人理解统计学,掌握基本的统计工具,培养统计思维。西野树毕业于东京大学生物统计学专业,主要从事xxx,在统计学的实际应用方面有着丰富的经验。他的丰富经验集中在数字统计和统计思维方面。前者更专业更深入,后者更通俗更实用。
统计思维是在获取数据、从数据中提取信息、论证结论可靠性的过程中的一种思维方式,对提高人类认知有很大作用。为了使读者理解统计思维,本书主要分为两部分,一部分是书的主体,各种统计方法、概念和实际案例的关系,另一部分是“数学附录”中各种统计概念和公式的数学解释。
书中主要讲了几个数学概念:平均值、标准差、假设检验、回归分析等等。前面还好,但是后面比国内高中数学的知识要难。对于一些大学不学高等数学的人来说,读起来还是挺费劲的。
在《实用阅读指南》中,Toshiyuki Dayan说,一本书里只有20%左右的内容对我们真正有价值。如果你的数学基础不好,那么书上的思维方式可能相对更有用。
均值和中值。统计学上,均值和中值是描述几种趋势的概念。但是,平均值取决于分布,当数据呈正态分布时,它往往是最有效的。中位数更多的是一个非参数概念。中位数是将数据从小到大排列后,可以将数据分成两半的数字。如果分布不是近似正交的,那么中位数比平均数更有效。所以,在正确的场景下,正确运用这些概念来解释生活中的事情更为重要。当数据服从正态分布时,平均值等于中位数。
经济中存在“二八法则”,全球80%的财富掌握在20%的人手中。如果只计算个人平均收入,很多人的收入都是“平均偏高”。如果我们计算一下此时的中位数,将个人收入与中位数进行比较,就可以大致知道我们的收入在全国处于什么水平。这个技巧也可以用来计算哪家公司在求职时有望获得更高的收入。如果A公司平均工资8000,但中位数只有3000,B公司平均工资6000,但中位数4000,你怎么选择?
统计推断有局限性。在做决定的时候,大多数人都是根据自己的相关经验,也就是样本进行推断。人们常说,每个人都有自己的局限性,换句话说,人们不可能理解事物的总体。那么在用样本推断的时候,一定要选择合适的样本,不能以偏概全。
1936的美国大选,文学文摘杂志推测阿尔弗雷德?兰登将获得531中的370张选举人票。从这个结果来看,完全没有击败罗斯福的压力。本次调查,文献文摘共发放问卷10万份,回收问卷230万份。文学摘要的做法是对的。大样本量肯定会提高估计的准确性,没什么不好。但结果是错误的。罗斯福当选了。为什么?因为在《文学文摘》杂志的读者中,* * *和党员的比例远远高于美国总人口中* * *和党派支持者的比例。换句话说,这个样本根本无法扩展到全美。那么相应的结论肯定是站不住脚的。
在统计学允许的误差下保证一定的概率。在统计学中,随机无处不在。它允许错误,没有错误就让人怀疑有假。统计学也会保证一个问题,但是它的保证是基于概率形式的。而且保证概率不是100%,有误差。统计学中,p值为5%,这本身没有太多的数学依据,只是沿袭了数学家费希尔的习惯,认为用5%来判断p值比较方便。当标准差se小于p值时,某个推论或结果是可信的。
统计学有固定的规律,但在实际应用中,未必能完全遵守。有时条件闲置,不完全遵循双侧5%的检查标准。比如在医疗领域,有一些手术成功率很低。只要他们一辈子和病人达成协议,病人可能还是会选择尝试。在业务推广中,也有可能做出一些P值较大的高风险决策,决策者可能会选择碰运气。这个时候就要做好冒险的准备。
陈喜儒先生在《数理统计简史》的序言中说:统计学不仅仅是一种方法或技术,还包含世界观的元素——它是一种看待世界万物的方法。这就是我们常说的从统计学角度看事物的样子。但是统计思想也有一个发展过程。因此,统计思想(或观点)的培养不仅需要学习一些具体的知识,而且能够从发展的角度把这些知识有机地、清晰地联系起来,获得历史重要性的感觉。