农夫百科

统计学本词条为多义词,与多类属交叉,分属或被包含于:农夫百科农夫文稿农夫物库

添加义项

本词条是多义词收起

———本词条由农夫云物库编制中心规范发布

统计学

发展过程

起源

统计学的英文statistics最早源于现代拉丁文Statisticum Collegium(国会)、意大利文Statista(国民或政治家)以及德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。十九世纪,统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 

统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。

城邦政情

“城邦政情”(Matters of state)阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十余种纪要,其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算术”这个名词所替代,并且很快被演化为“统计学”(Statistics)。但统计学依然保留了城邦(state)这个词根。

<a target='_blank' href='/baike/index/id/57.html'>统计</a>学.jpg

政治算术

与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

“政治算术”的特点是统计方法数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法

1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。

威廉·配第用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配第的《政治算术》被后来的学者评价为近代统计学的来源,威廉·配第本人也被评价为近代统计学之父。

配第在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字。因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法

(2)通过运用数字的理论性推理来进行推算的方法

(3)以平均数为基础进行推算的方法”;

第三类是为了进行理论性推理而采用的例示性的数字。配第把这种运用数字和符号进行的推理称之为“代数的算法”。从配第使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。 

统计分析科学

在“政治算术”阶段出现的统计数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。当时的“统计分析科学”(Science of statistical analysis)课程的内容仍然是分析研究社会经济问题。

统计分析科学”课程的出现是现代统计发展阶段的开端。1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文。这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的方法,开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.

现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

<a target='_blank' href='/baike/index/id/57.html'>统计</a>学1.jpg

主要术语

统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。

描述统计(descriptive statistics):研究数据收集、处理和描述的统计方法

推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计方法

变量(variable):每次观察会得到不同结果的某种特征。

分类变量(categorical variable):观测结果表现为某种类别的变量。

顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。

数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。

均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法

中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。

众数(mode):众数也就是数据集中出现频率最多的数字。

相关观念

为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料收集所组成的母体我们称它叫时间序列。

为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。

如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和收集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计

要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

统计方法

测量的尺度

统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目、顺序、等距、等比)在统计过程中具有不等的实用性 。

等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的;

等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量);

顺序尺度( Ordinal measurements)的意义并非表现在其值而是在其顺序之上;

名目尺度(Nominal measurements)的测量值则不具量的意义。

统计技术

以下列出一些有名的统计检定方法以及可供验证实验数据的程序

Fisher最小显著差异法(Fisher's Least Significant Difference test )

学生t检验(Student's t-test)

曼-惠特尼 U 检定(Mann-Whitney U)

回归分析(regression analysis)

相关性(correlation)

皮尔森积矩相关系数(Pearson product-moment correlation coefficient)

史匹曼等级相关系数(Spearman's rank correlation coefficient )

卡方分布(chi-square )

创立时期

德国的斯勒兹曾说过:“统计是动态的历史历史是静态的统计”。可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

统计学的萌芽产生在欧洲,17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

国势学派

统计学的萌芽最初在当时欧洲经济发展较快的意大利孕育良久,但最终却在17世纪的德国首先破土成芽,国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。

德国经济学家称阿亨瓦尔为“统计学之父”, 但英国学者有争议, 声称阿亨瓦尔忽略了威廉·配第(William Petty, 1623-1687)的和其他学者的主张。威廉·配第的《政治算术》(1676)中用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征,因此威廉·配第是近代统计学之父。

政治算术学派

政治算术学派产生于17世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人”。

政治算术学派的另一个代表人物是约翰·格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年间伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

发展时期

18世纪末至19世纪末是统计学的发展时期。在这一时期,各种学派的学术观点已经形成,并且形成了两个主要学派,即数理统计学派和社会统计学派。

数理统计学派

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

社会统计学派

产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。

迅速发展

现代

20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。

1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。当今西方国家所指的科学统计方法,主要就是指推断统计来说的。

2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。

3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。

当代现状

信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。

计算技术和一系列新技术、新方法统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。

统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分”。甚至有的科学家还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。

统计学的统一

社会统计学与数理统计学的理论统一

据权威统计学史记载,从17世纪开始就有了“政治算术”、“国势学”,即初级的社会统计学,起源于英国和德国。几乎同时在意大利出现了“赌博数学”,即初级的概率论。直到19世纪,由于概率论出现了大数法则和误差理论,才形成了初级的数理统计学。也就是说,社会统计学的形成早于数理统计学两个世纪。由于社会统计学广泛地应用于经济和政治,所以得到了各国历届政府的极大重视,并得到系统的发展。而数理统计学在20世纪40年代以后,由于概率论的发展,而得到飞速发展。经过近400年的变迁,世界上已形成社会统计学与数理统计学两大体系。两体系争论不休,难分伯仲。统计学家王见定教授经过30年的学习与研究,发现了社会统计学与数理统计学的联系和区别。它们的关系与著名的牛顿力学与相对论的关系非常相似。相对论力学在接近光速时使用,而大多数情况是远离光速的,此时使用牛顿力学既准确又方便。如果硬套相对论力学,则是杀鸡用宰牛刀,费力不讨好。社会统计学在描写变量时使用;数理统计学在描写随机变量时使用。

我们知道变量与随机变量是既有联系又有区别的。当变量取值的概率不是1时,变量就变成了随机变量;当随机变量取值 的概率为1时,随机变量就变成了变量。

变量与随机变量的联系与区别搞清楚了,社会统计学与数理统计学的关系就搞清楚了。以后,在描述变量时,大胆地使用社会统计学;在描述随机变量时,就用数理统计学。如果在描述变量时非用数理统计学,那就是杀鸡用了宰牛刀。近70年,由于数理统计学的飞速发展,大有“吃掉”社会统计学的势头,尤其是以美国为代表的发达国家,几乎认为统计学就是数理统计学。实际上,这是一个极大的误区。统计学家王见定教授的研究已经说明了数理统计学永远“吃不掉”社会统计学,今后的日子,将是社会统计学与数理统计学共存与互补。社会统计学与数理统计学的争论可以结束了。

结束语:“社会统计学与数理统计学的统一”对近四百年历史统计学进行了科学的疏理,规范了整个统计学的发展,结束了一百年来社会统计学与数理统计学之间的争论。由于经济是通过统计学进行计量和分析的,所以社会统计学与数理统计学的统一,必将从整体上提高经济学的分析水平。

“社会统计学与数理统计学的理论统一”的重大意义

统计学家王见定教授指出:社会统计学描述的是变量,数理统计学描述的是随机变量,而变量和随机变量是两个既有区别又有联系,且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现,我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出,而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出,两个概念的提出相差3个世纪。截至到王见定教授,世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展;而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大,从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相应的转化的意义称为巨大、也就不视为过。

下面我们回到“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量,数理统计学描述的是随机变量,这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学的混战局面,使它们回到正确的轨道上来。

由于变量不断地出现且永远地继续下去,所以社会统计学不仅不会消亡,而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是,对随机变量的研究一般来说比对变量的研究复杂的多,而且直到今天数理统计的研究尚处在较低的水平,且使用起来比较复杂;再从长远的研究来看,对随机变量的研究最终会逐步转化为对变量的研究,这与我们通常研究复杂问题研究转化为若干简单问题的研究的道理是一样的。既然社会统计学描述的是变量,而变量描述的范围是极其宽广的,绝非某些数理统计学者所云:社会统计学只作简单的加、减、乘、除。从理论上讲,社会统计学应该复盖除了数理统计学之外的绝大多数数学学科的运作。所以统计学家王见定教授提出的“社会统计学与数理统计学统一”理论,从根本上纠正了统计学界长期存在的低估社会统计学的错误学说,并从理论上和应用上论证了社会统计学的广阔前景。

英文版《社会统计学与数理统计学的统一》一书于2010年6月由中国经济出版社出版,并陆续向国外发行。 该书对有近四百年历史统计学进行了科学的梳理,规范了整个统计学的发展,结束了一百多年来社会统计学与数理统计学之间的争论。[6]注:该书著者王见定教授是国际资深统计学会会员,国际著名数学家。 The book "The Unity of [7]Social Statistics and Mathematical Statistics" was published by China Economic Publishing House in June 2010 and the book will be put on sale throughout the world.编号:342705 出版社:中国经济出版社。 

检验应用

统计学的中心问题就是如何根据样本去探求有关总体的真实情况。因此,如何从一个总体中抽取一些元素组成样本,什么样的样本最能代表总体,这直接影响着统计的准确性。如果抽取元素的方法是使总体中的元素成分不改,所观测到的数值是互相独立的随机变量,并有着和总体一样的分布,这样的样本是一个简单的随机样本,它是总体的最好代表,而取得简单随机样本的过程叫做简单随机取样。

简单随机取样就是重复进行同一随机试验,也就是指每次试验都在同一组条件下进行,因而每次试验得到什么结果,其可能程度都是固定不变的。对于有限总体,简单随机抽样意味着每次抽出一个元素后,放还再抽,若不放还,总体的成分将有所改变,那么再抽时,出现各种结果的可能程度就相对地改变了。至于无限总体则没有区分“放回”或“不放回”的必要。

除以上述原则外,另一方面,获

参考文献

文章来源:百度百科及农夫百科

原始创建:佚名

词条概况

版本编辑:5次

最近更新:2018-03-31

历史浏览:1048次

最新编辑:佚名

原始创建:佚名

词条标签:文化术语 , 学科 , 书籍

阅读是一种智慧,分享无比快乐!

感谢阅读与分享本词条,每一词条都是您赢得财富和建造知识大厦的一块砖,一块块砖的堆砌必将成就卓凡不俗的您。欢迎收藏并拥有本文,请注册农夫大学网成为VIP会员,免费分享与下载,另有更多惊喜等着您。

做农夫大学网版主,参与相关活动,尊享农夫国积分计划福利,分享更多快乐与幸福,还有众多幸运实惠不恰从天而降被砸中机会,快来参加哦!

各类实用文档、海量文稿、上万册电子书,在线阅读与下载

成为农夫大学网VIP会员免费阅读与下载

云物库 - 统计学

所需农夫币:1.00元RMB/NFB

阅读是一种智慧,分享无比快乐!

各类实用文档、海量文稿、上万册电子书,在线阅读与下载

关于我们广告服务联系我们

Copyright © 2015-2018 农夫国 All Rights Reserved.