统计学(信息与数理统计)

2024-11-22 12:15:14
推荐回答(3个)
回答1:

统计学的就业还是很广的,不仅仅是在金融行业,在任何行业都需要统计人才。比如,在工程方面,医学方面,投资风险管理……很多的,如果能考精算师,当然最好,如果不行,因为统计有深厚的数学基础,在金融的高端领域,往往比学经济的更受欢迎

为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料搜集所组成的母体我们称它叫时间序列。
为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。
描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。
推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及资料采矿。
相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。
如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和搜集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。
要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。
任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。
即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。
第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。
第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。
第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。
统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。

一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。
统计学的分支学科有:
统计学史
理论统计学
统计调查分析理论
统计核算理论
统计监督理论
统计预测理论
统计逻辑学
统计法学
描述统计学
推断统计学
经济统计学
宏观经济统计学
微观经济统计学
管理统计学
科学技术统计学
农村经济调查
社会统计学
教育统计学
文化与体育统计学
卫生统计学
司法统计学
社会福利与社会保障统计学
生活质量统计学
人口统计学
环境与生态统计学
自然资源统计学
环境统计学
生态平衡统计学
国际统计学
国际标准分类统计学
国际核算体系与方法论体系
国际比较统计学
其他
生物统计学
商务统计学
工程统计学
心理统计学
化学统计学
档案统计学
社会经济统计学
水文统计学
数理统计学
统计语言学
统计物理学
化学统计学
延伸学科
有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:
农业科学
生物统计
商用统计
资料采矿(应用统计学以及图形从资料中获取知识)
经济统计学
电机统计
统计物理学
人口统计
心理统计学
教育统计学
社会统计(包括所有的社会科学)
文献统计分析
化学与程序分析(所有有关化学的资料分析与化工科学)
运动统计学,特别是棒球以及曲棍球
统计对于商业以及工业是一个基本的关键。他被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。在这些领域统计扮演了一个重要的角色。

回答2:

  为了纪念千禧年的来临,美国统计学会月刊(Journal of the American Statistical Association)刊登了一个由大约50篇短文组成的连载,每篇短文都着力概括统计学中的某一领域在即将过去的一个世纪所取得的进展。这一计划的初衷在于将统计学中一些最优秀的成果做一总结,并且突出未来研究中的具有潜力的领域。我写作了有关统计学在社会学中应用的那篇论文(Raftery,2000)。其他几篇相关的论文或许会对那些对社会学方法论感兴趣的读者有帮助,这些文章涵盖了列联表(contingency table),对数线性模型(Fienberg,2000),因果推理在社会科学中的应用(Sobel,2000),人口学(Xie,2000),政治学方法论(Beck,2000),计量心理学(Browne,2000),经验方法在法律科学中的应用(Eisenberg,2000)等诸多领域。

  在我这篇论文的初稿问世后,许多同事都对我的文章发表了评论,其中有许多评论正确地指出了我在文章中不慎遗漏的该领域的一些重要发展。然而,由于美国统计学会月刊给我的篇幅有限,我不可能将这些遗漏的部分全部补充进来。幸运的是,社会学方法论(Sociological Methodology)编辑Michael Sobel和Mark Becker请我撰写一篇在此基础上有所扩展的专题论文,或许这篇论文能够为这一不断发展的研究领域提供一个更为合适的概括。

  社会学起源于十九世纪中期,孔德(他首先引进了“社会学”一词),马克思,韦伯和涂尔干围绕着工业革命后新出现的社会,写下了一系列具有奠基意义的著作。社会学从一开始就使用了定量的研究方法。孔德,这位学科的奠基人,清晰的意识到这门学科应该以统计数据为基础。而涂尔干的《自杀论》更是成为了广泛运用统计数据的典范。

  然而,在二战以前,可供研究的数据都显得支离破碎,统计方法也比较简单,仅仅停留在描述性统计的层次上。经过仔细的考证Camic和Wilson(1994)认为,Franklin H. Giddings是美国定量社会学之父。Giddings于1894年在哥伦比亚获得社会学教授职务,1931年逝世,他将社会学界定为研究集体层面社会现象的一门学科。他认为在很大程度上社会学中的统计分析是将诸多的个体分成不同的类别,同时发现每一类别的平均特征。从现代统计学角度来看,缺乏对变化的考察是他著作的一个最为显著的特征。

  从那以后,研究用的数据变得越来越复杂,同时统计方法也在不断发展,以适应数据分析的需要。这时期的统计学方法的发展,有许多是要归因于社会学家而非统计学家的努力。Clogg(1992)以及他文章的评论者们有力的论证并且记述了这一点。这种情况部分反映了一个事实,即致力于研究社会学问题的统计学家的数量相对较少。更多的统计学家倾向于关注药物学,工程技术以及生物科学方面的问题。这或许反映了在二十世纪后半期不同学科间研究资金分布的不平衡状况。然而,最近有迹象表明这一情况正在发生变化,我将在本文的结尾论述这个问题。

  在过去的五十年中,社会学总的趋势是向更为严格、清晰的假设;更大更详细的数据集合发展;为了拟合数据,统计模型变得越来越复杂;主要社会学期刊所发表文献的统计分析水平也在不断提高。统计方法在社会学领域成功地走过了半个世纪,使得该学科研究的科学水平有了极大的提高。

  社会学中广泛的使用了各种各样的统计学方法和统计模型。在这里,我将集中考察那些由社会学家发展的,直接由社会学问题所引致的,或者首先在社会学期刊上发表的那些统计学成就。许多其它的方法,比如逻辑斯蒂回归等适用于有限数量的因变量的方法,虽然也广泛的应用于社会学研究,但是他们是首先在其他的学科中为解决其学科自身的问题而发展出来的。有鉴于此,尽管这些方法很重要,但我们在这里也仅对他们做一简要介绍。

  对于从计量经济学而不是从统计学中引入到社会学研究中的统计方法,本文省略了与其相关的讨论。这或许对从另一个角度来讨论这一问题有所帮助。计量经济学对社会学方法论产生了非常重要的影响,甚至有些人说这种影响比来自统计学本身的影响更为强大,但是在这里除了个别情况,我将不对这种重要的影响发表评论。

  为了避免引起争论,我将根据社会学中不同的统计方法所针对的数据类型,而不是根据这些方法本身对他们加以分类。我将区分出战后统计学在社会学中应用的三个不同的阶段。每一阶段的划分都是根据他们通常所适用的数据类型做出的:交互表,单位水平的统计数据,以及种种新的数据形式。就像现实中的代际一样,这三代统计方法前后层叠,而且它们之间的界限也并非十分明晰。虽然这些方法代表着不同的成熟水平,甚至关于他们的起点也并没有一个统一的界定,但是今天这些方法都依然保持着活力。

  在二战后开始的这一时期,社会学家们所使用的许多数据都是在调查和普查的基础上以交互表的形式呈现的。我在文中所要讨论的第一代统计方法就是以这种方式处理数据的。通常说来,这类交互表都只包含很少的变量,例如性别,年龄组以及职业分类。社会流动表可以称得上是这种方法中的经典之作。这一领域或许是社会学家对统计学贡献最大的地方。实际上,我们可以说是社会学家们主导了这一分支领域,他们发展出来的这些方法已经超出了社会学领域渗透到其他的学科的研究工作当中。Schuessler(1980)所作的调查在很大程度上反映了第一代方法所取得的成就。

  1960年代早期,社会学家已经不必再依赖于计数的交互表了,来自含有多个变量调查的个体层次的数据越来越容易获得。计算能力也已经发展到能够轻而易举地处理这些数据的水平。第二代的统计方法正是针对处理这类数据而发展出来的。Blau和Duncan的有广泛影响力的著作美国的职业结构(The American Occupational Structure),为这一代的统计方法披上了金色的外衣,而1969年《社会学方法论》(Sociological Methodology)以及1972年《社会学方法与研究》(Sociological Methods and Research)等发表窗口的建立,更为这一方法增光添色。Edgar Borgatta一手创立了这两份刊物,当他创立第二份刊物时,《社会学方法论》已经远不能满足日益增多的投稿和发表的需要了。这些发展标志了社会学定量研究方法的新时代的到来。

  1980年代晚期,社会学家们勾画了一个雄心勃勃的计划,就是对那些难以符合标准交互表和数据矩阵要求的数据类型进行统计分析(尽管在有些情况下,这些数据也可以被强行归入这些类别中)。这些数据包含了文本(text)或叙述(narrative),以及依赖性很强的数据,比如社会网的数据和具有空间参照特性的数据。这其中还包含了一些含有多类型变量的数据集,比如卫星图片,人种学的纪录和其他一些定量测量数据。第三代的统计方法正是为了处理诸如此类的数据而发展出来的。或许是每一个新事物的优点,迄今为止,这一代方法保持着它们的活力,包含了大量的令人激动的想法和进展,但是他们还未形成前两代统计方法所具有的成熟、完备的形式。

  我对社会学中所应用的统计学方法的分类是根据不同方法所处理的数据类型做出的,而不是以方法本身的类型为标准,但这并不意味着目前研究生课程的编排有什么问题。或许为了训练的方便和有效,社会学的主要方法倾向于按照不同的类别组织在一起,比如回归模型(regression model),有限因变量模型(limited dependent variable model),对数线性模型(log-linear model),结构方程模型(structural equation model),事件史分析等等。然而,我发现要分辨统计学方法以往的发展趋势以及构想未来的发展,从最初引致这些方法产生的数据的类型入手或许是一条捷径。

  过去的五十年间,我们已经走过了一条漫长的道路。今天,许多社会学研究都是以巨大的高质量的调查样本为基础进行再分析的。他们较多的利用在公共基金资助下收集的或者是对研究者公开的数据库,这些数据库通常都有着5000到20000,甚至更大的样本规模。这为复证结果提供了一条简便的道路,同时也有助于社会学建立起可以与自然科学或医药科学相媲美甚至高于这些学科的科学标准。或许受以上因素的影响,社会统计学在最近成为了一个迅速扩展的研究领域,许多重要的研究机构也都在最近几年开始了他们对这一领域的探索。

  统计学方法在社会学领域的应用已经走过了半个世纪的成功历程,发展出了交互表模型以及被广泛使用的分析个体层次数据集的方法。这些都对社会学获得今天这样的科学水平做出了巨大的贡献。这一充满新型数据和新挑战的领域对进一步开展统计研究来说已经成熟。

  未来的方向在哪里?正如我在以上三代统计学方法的划分中所暗示的那样,我感到这一推动了第三代统计方法产生的数据类型所带来的问题,在不久后可能会激发出社会学方法论领域一些最激动人心的进展。但是还会有许多与当前技术发展过程中产生的数据类型联系在一起的新方法产生。比如,为调查者提供计算机并请他们在线回答问题,也许会成为以后一个时期一种新的调查方式。这种方式有可能产生新的方法论问题,比如在不等的时间间隔中进行重复测量的问题以及数据缺失(或者数据根本没有使用价值)等问题。总之,网络会产生大量的新形式的社会科学数据,发展一套从这些数据中得出有效结论的方法将注定是未来主要挑战的来源。

  我要预言并且倡导的是,未来的发展将是多学科化的,它将跨越社会科学领域并且超越该领域。这一情况在二十世纪并不多见,在这一时期一个接一个社会科学领域在定量研究的复杂程度方面都获得了巨大的飞跃,但是这些成就都是在这些领域之间处于相对孤立的情况下取得的。心理学或许是第一个完成这一飞跃的领域,Spearman和Thurstone在二十世纪早期的著作为此做出巨大贡献,接下来Haavelmo,Tinbergen和Cowles委员会和其他一些人,在1930和1940年代发展出计量经济学,从而使经济学完成了这一过程。在此之后,1960年代随着Blalock,Duncan,Goodman和其他一些我们已经提到的社会学家相关著作的问世,社会学开始了自己的行动。1990年代,Gary King,Larry Bartels和其他一些人开始将统计方法应用到政治学研究领域,并且在此过程中发展出了一些新的方法。

  这些学科的发展历程都比较相似。在定量化的转变中都倾向于关注或在一定的条件下创造当时最为先进的统计模型,并产生了一批具有很强流动性的方法论专家。而在最早进行这种转变的心理学和经济学领域的方法论研究者已经相互联合,形成他们自己的亚学科计量心理学和计量经济学。后来定量方法的发展在这些学科中都发展的比较缓慢,但是他们都与当时造成定量研究跨时代转变方法联系在一起。社会学也没有摆脱这一历程:在这一领域,定量研究工作仍然被1960,1970年代首先发展起来的方法所主导着(含有潜在变量的结构方程模型,一般线性模型,通过Cox模型进行的事件史分析),而且仍然关注着这些方法的发展和改进。就像我已经讨论过的那样,这样做有很多好的理由,而且这样也会对整个学科产生非常正面的影响。但是,在当1990年代的统计模型,尤其是通过马尔可夫链之蒙特卡罗方法进行的Bayes分析已经被年轻的政治学家所采用,并且贯穿了他们激动人心的、激烈的定量化革命时,这一方法对社会学研究领域的渗透却还显得十分缓慢。

  当前,我们处在一个比几十年前更加泛学科化的学术世界,对所有的社会科学学科而言现在是突破学科界限,共同将他们的定量方法推向前进的宝贵机会。在过去的几年中,一些主要的学术机构都建立了他们自己的跨学科的研究中心,并投入资源对社会科学的定量方法进行研究。华盛顿大学建立了统计学和社会科学研究中心。哈佛大学的社会科学基础研究中心加强了社会统计学的研究。加州大学圣巴巴拉分校建立了空间整合社会科学研究中心(Center for Spatially Integrated Social Sciences),并将研究焦点访在空间统计学上。加州洛杉矶分校从社会统计学中产生的年轻的统计学系仍然与几个社会科学领域保持着跨学科的紧密联系。哥伦比亚大学设立了从社会科学和统计学中衍生出来的又一个跨学科专业——定量社会科学硕士培养计划。密歇根大学的定量方法计划,在统计学系和一些社会科学系之间建立起联合研究生培养协议。而在目前这些努力中最为成功的或许要数社会统计学系在南安普敦大学的建立。

回答3:

还算好玩吧,跟数学关系较密切,经济方面的工作都能做,像统计方面,会计方面,证券行业,银行等都可以的。