统计学课程教学中基本“统计术语”的教学设计
来源:用户上传
作者:
【摘要】统计术语是统计学语言的基础,正确理解基本的统计术语对学生学好统计课程来说非常重要。本文将从统计术语教学的角度,对三组统计术语的教学进行设计,希望有助于统计术语的教与学。在统计学课程中,基本的统计术语一般包括个体、总体和样本;变量和数据;参数和统计量等三组共7个统计学术语。这些术语构成了统计学这门学科的语言,将伴随统计学教学与学习的始终。
【关键词】统计学 统计术语 教学设计
一、个体、总体和样本
在统计学中,个体是指搜集数据的单个对象,可以是一个人、一个项目、一家企业、一个地区,或者是一个国家。总体是在研究范围之内的所有相关的个体组成。一个总体里面个体的数量,叫做总体容量,通常用大写的N表示。总体容量有多大,取决于你的研究范围。比如,你的研究范围只局限在一所高校里的大学生,那么这所高校的所有大学生数量就是总体容量,如果你的研究范围是一座城市里所有高校的在校大学生,那么总体的容量就会大很多。样本来自于总体,是由总体中的部分个体所组成。组成样本的个体一般都是从总体中随机抽样产生,这样的样本叫做随机样本,能够在一定程度上代表总体。样本是我们进行调查和收集数据的范围。在一个样本中,个体的数量叫做样本容量,通常用小写的n表示。样本容量一般比总体容量小很多(图1)。
我们可以再来看一幅图,理解个体、总体和样本的关系。在图中,每个人就是一个个体。正方形方框代表研究的范围,在方框内全部的个体构成了总体,总共有16人,即总体容量N=14。从总体中,我们随机抽取了4个人,并用圆圈包围,那么这4个人就组成了一个随机样本,样本容量n=4。
再举一个更加具体的例子来说明。例如要对某高校所有10000名学生每月生活费数量进行研究,那么该校的每一名学生就是一个个体。全校所有在校生构成了总体,总体容量N为10000。如果对其中的100名学生进行调查,收集他们每月生活费的数据,那么这100名学生就组成了一个样本,样本容量n为100。
二、变量和数据
第二组统计学术语,变量和数据。变量是指我们对个体所感兴趣的某些特征。比如为了了解青少年的身体发育情况,我们对个体的年龄、性别、身高、体重等特征就比较感兴趣。这里的年龄、性别、身高和体重就是变量。再比如我们想了解某个地区中小企业的经营现状,就会对中小企业的产值、销售额、利润、员工数量等特征感兴趣,所有这些特征就是一个个变量。数据是与变量相对应的,是变量的取值。变量的所有取值组成了一个数据集。比如我们对100名青少年的年龄、性别、身高和体重进行调查,会得到有关年龄、性别、身高和体重的各100个数据,共400个数据,这些数据共同组成了一个数据集。数据集通常存储在电子表格软件中,如存放在EXCEL工作表中,这样可以方便地对数据进行统计分析。在EXCEL工作表格中,通常每一列代表一个变量,每一行代表某个个体的观测值。如在 “青少年发育特征数据集”的EXCEL工作表(表1)中,除第1列是个体编号之外,其他每列分别代表一个变量,分别是年龄、性别、身高和体重;除了第1行是变量名称之外,从第2行开始,每一行代表一个个体相应变量的数据,如编号为1的个体,年龄是13周岁,性别为男,身高为160厘米,体重为50千克等。
三、参数和统计量
在统计学中,参数是与总体相关的,又叫总体参数,它是对总体特征的概括性度量,其中总体特征是指我们关心的某个变量,因此,总体参数也就是有关总体某个变量的概括性度量。例如在我们研究范围内有1万名大学生,这1万名大学生构成了一个总体,我们对这些大学生的每月生活费是多少这一特征感兴趣,那么每月生活费就是研究中所涉及的一个变量。由于1万名大学生就有1万个数据,因此,我们需要用一些度量来概括这些数据的特征。比如用平均数,来了解所有学生每月生活费的总体情况,也可以用标准差,来了解所有学生之间每月生活费差异的大小。这里的平均数和标准差都是对某个变量所有数据的概括性度量,并且是基于总体的数据计算得出的,我们把它们叫做总体均值和总体标准差。它们都是属于总体参数。除了总体均值和总体标准差之外,总体方差和總体比率也是总体参数。因为计算总体参数需要总体中所有个体的数据,而获得全部个体的数据通常很困难,所以我们很难通过直接计算得到相关参数的值。因此,参数的取值一般是未知的,但参数的取值代表总体的某一重要信息,了解总体的信息是我们研究的目的所在,所以我们通常使用统计推断的方法,来获得未知参数的取值。
统计量是与样本相关的,又叫样本统计量,它是样本特征的概括性度量,是用来推断相应的总体参数的。比如在1万名大学生组成的总体中,我们随机抽取100名学生组成一个随机样本,样本容量为100。用这100名学生的每月生活费数据计算出来的平均数和标准差,分别叫做样本均值和样本标准差。它们都属于样本统计量。除了样本均值和样本标准差之外,样本方差和样本比率也是样本统计量。一般来说,样本容量远远小于总体容量,对样本中的个体进行调查和收集数据比较容易,因此可以直接计算得出样本统计量的值。但是要注意,我们研究问题的目的是要了解总体参数的信息,而不是样本统计量的信息。但样本统计量可以作为一个有效的工具或手段,用来推断相应总体参数的取值,从而达到我们的研究目的(图3)。
四、统计学基本术语教学的一个例子
根据统计学基本术语之间的逻辑关系(图4),以及研究的背景——研究本市四所高校共计45000名在校大学生每天玩手机游戏的时长问题,研究者对随机抽取的200名学生进行问卷调查。调查发现,这些学生平均每天玩手机游戏的时长是30分钟,要求学生回答在这项研究中,个体、总体、样本、变量、数据、参数和统计量等术语所指的具体内容。
参考文献:
[1]安德森.商务与经济统计[M].北京:机械工业出版社, 2018.
[2]莱文.商务统计学[M].北京:中国人民大学出版社,2017.
[3]林德.商务与经济统计方法[M].北京:机械工业出版社,2015.
转载注明来源:https://www.xzbu.com/2/view-15290955.htm