第十章数据的统计描述和分析

发布 2019-07-07 20:10:57 阅读 7668

数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。

数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在统计工作中经常使用。

面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。

我们将用matlab的统计工具箱(statistics toolbox)来实现数据的统计描述和分析。

1 统计的基本概念。

1.1 总体和样本。

总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及废品分类),学校全体学生的身高。

总体中的每一个基本单位称为个体,个体的特征用一个变量(如)来表示,如一件产品是合格品记,是废品记;一个身高170(cm)的学生记。

从总体中随机产生的若干个个体的集合称为样本,或子样,如件产品,100名学生的身高,或者一根轴直径的10次测量。实际上这就是从总体中随机取得的一批数据,不妨记作,称为样本容量。

简单地说,统计的任务是由样本推断总体。

1.2 频数表和直方图。

一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。

将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间**现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。

若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助matlab这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。

例1 学生的身高和体重。

学校随机抽取100名学生,测量他们的身高和体重,所得数据如表。

) 数据输入。

数据输入通常有两种方法,一种是在交互环境中直接输入,如果在统计中数据量比较大,这样作不太方便;另一种办法是先把数据写入一个纯文本数据文件中,格式如例1的**,有20行、10列,数据列之间用空格键或tab键分割,该数据文件存放在matlab\work子目录下,在matlab中用load命令读入数据,具体作法是:

load 这样在内存中建立了一个变量data,它是一个包含有个数据的矩阵。

为了得到我们需要的100个身高和体重各为一列的矩阵,应做如下的改变:

high=data(:,1:2:9);high=high(:)

weight=data(:,2:2:10);weight=weight(:)

)作频数表及直方图。

用hist命令实现,其用法是:

n,x] =hist(y,m)

数组(行、列均可)y的频数表。它将区间[min(y),max(y)]等分为m份(缺省时m设定为10),n返回m个小区间的频数,x返回m个小区间的中点。

hist(y,m)

数组y的直方图。

对于例1的数据,编写程序如下:

load high=data(:,1:2:9);high=high(:)

weight=data(:,2:2:10);weight=weight(:)

n1,x1]=hist(high)

下面语句与hist命令等价。

n1=[length(find(high<158.1)),

length(find(high>=158.1&high<161.2)),

length(find(high>=161.2&high<164.5)),

length(find(high>=164.5&high<167.6)),

length(find(high>=167.6&high<170.7)),

length(find(high>=170.7&high<173.8)),

length(find(high>=173.8&high<176.9)),

length(find(high>=176.9&high<180)),

length(find(high>=180&high<183.1)),

length(find(high>=183.1))]

n2,x2]=hist(weight)

subplot(1,2,1)

hist(high)

subplot(1,2,2)

hist(weight)

计算结果略,直方图如下图所示:

从直方图上可以看出,身高的分布大致呈中间高、两端低的钟形;而体重则看不出什么规律。要想从数值上给出更确切的描述,需要进一步研究反映数据特征的所谓“统计量”。直方图所展示的身高的分布形状可看作正态分布,当然也可以用这组数据对分布作假设检验。

例2 统计下列五行字符串中字符a、g、c、t出现的频数。

解把上述五行复制到一个纯文本数据文件中,放在matlab\work子目录下,编写如下程序:

clcfid1=fopen(''r');

i=1;while (~feof(fid1))

data=fgetl(fid1);

a=length(find(data==97));

b=length(find(data==99));

c=length(find(data==103));

d=length(find(data==116));

e=length(find(data>=97&data<=122));

f(i,:)a b c d e a+b+c+d];

i=i+1;endf

he=[sum(f(:,1)) sum(f(:,2)) sum(f(:,3)) sum(f(:,4)).

sum(f(:,5)) sum(f(:,6))]

fid2=fopen(''w');

fprintf(fid2,'%8d %8d %8d %8d %8d %8d',f');

fclose(fid1);fclose(fid2);

我们把统计结果最后写到一个纯文本文件中,在程序中多引进了几个变量,是为了检验字符串是否只包含a、g、c、t四个字符。

1.3 统计量。

假设有一个容量为的样本(即一组数据),记作,需要对它进行一定的加工,才能提出有用的信息,用作对总体(分布)参数的估计和检验。统计量就是加工出来的、反映样本数量特征的函数,它不含任何未知量。

下面我们介绍几种常用的统计量。

)表示位置的统计量—算术平均值和中位数。

算术平均值(简称均值)描述数据取值的平均位置,记作,1)

中位数是将数据由小到大排序后位于中间位置的那个数值。

matlab中mean(x)返回x的均值,median(x)返回中位数。

)表示变异程度的统计量—标准差、方差和极差。

标准差定义为。

第十章分类的统计描述

第十一章分类资料的统计描述。a1型题。1 动态数列指标分析中,发展速度和增长速度都是a 构成比。b 比。c 平均数。d 变异指标。e 率。2 乙肝疫苗接种后血清检查阳转率计算其分母为a 乙肝易感人数。b 乙肝患者人数。c 该地平均人数。d 乙肝疫苗接种人数。e 乙肝疫苗接种后阳转人数。3 某区某年冠...

第十章数据的收集 整理与描述

第十章数据的收集 整理与描述。知识概念图表 易混易错剖析 1.学生在选择调查方式时容易出错。一是学生不明白调查方式就分两类 抽样调查和全面调查 二是在收集数据的过程中,往往拿不定主意,是用全面调查还是用抽样调查?不知道有什么基本标准,往往想当然,随意乱填调查方式。典型示例 解答题 指出下列调查运用哪...

第十章数据的收集整理与描述教案

一 本章内容 本章主要内容是通过数据的收集 全面调查和抽样调查,数据的整理 频数分布表 没有给出概念 数据的描述 统计图表,和数据的分析得出结论的一般过程。问题 1 回顾了全面调查,介绍了问卷调查的方法,用 整理数据,用条形统计图和扇表统计图描述数据以及扇形统计图的画法。问题2 和问题3 介绍了抽样...

第十章数据的调查 整理与描述测试卷

班次姓名。一 选择题 3 9 27分 1 下列几项调查中,适合做全面调查的是 a 调查一批灯泡的使用寿命 b 调查全市食品市场上某种食品是否含色素。c 调查你所在班级全班学生的身高情况 d 调查全国中学生的视力情况。2 为了调查一批某种型号的电风扇的使用寿命,从中抽取20台进行测试,在这个问题中,2...

第十章工作时间

一 作息时间。公司根据不同季节制定作息时间制度,职员必须服从。二 假期。1 实行每周单休制,统一为每周星期日休息,个别部门可根据本部门具体工作情况,实行周。六 周日调休制 2009年10月修定,原规定 没有休息日 2 年假 职员转正后可享受带薪休年假 按基础工资发放 待遇,年假时间按公司规定执行 3...

材料力学答案第十章

第十章压杆稳定。第十章答案。10.1图示为支撑情况不同的圆截面细长杆,各杆直径和材料相同,哪个杆的临界力最大。d 解 在材料相同 截面相同的情况下,相当长度最小的压杆的临界力最大。a b c d 临界力最大。10.2图示为支撑情况不同的两个细长杆,两个杆的长度和材料相同,为使两个压杆的临界力相等 b...

第十章教育研究及其方法

第一节教育研究概述。一 教育研究的涵义。教育研究是人们为了获得对教育理论和实践问题的深入认识而进行的科学探索活动。二 教育研究的特点。1 科学性。2 客观性。3 系统性。4 综合性。5 可验证性。三 教育研究的原则。1 自愿原则。2 匿名原则。3 保密原则。4 无害原则。四 教育研究的意义。一 推动...

第十章行政管理规范

第十章行政管理规范 一 行政管理规范1.识记 1 规范的含义 2 行政管理规范的含义。2.领会 行政管理规范的分类标准与两种基本规范。二 行政法律规范1.识记 1 行政法律规范的含义 2 行政法规的含义 3 行政规章的含义 4 地方性法规 规章 自治条例和单行条例的含义。2.领会 1 行政法律规范的...