当前位置: 首页 > 实用文档 > 知识 > 数据的初步分析

数据的初步分析

2016-09-21 13:20:50 编辑: 来源:http://www.chinazhaokao.com 成考报名 浏览:

导读: 数据的初步分析(共5篇)数据分析初步第三讲 数据分析初步一 1 理解平均数的意义,能计算中位数,众数,加权平均数,了解它们是数据集中趋势的描述 2 体会刻画数据离散程度的意义,会计算简单数据的方差 3 体会样本与总体的关系,知道可以通过样本平均数,样本方差推断总体平均数和总体方差 4 能解释统计结果,根据...

数据的初步分析(一)
数据分析初步

第三讲 数据分析初步

一.<新课标要求>

1.理解平均数的意义,能计算中位数,众数,加权平均数,了解它们是数据集中趋势的描述.

2.体会刻画数据离散程度的意义,会计算简单数据的方差.

3.体会样本与总体的关系,知道可以通过样本平均数,样本方差推断总体平均数和总体方差.

4.能解释统计结果,根据结果作出简单的判断和预测,并能进行交流. 二.达标题

1.(2013•昭通)已知一组数据:12,5,9,5,14,下列说法不正确的是( )

A.平均数是9 B.中位数是9 C.众数是5 D.极差是5

A.6 B.7 C.8 D.9

3.(2013•重庆)为了比较甲乙两种水稻秧苗谁出苗更整齐,每种秧苗各随机抽取50株,分别量出每株长度,发现两组秧苗的平均长度一样,甲、乙的方差分别是3.5、10.9,则下列说法正确的是( )

A.甲秧苗出苗更整齐 B.乙秧苗出苗更整齐

C.甲、乙出苗一样整齐 D.无法确定甲、乙出苗谁更整齐

4.(2013•舟山)在某次体育测试中,九(1)班6位同学的立定跳远成绩(单位:m)分别为:1.71,1.85,1.85,1.95,2.10,2.31,则这组数据的众数是( )

A.1.71 B.1.85 C.1.90 D.2.31

5.(2013•自贡)某班七个合作学习小组人数如下:4、5、5、x、6、7、8,已知这组数据的平均数是6,则这组数据的中位数是( )

A.5 B.5.5 C.6 D.7

A.0.4和0.34 B.0.4和0.3 C.0.25和0.34 D.0.25和0.3

第四讲 平行四边形和特殊平行四边形

一.<新课标要求>

1.了解多边形的定义,多边形的顶点,边,内角,外角,对角线等概念;探索并掌握多边形内角和,与外角和公式.

2.理解平行四边形,矩形,菱形,正方形的概念,以及它们之间的关系;了解四边形的不稳定性.

3.探索并证明平行四边形的性质定理:平行四边形的对边相等,对角相等,对角线互相平分;探索并证明平行四边形的判定定理:一组对边平行且相等的四边形是平行四边形;两组对边分别相等的四边形是平行四边形;对角线互相平分的四边形是平行四边形.

4.了解两条平行线之间距离的意义,能度量两条平行线之间的距离.

5.探索并证明矩形,菱形,正方形的性质定理:矩形的四个角都是直角,对角线相等;菱形的四条边相等,对角线互相垂直;以及它们的判定定理:三个角是直角的四边形是矩形,对角线相等的平行四边形是矩形;四边相等的四边形是菱形,对角线互相垂直的平行四边形是菱形.正方形具有矩形和菱形的一切性质.

6.探索并证明三角形的中位线定理. 二.达标题

1.(2013•宜昌)四边形的内角和的度数为( )

A.180° B.270° C.360° D.540°

2.(2013•湛江)已知一个多边形的内角和是540°,则这个多边形是( )

A.四边形 B.五边形 C.六边形 D.七边形

3.(2013•扬州)一个多边形的每个内角均为108°,则这个多边形是( )

A.七边形 B.六边形 C.五边形 D.四边形

4.(2013•资阳)一个正多边形的每个外角都等于36°,那么它是( )【数据的初步分析】

A.正六边形 B.正八边形 C.正十边形 D.正十二边形 5.(2013•宜宾)如图,已知O是四边形ABCD内一点,OA=OB=OC,∠ABC=∠ADC=70°,则∠DAO+∠DCO的大小是( )

A.70°

B

.110

° C.140° D.150°

(5) (6) (7)

6.(2013•益阳)如图,在平行四边形ABCD中,下列结论中错.误.的是( )

A.∠1=∠2 B.∠BAD=∠BCD C.AB=CD D.AC⊥BD 7.(2013•云南)如图,平行四边形ABCD的对角线AC、BD相交于点O,下列结论正确的是( )

A.S▱ABCD=4S△AOB B.AC=BD C.AC⊥BD D.▱ABCD是轴对称图形

8.(2013•黔西南州)已知▱ABCD中,∠A+∠C=200°,则∠B的度数是( )

A.100° B.160° C.80° D.60° 9.(2013•襄阳)如图,平行四边形ABCD的对角线交于点O,且AB=5,△OCD的周长为23,则平行四边形ABCD的两条对角线的和是( )

A.18

B.28 C.36 D.46

(9) (10) 10.(2013•泰安)如图,在平行四边形ABCD中,AB=4,∠BAD的平分线与BC的延长线交于点E,与DC交于点F,且点F为边DC的中点,DG⊥AE,垂足为G,若DG=1,则AE的边长为( )

A.2 B.4

【数据的初步分析】

C.4

D.8

11.(2013•潍坊)下

面的图形是天气预报的图标,其中既是轴对称图形又是中心对称图形的是( )

A. B. C. D.

12.(2013•泸州)四边形ABCD中,对角线AC、BD相交于点O,下列条件不

能判定这

个四边形是平行四边形的是( )

A.AB∥DC,AD∥BC B.AB=DC,AD=BC

C.AO=CO,BO=DO D.AB∥DC,AD=BC

(12) (14)

13.(2013•西宁)如果等边三角形的边长为4,那么等边三角形的中位线长为( )

A.2 B.4 C.6 D.8 14.(2013•淄博)如图,△ABC的周长为26,点D,E都在边BC上,∠ABC的平分线垂直于AE,垂足为Q,∠ACB的平分线垂直于AD,垂足为P,若BC=10,则PQ的长为( )

A.35 B. C.3 D.4 22

15.用反证法证明“在同一平面内,若a⊥c,b⊥c,则a∥b”时,应假设( )

A.a不垂直于c B.a,b都不垂直于c

C.a⊥b D.a与b相交

16.对于命题“如果a>b>0,那么a2>b2.”用反证法证明,应假设( )

A.a2>b2 B.a2<b2 C.a2≥b2 D.a2≤b2 17.证明“一个三角形中,至少有一个内角小于或等于60°”.运用反证法时,假设正确的是( )

A.△ABC中,∠A<60°且∠B=60°

B.△ABC中,∠A、∠B、∠C都不小于60°

C.△ABC中,∠A<60°且∠B<60°

D.△ABC中,∠A、∠B、∠C都大于60°

18.(2013•茂名)如图,矩形ABCD的两条对角线相交于点O,∠AOD=60°,AD=2,则AC的长是( )

A.2

B

.4

C.2 D.4

(18) (19) (20) 19.(2013•济宁)如图,矩形ABCD的面积为20cm2,对角线交于点O;以AB、AO为邻边做平行四边形AOC1B,对角线交于点O1;以AB、AO1为邻边做平行四边形AO1C2B;„;依此类推,则平行四边形AO4C5B的面积为( )

A.5255252cm B.cm2 C.cm D.cm 481632

20.(2013•淄博)如图,菱形纸片ABCD中,∠A=60°,折叠菱形纸片ABCD,使点C落在DP(P为AB中点)所在的直线上,得到经过点D的折痕DE.则∠DEC的大小为( )

A.78° B.75° C.60° D.45°

21.(2013•东营)如图,E、F分别是正方形ABCD的边CD、AD上的点,且CE=DF,AE、BF相交于点O,下列结论:

(1)AE=BF;(2)AE⊥BF;(3)AO=OE;(4)S△AOB=S

A.4个 B.3个 C.2个 D.1个 四边形DEOF中正确的有( )

数据的初步分析(二)
数据的初步分析 R软件

第一章 数据的初步分析

【数据的初步分析】

一个数据可能有很多变量和观测值,这些变量和观测值可以通过一些简单的表格、图形以及少数的特征统计量来进行描述。这些方法在统计学中称为描述性统计分析方法,其目的在于帮助我们整理、展示数据,使得我们可以了解数据的特征,进而为进一步的统计推断做好准备。

通过计算机软件做数据的描述性分析,可以使我们更加直观、便捷地了解数据特征,有利于对统计描述的理解。本章的实验重点是介绍如何运用R软件来对数据进行描述性分析,并掌握描述性统计的基本方法和概念。

实验一 数据的统计量描述

一、

实验目的

初步了解数据的特点、分布形状;熟悉R软件的程序结构;学会使用R软件计算数据的描述统计量。 二、

实验内容

掌握通过R软件读入或输入数据,并能够计算数据集的均值、中位数、分位数、方差、标准差、变异系数、偏度系数以及峰度系数。 三、

准备知识

1. 位置的度量

所谓位置的度量就是那些用来描述数据集中趋势的统计量。常用的有均值、众数、中位数、百分位数等。

平均数(Mean):

x

xi

中位数(Median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数,即

me= 1

2

x n+1 当n为奇数时

2

xn+xn 当n为偶数时

中位数描述的是数据的中心位置不受数据分布的影响,具有稳健性,是数据分析中相当重要的统计量。

众数(Mode):在一组数据中,出现次数最多的那个数据。

百分位数:百分位数是中位数的推广。将数据按从小到大排序后,对于0≤p<1,它的分位点定义为

x np +1 当np不是整数时

mp= 1

x+x(np+1) 当n是整数时(np)

其中[np]为np的整数部分。

2. 离散趋势度量

表示数据分散或变异程度的特征统计量,常用的有方差、标准差、变异系数等

样本方差S2(Sample Variance):描述数据取值分散性的一个度量,即

S(xi)2n1)

2

i1n

样本标准差S(Standard Deviation):样本方差的开方,即

SS2

变异系数(CV):变异系数是刻画数据相对分散性的一种度量

s

CV=100×(%)

是一个无量纲的量,用百分数表示。

3. 分布形状的度量

数据分布形状的度量包括偏度系数和峰度系数。 偏度系数:计算公式为

nn2μ3

3

g1= (xi−x )=i=1n

s是标准差,μ3是样本三阶中心矩,即μ3=n n )3.偏度系数是刻画数i=1(xi−x据的对称性指标。关于均值对称的数据偏度系数为0.数据左偏时,对称系数为正,右偏时为负。

峰度系数:计算公式

1

2

n(n+1(n−1)

g2= (xi−x )4−3 i=1

n

n2(n+1)μ4(n−1)2

=−3 s是标准差,μ4是样本四阶中心矩,即μ3=n n )4.来自正态总体的数i=1(xi−x据峰度近似为0;如果样本数据的峰度大于0,则该数据的总体分布比正太分布的尾部更分散;如果一个样本数据的峰度小于0,则总体分布较正太分布更集中。 四、

实验背景

1

某灯泡生产厂商测试某种新型灯泡的燃烧寿命,如下数据表格列出了200个灯泡样本的可使用小时数。

计算数据集的均值、中位数、分位数、方差、标准差、变异系数、偏度系数以及峰度系数。 五、

实验过程

1. 读入数据。首先通过R软件中的read.table()命令来读入实验数据(也可以通过函数scan()

来读入数据)。以本实验为例,我们假定数据的存储路径为:I:\非参数实验教材\教材\

第一章 描述性统计分析,数据名称为”测试.txt”,则具体读入过程如下: > x<-read.table("I:\\非参数实验教材\\教材\\第一章 描述性统计分析") > x=t(x)

2. 均值。读入数据后,可以通过”mean()”这一函数求数据的均值,记为x.mean,过程如下:

> x.mean=mean(x);x.mean [1] 76.05

3. 数据排序。在R软件中,对原始数据进行排序,可以通过”sort()”函数(具体用法可以参考help文件)对数据进行排序,例如,分别对数据进行降序和升序排列,过程如下: > sort(x,decreasing=T)

[1] 116 107 103 102 101 99 98 98 98 97 96 96 96 94 94 94 94 93

[19] 93 92 92 92 92 92 91 90 90 89 89 89 89 89 89 88 88 88 [37] 88 88 87 87 86 86 86 86 85 85 85 85 85 84 84 84 84 84 [55] 83 83 83 83 83 82 82 82 82 81 81 81 81 81 81 80 80 80 [73] 79 79 79 79 79 79 79 78 78 78 78 78 78 77 77 77 77 77 [91] 77 77 77 77 76 76 76 76 76 76 75 75 75 75 75 75 74 74 [109] 74 74 74 74 73 73 73 73 73 73 72 72 72 72 72 72 71 71 [127] 71 71 71 71 71 71 70 70 70 70 69 69 68 68 68 68 68 68 [145] 68 68 67 67 67 67 66 66 66 66 66 66 65 65 65 65 65 65 [163] 65 65 64 64 64 64 63 63 63 63 63 63 62 62 62 62 62 62 [181] 62 62 61 61 61 61 61 60 59 59 59 59 59 58 58 57 54 51 [199] 45 43

> sort(x,decreasing=F)

[1] 43 45 51 54 57 58 58 59 59 59 59 59 60 61 61 61 61 61 [19] 62 62 62 62 62 62 62 62 63 63 63 63 63 63 64 64 64 64 [37] 65 65 65 65 65 65 65 65 66 66 66 66 66 66 67 67 67 67 [55] 68 68 68 68 68 68 68 68 69 69 70 70 70 70 71 71 71 71

[73] 71 71 71 71 72 72 72 72 72 72 73 73 73 73 73 73 74 74 [91] 74 74 74 74 75 75 75 75 75 75 76 76 76 76 76 76 77 77 [109] 77 77 77 77 77 77 77 78 78 78 78 78 78 79 79 79 79 79 [127] 79 79 80 80 80 81 81 81 81 81 81 82 82 82 82 83 83 83 [145] 83 83 84 84 84 84 84 85 85 85 85 85 86 86 86 86 87 87 [163] 88 88 88 88 88 89 89 89 89 89 89 90 90 91 92 92 92 92 [181] 92 93 93 94 94 94 94 96 96 96 97 98 98 98 99 101 102 103 [199] 107 116

4. 中位数。在R软件中,求数据中位数的命令函数为median(),可以通过以下命令求中位数。

> median(x) [1] 75.5

5. 分位数。求分位数的函数命令为quantile(),我们可以通过quantile()求某一个具体的分位点值,也可以同时求多个分位点值,例如

> quantile(x)

0% 25% 50% 75% 100%

43.00 66.75 75.50 84.00 116.00 > quantile(x,0.05) 5% 59

> quantile(w, probs = seq(0, 1, 0.2))

0% 20% 40% 60% 80% 100% 47.40 56.98 62.20 64.00 67.32 75.00

6. 方差和标准差。在R软件中求方差和标准差的命令函数为var()和sd(),通过这两个命令可以很容易的求出数据的方差、标准差。具体如下:

> var(x) [1] 145.4548 > sd(x) [1] 12.06046

数据的初步分析(三)
数据的初步分析 - 学生

【数据的初步分析】

数据的初步分析(四)
数据分析初步复习教案

1

2

3

4

【数据的初步分析】

5

数据的初步分析(五)
初二 数据分析初步 讲义

第三章 数据分析初步 复习稿

一、平均数

一般地,有n个数x1,x2,…,xn,我们把 叫做这n个数的算术平均数,简称 。记做 【例1】.我省某市五月份第二周连续七天的空气质量指数分别为:105,98,99,95,107,103,94,则这七天空气质量指数的平均数是 。 解法一:x=

=

解法二:这些数据都在 上、下波动,所以我们可以以 为基准,原数据记为

;则x 【练一练】:

1、 数据201,198,196,202,205的平均数是 。

2、如果x1与x2的平均数是4,那么x1+1与x2+5的平均数是 。 3、若数据2,3,-1,7,x的平均数为2,则x= 。

【例2】.某次能力测试中,10人的成绩统计如下表,则这10人成绩的平均数

这种形式的平均数是叫做 ,其中3,1,2,2, 2表示各相同数据的个数,称为 。 【练一练】: 1、某商场用加权平均数来确定什锦糖的单价,由单价为15元/千克的甲种糖

果10千克,单价为12元/千克的乙种糖果20千克,单价为10元/千克的丙种糖果30千克混合成的什锦糖果的单价应定为( )

A.11元/千克 B.11.5元/千克 C.12元/千克 D.12.5元/千克

2、某校为了招聘一名优秀教师,对入选的三名候选人进行教学技能与专业知识两种考核,现将甲乙丙三人的考核成绩统计如下:【数据的初步分析】

被录用。

(2)如果校方认为教师的教学技能水平比专业知识水平重要,因此分别赋予它们6和

4的权。计算赋权后他们各自的平均成绩,并说明谁将被录用。

二、众数与中位数:

1、 众数:在一组数据中出现次数 的数据叫做众数。

【例3】这组数据:1、1、1、2、2、4中的众数是 ;

这组数据:2、2、5、3、5的众数是 ;

【练一练】:已知一组数据3,,4,5的众数是4,则这组数据的平均数为( )

A.3 B.4 C.5 D.6

2、中位数:将一组数据按 (或 )的顺序排列,位于最中间

的一个数据(当数据的个数为 时)或最中间两个数据的 (当数据为 时)叫做这组数据的 。中位数只有 个。

【例4】浙江农村医疗保险已经全面实施,绍兴县7个村中享受了住院医疗费用报销的人数分别是:20、24、27、28、31、34、38,则这组数据的中位数是 。

【例5】 某公司销售部有营销人员15人,销售部为了制定某种商品的月销售额,统计了者15人某月的销售量如下:

(1)求者15人营销人员该月销售量的平均数、中位数和众数;

(2)假设销售部负责人把每位营销人员的月销售量定320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额,并说明理由。

【练一练】:

【提高题】由小到大排列的一组数据:x1,x2,x3,x4,x5其中每个数据都小于-1,则对于数据:1,x1,-x2,x3,-x4,x5,中位数可以表示为( ) A.

1x5xx41x2xx1

B.2 C. D.3 2222

三、方差和标准差

1.方差:在一组数据中,各数据与它们的平均数的差的 的平均数叫做这组数据的方差,用 表示。方差越 ,说明数据越稳定。 方差的计算公式: 2、标准差:方差的 叫做这组数据的 ,用 表示。 如:(1)某样本的方差是9,则标准差是______

(2)数据-2,-1,0,3,5的方差是 ,标准差是 。

【例5】两台机床同时生产直径为10的零件,为了检验产品的质量,质量检验员从两台机床的产品中各抽出5件进行测量,结果如下表。如果你是质量检验员,在收集到上述数据后,你将利用哪些统计知识来判断这两台机床生产的零件的质量优劣? (点拨:通常比较优劣是通过平均数、方差(或标准差)、众数等来衡量的)

【例6】一组数据x1, x2,… xn, 的平均数是2,方差是3,

则一组新数据x1+8, x2+8,… xn+8的平均数是 ,方差是 . 另一组新数据3x1+8, 3x2+8,…3xn+8的平均数是 ,方差是 .

【练一练】

1、一个样本的方差是

S2

1

[(x18)2(x28)2(x1008)2]100

则这个样本中的数据个数是____,平均数是____。

2、甲、乙两名战士在射击训练中,打靶的次数相同,且射击成绩的平均数也相同,如

22

果甲的射击成绩比较稳定,那么方差的大小关系是:S甲_________S乙。

3、学校篮球队五名队员的年龄分别为17,15,17,16,15,其方差为0.8,则三年后这五名队员年龄的方差为______.

4、不计算,比较图中甲、乙两组数据的标准差,则S甲与S乙的关系是( )

A.s甲s乙 B.s甲s乙 C.s甲s乙 D.不能确定

【提高题】某同学5次上学途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为多少?


数据的初步分析相关热词搜索:数据分析初步知识点 数据分析初步试卷

最新推荐成考报名

更多
1、“数据的初步分析”由中国招生考试网网友提供,版权所有,转载请注明出处。
2、欢迎参与中国招生考试网投稿,获积分奖励,兑换精美礼品。
3、"数据的初步分析" 地址:http://www.chinazhaokao.com/zhishi/642487.html,复制分享给你身边的朋友!
4、文章来源互联网,如有侵权,请及时联系我们,我们将在24小时内处理!