温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
3. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:QQ 403074932
第十章统计与概率
•1.随机抽样•(1)理解随机抽样的必要性和重要性.•(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.•2.总体估计•(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.•(2)理解样本数据标准差的意义和作用,会计算数据标准差.•(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
•(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.•(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.•3.变量的相关性•(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.•(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
•4.统计案例•(1)了解独立性检验(只要求2×2列联表)的基本思想、方法及简单应用.•(2)了解回归分析的基本思想、方法及其简单应用.•5.事件与概率•(1)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义以及频率与概率的区别.•(2)了解两个互斥事件的概率加法公式.•6.古典概型•(1)理解古典概型及概率计算公式.•(2)会计算一些随机事件所含的基本事件数及事件发生的概率.
•7.随机数与几何概型•(1)了解随机数的意义,能运用模拟的方法估计概率.•(2)了解几何概型的意义.
•1.最常用的简单随抽机签抽法样方随机法数有表_法_____和___________.对总•体2.进行系编统号抽样的步骤:确定分段间隔•(1)_______________;在第一段中用简单随机抽样方法确定某个个体编号l•(2)_____________;按一定规则抽取样本•(3)_________________________________抽样过程中每个个体被抽取的概率_相_等__________;•(4)___________________.•3.三种随机抽样的共同点是________________________•___________.
•4.作频率分布直方图的步骤•(1)_求__极_差___;•(2)_决_定__组_距__与_组__数_____;将数据分组•(3)___________;计算各小组的频率,作频率分布表•(4)_______________________________;画频率分布直方图•(5)_________________.集中•5.平均数、众数、中位数是描述数据的离散_____趋势的;极差、方差、标准差是描述数据的_____程度的.
•1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
–解析:本题是容易题,注意掌握系统抽样与分层抽样的原理.•答案:3720
•2.某学院的A,B,C三个专业共有1200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.–解析:C专业有1200-380-420=400名学生,按1∶10的比例,应抽取40人.•答案:40
•3.如图是某样本数据的茎叶统计图,则该样本数据的众数是________.–解析:众数是指一组数据中出现次数最多的数,易知众数为84.•答案:84
•4.对某校400名学生的体重进行统计,得到如图所示的频率分布直方图,则学生体重在60kg以上的人数为________.解析:由直方图知,60~70kg范围的频率为(0.04+0.01)×5=0.25,所以体重在60kg以上的人数为:400×0.25=100.答案:100
•1.三种抽样方法比较:类别共同点相互联系适用范围各自特点简单随总体中的从总体中逐个抽机抽样个数较少取①抽样过程中将总体均匀分成在起始部分抽系统每个个体被抽总体中的几部分,按事先样时采用简单抽样到的机会均等个数较多确定的规则在各随机抽样②抽样过程都部分抽取是不放回地抽总体由差样每层抽样时采将总体分成几分层异明显的用简单随机抽层,按一定的比抽样几部分组样或系统抽样例进行抽取成
•2.抽样方法经常交叉起来使用,如分层抽样,若每层中的个体数量仍很大,则可辅之以系统抽样,系统中的每一均衡的部分,又可采用简单随机抽样.•3.用样本估计总体一般分为两种,一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征.•4.用茎叶图表示数据有两个突出的优点,一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示.但茎叶图只便于表示两位有效数字的数据,虽然可以表示两个以上的比赛结果(或两个以上的记录),但没有表示两个记录那么直观、清晰.
(即时巩固详解为教师用书独有)»考点一系统抽样•【案例1】某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,……发票上的销售额组成一个调查样本.这种抽取样本的方法是()•A.抽签法B.随机数表法•C.系统抽样法D.其他方式的抽样
–关键提示:简单随机抽样的方法主要有抽签法和随机数表法,注意每个个体被抽到的概率必须是相等的.–解析:上述抽样方法是将发票平均分成若干组,每组50张.从第一组中抽出了15号,以后各组抽15+50n(n为自然数)号,符合系统抽样的特点,故选C.•答案:C
•【即时巩固1】某单位有职工603人,从中抽取10人进行某项调查,试用系统抽样进行具体实施.–解:(1)将每个职工编号:001~603;–(2)用随机数表法找到3个号码,将其剔除;–(3)将余下的600名职工重新编号:001~600;–(5)从第一组001~060中随机抽取一个号码l;–(6)将编号l,60+l,120+l,…共10个号码取出,组成所需样本.
»考点二分层抽样•【案例2】一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.–关键提示:注意到该疾病与不同的地理位置和水土均有关系,所以不同的乡镇的发病情况有所差异,应考虑采用分层抽样的方法进行抽取样本.–解:将3万人分为五层,其中一个乡镇为一层.–按照样本容量的比例随机抽取各乡镇应抽取的样本.
–因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.–将300人组到一起即得到一个样本.–点评:从例题看分层抽样是一种实用性、操作性强,应用比较广泛的抽样方法,但为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
•【即时巩固2】(2008·天津)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工________人.答案:10
»考点三用样本分布估计总体分布•【案例3】(2009·海南、宁夏)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).•(1)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;•(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
•表1:生产能力[100,110)[110,120)[120,130)[130,140)[140,150)分组人数48x53•表2:生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y3618
•①先确定x,y,再在答题纸上完成下列频率分布直方图,就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
•②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数.(同一组中的数据用该组区间的中点值作代表)–关键提示:正确理解题意,读懂图表含义,理解基本概念,掌握统计思想.
–(2)①由题意知A类工人中应抽查25名,B类工人中应抽查75名.由4+8+x+5+3=25,得x=5,由6+y+36+18=75,得y=15.–频率分布直方图如下:
–从直方图可以判断,B类工人个体间的差异更小.
–A类工人生产能力的平均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.
•【即时巩固3】为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺码,将所得的数据整理后,画出频率分布直方图(如图).已知图中从左至右前3个小组的频率之比为1∶2∶3,第4小组和第5小组的频率分别为0.175和0.075,第2小组的频数为10.
•(1)前3个小组的频率分别是多少?•(2)抽取的顾客人数是多少?•(3)尺码落在区间(37.5,43.5)的概率为多少?–分析:此题主要考查:①各组频率之和为1;②频率=频数÷样本容量;③某区间内的累积概率求法:各组相加.
–(2)因第2小组的频率为0.250,而第2小组的频数为10,根据频率=频数÷样本容量,可知,样本总容量为10÷0.250=40,所以抽取的顾客人数是40.–(3)区间(37.5,43.5)正好是第2、3、4这3个小组,这3个小组的频率之和为0.250+0.375+0.175=0.800,–所以尺码落在区间(37.5,43.5)的概率为0.800.
»考点四用样本的数字特征估计总体的数字特征•【案例4】为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前天的数使1用51~天数181如~下21表1~:241~271~301~331~361~180210240270300330360390灯管1111820251672数
•(1)试估计这种日光灯的平均使用寿命;•(2)若定期更换,可选择多长时间统一更换合适?–关键提示:掌握平均数及方差、标准差的计算方法,理解方差的含义.–解:(1)各组中值分别为165、195、225、255、285、315、345、375,由此可算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).–(2)将组中值对此平均数求方差:
–估计这种日光灯的平均使用寿命约为268天,标准差约为46,故可在222天到314天左右统一更换较合适.
•【即时巩固4】某工厂人员及工资(单位:元)构成如下:人员经理管理人员高级技工工人学徒合计周工资2200750720500200人数16510123合计220045003600500020015500
•(1)指出这个问题中的众数、中位数、平均数;•(2)这个问题中,平均数能客观地反映该工厂工人的工资水平吗?为什么?–分析:本题着眼于众数、中位数、平均数各自的特点,以及其适应对象.–解:(1)由表格可知,众数为500,中位数是720.–平均数为(2200+4500+3600+5000+200)÷23–=15500÷23≈674.–(2)虽然平均数为674元/周,但由表格中所列出的数据可见,只有经理、高级技工和管理人员的工资在平均数以上,其余的人都在平均数以下,故平均数不能客观真实地反映该工厂工人的工资水平.