木森林林常识库

木森林林常识库
专业信息资源分享平台

读书笔记之变量和关系的测量

测量变量:测量层次
四种测量层次:
1、名目(定类测量)
2、顺序(定序测量)
3、区间(定距测量)
4、比例(定比测量)
测量数据的显著性和代表性:概率、抽样和民意调查中的问题
概率指的是某事发生的可能性或几率。
确定结果的显著性水平,构成一次重要的假设检验。显著性检验告诉我们,在特定条件下,我们的假设是对(或错)的概率有多大。
根据概率论抽取的样本被认为是概率样本。
随机抽样是随机选取一个足够大的关于总体的样本,以便这个样本有较高的概率再现整个总体的本质特征。
分层随机抽样的技术已大大提高了民意调查的可信度。
佩罗集团的数据犯了样本偏差的错误,它们并未真正尝试随机化或分层化。
测量变量间的关系:关联和相关
确立两个或多个变量间的关联度,成为科学事业的核心目标。
在对关联进行具体说明时,可以有效地使用诸如中位数、平均数及标准偏差这类描述性统计量。
相关的基本观念,就是在统计上描述变量间的关联的方向和强度。
变量间关系的测量:
1、相关:两个区间层次或比例层次的变量之间的关联度或共变度。关系的方向由+或-来表示。
2、双变量回归:区间层次或比例层次的(一个)因变量与单一自变量一个单位的变化相关联的变化量。
3、多元回归:由若干变量所解释的一个区间层次或比例层次的因变量的变化量。针对每一个自变量的独特影响进行测试。多重回归结合R²一起使用,后者表明由自变量的共同作用所解释的因变量的变化比例。
4、Probit分析和Logit分析:一种多元回归形式,在其中,因变量是二分的(例如,是/否;赞成/反对)。它考察一个自变量一个单位的变化导致因变量采取一个值或另一个值的概率变化。
引入的概念:
测量measurement  描述性统计descriptive statistics
变量的属性properties of variables 相关correlation  名目nominal
关联方向direction of association  顺序ordinal  相关量表scale of correction
区间interval  列联系数contingency coefficient  真实零点true zero
皮尔逊相关系数pearson’s r 比例ratio  回归分析regression analysis
任意零点arbitrary zero 斜率slope  概率probability  多元回归multiple regression
显著性水平level of significance  标准偏差standard deviation
概率样本probability sample  贝塔系数Beta coefficient  分层化stratification
随机抽样random sampling  抽样偏差sampling bias  关联association
反思:追根溯源
在我们同我们周围世界的关系中,埃里克森区分出三种维度:事实性、现实和真实性。
事实性就是“事实、数据和技术的总体,它们可用观察方法和当时的有效技术加以证实”。
分享:

评论