SPSS入门常见的25个问题
#
由学术志平台举办的连续三天的定量研究与spss体验营已经结束了,1000多位小伙伴积极参与、热烈讨论,提出了很多问题。现将问题整理,供学友们参考。
一、定量研究理论与适用范围
01.
Q:定量研究的理论有哪些?
A:定量研究是依靠对事物可以量化的部分及其相互关系进行测量、计算和分析,希望用概括性的几个数值达到对事物总体特征的把握。它在哲学上很大程度来源于实证主义影响,它是一种分析问题的范式,而并不是理论。
2.
Q:定量研究有什么局限?
A:定量研究虽然标准化程度较高、论证较为研究,但很多定量研究难以在理论上做出较大创新,并且研究结论可能受到样本影响而有推广上的局限性。
3.
Q:定量研究和定性研究的区别是什么?
A:两者最大的区别在于分析的方法、思路以及对研究问题的假定上。定量研究依靠对事物可以量化的部分及其相互关系进行测量、计算和分析,希望用概括性的几个数值达到对事物总体特征的把握。定性研究是通过研究者和被研究者之间的互动对事物进行深入、细致、长期的体验,然后对事物的“质”得到一个比较全面的解释性理解。
4.
Q:如何找到合适的理论假设?
A:理论假设要根据研究问题来提出。一方面可以来源于文献中发现的有待进一步研究的地方,另一方面可以来源于现实生活中的观察到的有价值的现象。
5.
Q:同一个问题在不同年龄段和不同性别的差异用什么分析方法?
A:根据问题的描述建议可以考虑(多因素)方差分析。这个方法通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素(如年龄或性别)对结果影响力的大小。
二、问卷、量表与变量
6.
Q:问卷设计有哪些注意点?
A:问卷设计是很多量化研究收集数据的基础,问卷设计的好坏直接影响数据质量。总体而言一下四条应该首先考虑:
(1)注意用词清晰,题目简洁易懂,避免避免使用被调查者不熟悉或是具有诱导性等文字表述;
(2)注意应答者回答问题的能力以及各个题目之间的顺序与逻辑性;
(3)问卷题目不宜过多,否则易使应答者感到浪费时间,导致放弃或者敷衍回答问卷;
(4)应考虑到便于后期工作的开展,变量不宜设置太多,尽量用较少的变量解决较多的问题。
7.
Q:如果自己编写调查问卷,怎么样判断其质量好坏呢?
A:量表开发和问卷制作也是一门很重要的学问,心理学上一些重要量表开发可能耗费几个团队数十年的时间。对于我们自己的研究来说,首先要评价的还是问卷的信度和效度,如果需要更严谨量表开发的步骤,建议在心理学期刊中查找量表开发的文章进行参考(特别建议参考英文文章)。
8.
Q:如果我用的变量前人没有开发过量表,那自己做的操作化会不会被专家质疑呢?
A:任何量表开发或是变量测量化都可能受到不同程度的质疑,关键还是在坚实理论的基础上要采用严谨的开发步骤,并详细报告对问卷有效性检验的开展步骤和结果。
9.
Q:定量研究是不是都得自己制定量表?
A:不是的,首先并非所有的定量研究方法都需要使用量表。其次即使对于需要使用量表的方法,如果有对某一问题已经有非常成熟的量表,借鉴过来或做一些修订是完全可以的,这样做不仅省时省力,同时也基本能够保证这部分量表的信度与效度。
10.
Q:调节变量与中介变量,spss可以吗?
A:可以,但对于复杂模型分析的一些功能可能需要安装相关的插件才能实现(如Process插件)。
三、样本和数据来源
11.
Q:定量研究的合理样本有没有规范要求?
A:不同定量研究方法、不同变量个数对样本的研究是不同的。以回归和结构方程模型为例,样本的数量区间应为10k-30k(k为变量个数)。但目前期刊普遍对样本数量要求较高,对于追求高质量期刊的研究建议的样本数量为500份。
12.
Q:请问定量研究是选择模型创新度和理论研究创新度,哪个更重要?
A:对于发表而言二者都很重要,但评价文章价值的更关键还是在于理论的创新和贡献,一味追求方法和模型的复杂实际上是不好的趋势。
13.
Q:如果问卷数据不理想怎么办?
A:首先建议在正式发放问卷之前先进行预测试,并据此修订问卷题项、表述等等。如果问卷文件数量不理想应该分析原因,究竟是样本或者是研究假设本身出现问题,针对具体情况进行后续研究设计。
14.
Q:请问从哪些已有的数据库里查到数据?
A:使用较多也较为权威的数据库有联合国商品贸易统计数据库、中国私营企业调查(CPES)、世界银行中国企业调查数据、中国小微企业调查数据(CMES)、中国工业数据库、中国专利数据库等。一些权威的社会调查类的数据库有中国综合社会调查(CGSS)、中国社会状况综合调查(CSS)、中国劳动力动态调查(CLDS)、中国家庭收入项目(CHIP)、中国家庭追踪调查(CFPS)、中国健康与养老追踪调查(CHARLS)、中国家庭金融调查数据(CHFS)、全国老年人口健康状况调查研究(CLHLS)和中国健康与营养调查(CHNS)等。
15.
Q:一手数据和二手数据哪个写论文更好?
A:二者各有利弊,比如二手数据的优点有样本量通常很大、通常具有较高程度的客观性和高度的可复制性等,但有的时候语法恰好满足待研究问题的要求;而一手数据某种意义上则更加生动、接地气、更有意义,但数据可能存在主观性并限制结论的推广。总之,要根据研究问题、资料获取难度等综合选择数据。
四、数据处理与分析
16.
Q:怎么样才算的上是好的数据分析?
A:好的数据分析的标准有很多,客观性和逻辑性应是首先要保证的。
17.
Q:回归分析到底是分析什么样的问题呢?
A:回归分析主要用于分析两种或两种以上变量间相互依赖的关系的一种方法,它可以得出一个或多个变量对另一变量或多个变量影响的强弱和方向。比如营销学中顾客满意度对购买意愿的影响、教育学中学生对老师喜爱程度对其学习成绩的影响等。回归分析按照变量的数量和类型可以分为很多种,可以根据研究问题和变量属性选择最为合适的分析方法。
18.
Q:如果自变量之间相关性很大,在回归分析时会影响回归结果吗?
A:会的。实际上,如果变量间高度相关的话,许多统计方法的结果都会受到影响。量表设计与检验中的一些指标(如区分效度)可以帮助判断变量之间是否在相关性上存在问题。
19.
Q:因子分析主要是研究什么问题呀?
A:因子分析是一种从变量群中提取共性因子的方法,主要用于对一些较为复杂、维度较多的问题进行简化,也可用于对划分指标和维度的验证。因子分析最早用于教育实践中,如找到影响学生学习成绩的诸多复杂因素中找到具有共性因素,这样便可以减少变量的数目从而便于后续研究设计。其他像影响服务质量的因素、用户评价某一工艺品的因素等都问题可使用因子分析。
20.
Q:主成分分析和因子分析有什么区别呢?
A:虽然二者都是用于降维,但主成分分析和因子分析在原理上、假设条件上、解释和应用上都有差别。从便于理解的角度,可以认为二者是包含与被包含的关系,主成分分析可以视作因子分析的特例或是中间步骤。在SPSS实际操作中,“因子分析”模块的提取菜单提供了多种提取公因子的方法,其中一种就是主成分法,由此可见,主成分可以视作因子分析的一种方法。
五、软件的使用与学习
21.
Q:调查问卷的内容如何用SPSS进行呈现并且分析?
A:应该首先将问卷的数据录入到SPSS之中,录入的过程类似于Excel,然后再根据研究的问题和变量的类型选择合适的分析方法。
22.
Q:这个软件下载有没有链接,同时现在那个版本好?
A:SPSS由于其知名度目前在网络上资源较多,但从知识产权的角度希望能够支持正版。版本的选择上,对一般的使用者而言20.0之后的版本差别不大,并且都支持中文界面,可以根据自己情况自由选择一款。而对R、Python等第三方扩展有要求的专业用户应该尽量选择最新版本(目前最新版本为26.0)。
23.
Q:没有高数基础或统计学基础能做好定量研究么?
A:有没有数学基础并不是开展定量研究的决定因素。就SPSS软件来说,它兼顾了功能强大和简单易用,即使没有数学基础在一定的学习下也是完全可以得到研究中所需要的数据的。当然如果想要在定量研究领域中进一步钻研或扩展,掌握一定的数理统计知识也是必要的。
24.
Q:SPSS要学多长时间?
A:学习任何一门新技能都需要付出努力,SPSS也是如此。具体学习时间也需要根据自身前期基础、学习的目标等因素调节。但总体而言,相较于其他类似的统计软件,SPSS具有人机界面良好、操作简单等特点,非常适合作为刚接触这里研究方法的新手尝试。
25.
Q:请问学习SPSS有推荐书目吗?
A:国内目前比较好的关于SPSS的书目有重庆大学出版社的《问卷统计分析实务—SPSS操作与应用》(吴明隆著)、中国人民大学出版社的《社会统计分析方法——SPSS软件应用》(郭志刚著),这两本书豆瓣上的评分都在9.0分以上。张文彤老师的《SPSS统计分析基础教程》和《SPSS统计分析高级教程》也是十分经典的书目,该书第一版出版于2004年,目前最新的是2017年的第三版。另外,SPSS软件自带的教程和使用手册包含了SPSS所有功能的操作步骤、统计原理、以及不同分析方法的使用场景示例,可以作为最全面、最权威的SPSS学习材料,但该手册很多地方还未推出汉化版,因此对学习者英语水平有一定要求。