class: center, middle, inverse, title-slide .title[ # 问卷法 ] .subtitle[ ## 社会调查方法——第5讲 ] .author[ ### 李代 ] .institute[ ### 中国政法大学社会学院 ] .date[ ### 2023-04-11 ] --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 问卷法 ## 问卷法实例 ## 问卷设计流程 ## 问卷设计技巧 --- # 问卷法实例 ## 中国家庭追踪调查 [中国家庭追踪调查(CFPS)](http://www.isss.pku.edu.cn/cfps/) CFPS重点关注中国居民的经济与非经济福利,以及包括经济活动、教育成果、家庭关系与家庭动态、人口迁移、健康等在内的诸多研究主题,是一项全国性、大规模、多学科的社会跟踪调查项目 CFPS样本覆盖25个省/市/自治区,目标样本规模为16000户,调查对象包含样本家户中的全部家庭成员 CFPS由北京大学中国社会科学调查中心(ISSS)实施。项目采用计算机辅助调查技术开展访问,以满足多样化的设计需求,提高访问效率,保证数据质量,是北京大学和国家自然基金委资助的重大项目。 --- # 问卷法实例 ## 总体 [抽样方案](http://www.isss.pku.edu.cn/cfps/docs/20200520161539050175.pdf?CSRFT=AR04-F3C7-6Z8P-7AGE-6QMH-S2PU-WEYU-OR5T) > 为中国(不含香港、澳门、台湾以及新疆维吾尔自治区、西藏自治区、青海省、内蒙古自治区、宁夏回族自治区、海南省)25 个省/市/自治区的满足项目访问条件的家户和样本家户中满足项目访问条件的家庭成员。 > CFPS 样本所在的 25 个省/市/自治区的人口覆盖了中国除香港、澳门、台湾外总人口数的 94.5%,由于覆盖范围如此广泛,因此可以将 CFPS 样本视为一个全国代表性样本。 这显然是错误的。 --- # 问卷法实例 ## 抽样方法 > 在抽样设计上,我们首先将全国 25 个省/市/自治区分成两类:一类省市为在省级层次的推断样本,用以满足省级推断的要求。我们选择了 5 个省/市,分别为辽宁、上海、河南、广东、甘肃,也称为大样本省(以下简称为“大省”)。 > 二类省市为上述 5 个省/市外的 20 个省/市/自治区,这一类省市的样本量不能够在省级层次进行推断,也称小样本省(以下简称为“小省”)。从这两类样本数据的加权可以得到对 25 个省/市/自治区总体的有效估计,进而用来推断全国。 --- # 问卷法实例 ## 抽样方法 > CFPS 样本是一个采用内隐分层(implicit stratification)方法抽取的多阶段概率样本(multi-stage probability sample)。采用多阶段抽样设计既是为了减少调查的运作成本,也是考虑到中国社会的社会背景差异。 抽样框 > 对辽宁、河南、甘肃和广东这 4 个“大省”,每个省内的所有区(若为城市)或县(若 为农村)构成了一个抽样框(sampling frame) > 上海市只有 19 个区县。第一阶段的抽样在比区/县低一级的行政区划上实施,即街道办 事处(若为城市)和乡镇(若为农村)层次上 > 对于作为 CFPS 样本剩余组成部分的“小省”的样本,这些省份中的区(若为城市)或 者县(若为农村)构成了一个抽样框 …… --- # 问卷法实例 ## 调查问卷 [2018汇总问卷](http://www.isss.pku.edu.cn/cfps/docs/20210104171517251082.pdf?CSRFT=AR04-F3C7-6Z8P-7AGE-6QMH-S2PU-WEYU-OR5T) 例如: > BC5 BC5"最高学历"“【CAPI】加载姓名”已经完成的最高学历?【受教育程度选项简表】 >访员注意:如果还未读完小学,请选择“0. 盲/半文盲”。 >0.文盲/半文盲 3.小学 4.初中 5.高中/中专/技校/职高 >6.大专 7.大学本科 8.硕士 9.博士 10.从未上过学 >BC6 BC6"户口类型"“【CAPI】加载姓名”现在的户口类型: >访员注意:如果受访者不是中国国籍,属于不适用,请录入“79.不适用”。 >1.农业户口 3.非农户口 5.没有户口 79.不适用 --- # 问卷法实例 ## 发表论文 [研究论文多达几百篇](http://www.isss.pku.edu.cn/cfps/xzyj/wxlb/index.htm?CSRFT=AR04-F3C7-6Z8P-7AGE-6QMH-S2PU-WEYU-OR5T) Xie Y, Jin Y.Household Wealth in China[J].Chinese Sociological Review,2015,47(3):203-229.DOI:10.1080/21620555.2015.1032158 Ren Q, Treiman D J.Living arrangements of the elderly in China and consequences for their emotional well-being[J].Chinese Sociological Review,2015,47(3): 255-286.DOI:10.1080/21620555.2015.1032162. Liu A, Xie Y.Influences of monetary and non-monetary family resources on children's development in verbal ability in China[J].Research in Social Stratification and Mobility,2015(40): 59-70.doi:10.1016/j.rssm.2015.02.003 Raymo J M, Park H, Xie Y, et al.Marriage and Family in East Asia: Continuity and Change[J].Annual Review of Sociology,2015(0).DOI:10.1146/annurev-soc-073014-112428. [介绍文章:谢宇,胡婧炜,张春泥.中国家庭追踪调查:理念与实践[J].社会,2014,(2):1-32.](http://www.cnki.com.cn/Article/CJFDTOTAL-SHEH201402001.htm) --- # 问卷法实例 ## 问卷设计失误导致总统选举失败 WEST PALM BEACH, Florida (CNN) -- Voters confused by Palm Beach County's butterfly ballot cost Al Gore the presidency.  --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 问卷设计流程 --- # 问卷设计流程 ## 问卷法 > 问卷法是通过书面形式,以严格设计的问题或表格,向研究对象收集资料和数据的方法。 1. 既可作为独立的收集研究资料的方法,也可作为辅助研究方法 1. 用以测量人们的特征、行为和态度 1. 抽样—问卷—定量分析三者的结合体,是现代社会学定量研究中最常见也是最重要的一种方式 问卷: 1. 自填问卷 1. 代填问卷(访问问卷) --- # 问卷设计流程 ## 封面信 > 问卷开头部分写给被调查者的”一封简短的信” 其作用是: 简要说明本调查的实际意义,特别是有利于被调查者的地方,以提高被调查者认真回答的积极性 设法消除被调查者可能具有的思想顾虑,鼓励他们反映出自己的真实思想 对回答的方式作清楚的说明 联络感情,缩小心理距离,应有称呼、问候语和落款(调查主持单位) --- # 问卷设计流程 ## 指导语 > 即对填表的方法、要求、注意事项做一个说明,目的就是让回答者知道怎么填写 1. 写在封面信中:问卷填答方法简单 1. 单独写在封面信后:要求较多 1. 分散在调查问题后:问题复杂,需做特殊说明 例如: 填写问卷时请不要与他人商量。 请在每一问题后适合自己情况的答案序号上划圈,或在横线处填写上适当的内容。 如无特殊说明,每一问题只能选择一个答案。 若不是,请跳过10-14题,直接从15题开始作答。 家庭人口指长期居住在一起的家庭成员人数。 --- # 问卷设计流程 ## 问题和答案 > 问题和答案是问卷的主体。如何设计问题是问卷设计的关键 1. 开放式、封闭式和半封闭式 1. 事实类、态度类、背景资料类 1. 接触性问题、实质性问题、辅助性问题。 ## 其它信息 > 如问卷编号、调查员编号、审核员编号、调查日期、被调查者住址、被调查者合作情况等 --- # 问卷设计流程 ## 编码 > 给每一个问题及其答案编上数码,目的就是将文字资料转化为数字,便于计算机处理。编码分为预编码和后编码 例如: > BC5 BC5"最高学历"“【CAPI】加载姓名”已经完成的最高学历?【受教育程度选项简表】 >访员注意:如果还未读完小学,请选择“0. 盲/半文盲”。 >0.文盲/半文盲 3.小学 4.初中 5.高中/中专/技校/职高 >6.大专 7.大学本科 8.硕士 9.博士 10.从未上过学 最终变成一个数字:8 = 硕士 --- # 问卷设计流程 ## 探索工作 访谈、观察、查文献等 > 在问卷设计前先摸底,了解被调查对象的基本情况,以便对各种问题的提法和可能的回答有一个初步的认识 收获: 1. 问题的种类形式 1. 可能的回答类型 1. 敏感问题的可接受回答程度 1. 概念的简单化 --- # 问卷设计流程 ## 初稿 卡片法、框图法 1. 根据研究假设和所测量的变量的逻辑结构,列出问卷各个大部分的内容,并安排好它们的前后顺序 1. 一个部分一个部分地将探索性工作中得到的问题及答案写在一张张的卡片上 1. 在每一部分中,安排并调整卡片间的结构和顺序 1. 从总体上对各部分卡片进行检查调整 1. 将满意的结果抄在纸上,并附上封面信等有关内容,形成问卷初稿 --- # 问卷设计流程 ## 试调查 客观检验法 > 在正式调查的总体中抽取一个小样本(如30-50份),进行调查,检查分析调查的结果,从中发现问题和缺陷,并进行修改 关注: 回收率(低于60%有问题)、有效回收率、对未回答问题的分析、对填答错误的分析 主观检验法 > 将问卷初稿送给相关领域的专家、研究人员以及典型的被调查者,请其根据他们的经验和认识,从各个不同的角度和方面直接对问卷进行评论,指出存在的问题和改进的意见 返回修改,直到问卷能得到满意数据 --- # 问卷设计流程 ## 问卷发放 可以利用的发放途径:邮寄、送发、网络 考虑:成本、调查周期、调查内容、回收率和有效率 1. 问题设计突出科学性 1. 回收问卷后,及时检查,是否有漏填、空填和明显错误,保证问卷质量 1. 在调查资料的整理阶段,认真审核 --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 问卷设计技巧 --- # 问卷设计技巧 ## 开放式问题 > 开放式指在问卷上只提出问题,不列出答案,由调查对象自由回答。 由于开放式问卷提问方式不同,又可分为三种类型: 1. 自由回答式 1. 言语联想式 1. 情境导入式 ## 封闭式问题 > 将问题答案全部列出,由被调查者从中选取一种或几种答案的问题 --- # 问卷设计技巧 ## 顺序填写式(等级式) > 列出多种答案要求列出先后顺序或不同等级 例如: 您在当前生产经营中常遇到哪些困难? 请按困难程度给下列问题编号,困难最大的为1,最小的为6 .pull-left[ ( )资金不足 ( )买难卖难 ( )各种摊派过多 ] .pull-right[ ( )缺乏技术 ( )土地划分不当 ( )信息闭塞 ] --- # 问卷设计技巧 ## 矩阵式(表格式) > 同一类型的若干问题共用一组答案 例如: <table class="table table-striped" style="font-size: 16px; margin-left: auto; margin-right: auto;"> <caption style="font-size: initial !important;">你有多频繁地:</caption> <thead> <tr> <th style="text-align:left;"> 问题 </th> <th style="text-align:right;"> 从不 </th> <th style="text-align:right;"> 偶尔 </th> <th style="text-align:right;"> 有时 </th> <th style="text-align:right;"> 经常 </th> <th style="text-align:right;"> 总是 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;font-weight: bold;"> 洗澡 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;font-weight: bold;"> 外出吃饭 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;font-weight: bold;"> 玩手机游戏 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;font-weight: bold;"> 参加体育活动 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;font-weight: bold;"> 出国旅游 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> </tbody> </table> --- # 问卷设计技巧 ## 后续性问题(相倚问题)“跳答” > 有些问题只适用于样本中一部分调查对象,调查对象是否需要回答这一问题,需根据他对前面某个问题的回答结果而定 例如: > BC3“【CAPI】加载姓名”的阳历(公历)出生日期? (1890..调查当前年份)年,(1..12)月,(1..31)日 > 得到BC3B“年龄” > 访员注意输入格式:四位年份—两位月份—两位日期。 > 1 若 BC3B<=6,跳至 BC6;(户口类型) > 2 若 6<BC3B<=10,跳至 BC5;(最高学历) > 3 若 BC3B>10 或缺失,继续提问BC4。(婚姻状况) --- # 问卷设计技巧 ## 逻辑连贯 > 几个部分的调查内容按照逻辑顺序排列,每个部分的题目集中、前后呼应 ## 紧扣理论 > 问题设置要围绕理论假设的检验 例如: 如果已婚者有机会接触到很多可以成为结婚对象的同伴,那么离婚的机会增加。即某种类型的人际交往对婚姻的稳定性产生影响 那就要把“人际交往”的类型问清楚,不能蜻蜓点水 --- # 问卷设计技巧 ## 问题具体 > 问题具体明确,不能提抽象笼统的问题 ## 单刀直入 > 避免复合性问题 ## 通俗易懂 > 即使用的语言要尽量简单。不要用复杂抽象的概念及专业术语,包括缩略语 例如: 您觉得您的家庭是: 1. 核心家庭 2. 主干家庭 …… --- # 问卷设计技巧 ## 客观中立 > 避免倾向性和诱导性问题,社会头衔、权威地位、职业、情感字眼及其题目的提法都会影响被调查者对问题的理解和答案的选择 ## 有话直说 > 不用否定形式提问 ## 通情达理 > 不要直接提敏感性或威胁性的问题 --- # 问卷设计技巧 ## 答案设置 1. 答案的设计要符合实际情况 1. 答案的设计要具有穷尽性和互斥性(MECE) 1. 答案只能按照一个标准分类 1. 程度式答案应按照一定顺序排列,前后须对称 1. 答案和问题相协调 --- # 问卷设计技巧 ## 调查问卷设计三大原则 假设所有答题者都是傻瓜、骗子、杠精、懒蛋。 答案需要的信息量越大,回答问题的成本越大。 设计者想得越多,答题者想得越少。 总之:换位思考,让答题人的用户体验最好。 --- # 问卷设计技巧 ## 设计原则 例1.如何问年龄? 1. 您是哪年出生的?(您的生日是哪天?) 1. 您今年多大?(您的年龄是多大?) 1. 是选择题还是填空题? 1. 选择是从若干范围里选择还是从若干年份选择? --- # 问卷设计技巧 1. 您是哪年出生的?(您的生日是哪天?) + 好处:信息量最大、最不容易误解 + 缺点:答题人嫌麻烦/侵犯隐私;研究者需要根据调查日期算出年龄;农历? 1. 您今年多大?(您的年龄是多大?) + 好处:好填。 + 缺点:是不是虚岁? 1. 是选择题还是填空题? + 选择:答题人不用输入; + 填空:上下滚太长了很烦。 + 起始年份? 1. 选择是从若干范围里选择还是从若干年份选择? + 范围:省事,但是损失信息。你定的范围合理吗? --- # 问卷设计技巧 例2. 我们公众号的文章会不会过长? a. 不会,自己感兴趣的内容会想看更多。 b.会,普遍都过长,阅读成本偏高。 -- 问题: 1. 什么叫“过长”?多长算“过长”? + 态度最不可靠,尽量问行为。如果能不问就知道,更好。 1. 不论是问题还是选项,都不能设置成复合句。 + 如果我觉得不会,但是原因不是你写的这个,怎么办? 1. 理解问题步骤太多。 + 你说的是全部文章还是部分文章?部分文章是多大部分文章? + 我是不是需要回忆过去阅读的全部文章,还是只是近来的文章? --- # 问卷设计技巧 ## 要避免 1. 问卷内容太多 1. 问卷难度较大 1. 问卷版面过密 1. 条目逻辑混乱 .pull-left[ 主观因素 1. 畏难情绪 1. 顾虑重重 1. 漫不经心 1. 毫无兴趣 ] .pull-right[ 客观因素 1. 阅读能力的限制 1. 理解能力的限制 1. 表达能力的限制 1. 记忆能力的限制 1. 计算能力的限制 ] --- # 问卷设计技巧 ## 读写数据 ```r dt <- mtcars[1:3, 1:3] # install.packages("readr") readr::write_csv(dt, "dt1.csv") # readxl::read_xlsx("abc.xlsx") readr::read_csv("dt1.csv") ``` ``` ## # A tibble: 3 x 3 ## mpg cyl disp ## <dbl> <dbl> <dbl> ## 1 21 6 160 ## 2 21 6 160 ## 3 22.8 4 108 ``` --- # 问卷设计技巧 ## 读写数据 ```r dt <- letters # install.packages("readr") writeLines(dt, "dt2.txt") readLines("dt2.txt") ``` ``` ## [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s" ## [20] "t" "u" "v" "w" "x" "y" "z" ``` --- # 问卷设计技巧 ## R Markdown Knit 一下试试吧! ```r # install.packages("officedown") # install.packages("officer") ``` --- # 问卷设计技巧 ## R project ```r getwd() ``` ``` ## [1] "D:/nuts/1-teaching/cupl/survey" ``` ```r # list.files() # setwd() # writeLines(dt, "output/dt2.txt") ```