class: center, middle, inverse, title-slide .title[ # 访谈法 ] .subtitle[ ## 社会调查方法——第6讲 ] .author[ ### 李代 ] .institute[ ### 中国政法大学社会学院 ] .date[ ### 2023-04-18 ] --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 访谈法 ## 访谈法实例 ## 访谈法的类型 ## 访谈实施技巧 --- # 访谈法实例 <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:95%; overflow-x: scroll; width:100%; "><table class="table table-striped" style="font-size: 12px; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> 序号 </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> 姓名 </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> 调查名称 </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> 年份 </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> 抽样方法 </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> 卢美旭 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=60493698" style=" ">北京市老年人焦虑症状调查</a> </td> <td style="text-align:left;"> 2010-2011 </td> <td style="text-align:left;"> 方便取样 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:left;"> 覃淑敏 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=21730386" style=" ">网民社会意识调查——政治心理与态度调查</a> </td> <td style="text-align:left;"> 2018 </td> <td style="text-align:left;"> 自然抽样 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:left;"> 瓦扎作古 </td> <td style="text-align:left;"> <a href="http://www.ciidbnu.org/chip/chips.asp?year=2007" style=" ">中国城市、农村和流动人口居民收入调查</a> </td> <td style="text-align:left;"> 2007-2008 </td> <td style="text-align:left;"> 多级抽样、分层抽样 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:left;"> 李依彤 </td> <td style="text-align:left;"> <a href="https://www.bjprint.net/s/zyyg/03y5.pdf" style=" ">中国公民科学素质抽样调查</a> </td> <td style="text-align:left;"> 2014 </td> <td style="text-align:left;"> 多阶段抽样、简单随机抽样 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:left;"> 陈玉杰 </td> <td style="text-align:left;"> <a href="http://www.bsc.cas.cn/jlyd/ywyj/202107/P020210713562202736778.pdf" style=" ">中国公民科学素质抽样调查</a> </td> <td style="text-align:left;"> 2020 </td> <td style="text-align:left;"> 分层多阶段不等概率PPS抽样方法 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:left;"> 黄麟茹 </td> <td style="text-align:left;"> <a href="http://www.ciidbnu.org/chip/index.asp" style=" ">中国家庭收入调查</a> </td> <td style="text-align:left;"> 2002 </td> <td style="text-align:left;"> 分层 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:left;"> 车蕾 </td> <td style="text-align:left;"> <a href="NA" style=" ">中国家庭收入调查</a> </td> <td style="text-align:left;"> 2013 </td> <td style="text-align:left;"> 系统抽样 </td> </tr> <tr> <td style="text-align:right;font-weight: bold;"> 8 </td> <td style="text-align:left;font-weight: bold;"> 田甜 </td> <td style="text-align:left;font-weight: bold;"> <a href="https://opendata.pku.edu.cn/dataverse/CFPS" style=" ">中国家庭追踪调查</a> </td> <td style="text-align:left;font-weight: bold;"> 2010 </td> <td style="text-align:left;font-weight: bold;"> 多阶分层抽样 </td> </tr> <tr> <td style="text-align:right;font-weight: bold;"> 9 </td> <td style="text-align:left;font-weight: bold;"> 周晓倩 </td> <td style="text-align:left;font-weight: bold;"> <a href="NA" style=" ">中国家庭追踪调查</a> </td> <td style="text-align:left;font-weight: bold;"> 2010 </td> <td style="text-align:left;font-weight: bold;"> 内隐分层(implicit stratification)方法抽取的多阶段概率样本(multi-stage probability sample) </td> </tr> <tr> <td style="text-align:right;"> 10 </td> <td style="text-align:left;"> 郭蕊 </td> <td style="text-align:left;"> <a href="https://opendata.pku.edu.cn/file.xhtml?fileId=142&version=1.1" style=" ">中国健康与养老追踪调查</a> </td> <td style="text-align:left;"> 2011 </td> <td style="text-align:left;"> 分层抽样 </td> </tr> <tr> <td style="text-align:right;"> 11 </td> <td style="text-align:left;"> 邵钰烨 </td> <td style="text-align:left;"> <a href="http://charls.pku.edu.cn/" style=" ">中国健康与养老追踪调查</a> </td> <td style="text-align:left;"> 2013 </td> <td style="text-align:left;"> 多阶段的PPS聚类抽样方法 </td> </tr> <tr> <td style="text-align:right;"> 12 </td> <td style="text-align:left;"> 蔡林玲 </td> <td style="text-align:left;"> <a href="https://charls.charlsdata.com/Public/ashelf/public/uploads/document/2014-charls-wave3/application/CHARLS_Life_History_Questionnaire.pdf" style=" ">中国健康与养老追踪调查</a> </td> <td style="text-align:left;"> 2014 </td> <td style="text-align:left;"> 按人口规模成比例的概率抽样,简称为PPS抽样 </td> </tr> <tr> <td style="text-align:right;"> 13 </td> <td style="text-align:left;"> 韩佐艳 </td> <td style="text-align:left;"> <a href="NA" style=" ">中国健康与养老追踪调查</a> </td> <td style="text-align:left;"> 2015 </td> <td style="text-align:left;"> 概率抽样中的简单随机抽样方法 </td> </tr> <tr> <td style="text-align:right;"> 14 </td> <td style="text-align:left;"> 展润杨 </td> <td style="text-align:left;"> <a href="https://charls.charlsdata.com/pages/Data/2018-charls-wave4/zh-cn.html" style=" ">中国健康与养老追踪调查</a> </td> <td style="text-align:left;"> 2018 </td> <td style="text-align:left;"> 采用分层(按城区和农村各县人均GDP)多阶段(县/区-村/社区户)PPS随机抽样策略 </td> </tr> <tr> <td style="text-align:right;"> 15 </td> <td style="text-align:left;"> 陈远泽 </td> <td style="text-align:left;"> <a href="http://ceps.ruc.edu.cn/" style=" ">中国教育追踪调查</a> </td> <td style="text-align:left;"> 2013-2014 </td> <td style="text-align:left;"> 多阶段的概率与规模成比例(PPS)的抽样方法 </td> </tr> <tr> <td style="text-align:right;"> 16 </td> <td style="text-align:left;"> 吴若愚 </td> <td style="text-align:left;"> <a href="NA" style=" ">中国教育追踪调查</a> </td> <td style="text-align:left;"> 2014-2105 </td> <td style="text-align:left;"> 调查采用多阶段的概率与规模成比例(PPS)的抽样方法 </td> </tr> <tr> <td style="text-align:right;"> 17 </td> <td style="text-align:left;"> 邢璐 </td> <td style="text-align:left;"> <a href="NA" style=" ">中国老年健康影响因素跟踪调查</a> </td> <td style="text-align:left;"> 1998-2005 </td> <td style="text-align:left;"> PPS调查 </td> </tr> <tr> <td style="text-align:right;"> 18 </td> <td style="text-align:left;"> 王浩艳 </td> <td style="text-align:left;"> <a href="NA" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2010 </td> <td style="text-align:left;"> 随机抽样-分层抽样法 </td> </tr> <tr> <td style="text-align:right;"> 19 </td> <td style="text-align:left;"> 胡镜辰 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=85111874" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2012 </td> <td style="text-align:left;"> 多阶分层抽样 </td> </tr> <tr> <td style="text-align:right;"> 20 </td> <td style="text-align:left;"> 叶紫欣 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=93281139" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2013 </td> <td style="text-align:left;"> 多阶分层抽样 </td> </tr> <tr> <td style="text-align:right;"> 21 </td> <td style="text-align:left;"> 刘佳慧 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=62072446" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2015 </td> <td style="text-align:left;"> 多阶段、分层、PPS随机抽样 </td> </tr> <tr> <td style="text-align:right;"> 22 </td> <td style="text-align:left;"> 朱嘉乐 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=94525591" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2017 </td> <td style="text-align:left;"> 多阶分层抽样 </td> </tr> <tr> <td style="text-align:right;"> 23 </td> <td style="text-align:left;"> 张广超 </td> <td style="text-align:left;"> <a href="http://cnsda.ruc.edu.cn/index.php?r=projects/view&id=25075603" style=" ">中国综合社会调查</a> </td> <td style="text-align:left;"> 2018 </td> <td style="text-align:left;"> 多阶分层抽样 </td> </tr> </tbody> </table></div> --- # 访谈法实例 <img src="image/hw1.png" width="2788" /> --- # 访谈法实例 ## 作业2(15%) .pull-left[ 1. 访谈一个亲戚 + 性别 + 年龄 + 教育程度 + 职业 1. 讲述一件改变他/她人生的事 1. 解释为什么这件事改变人生 + 受访者认为这件事为什么/怎么改变人生? + 你认为这件事为什么/怎么改变人生? 1. 指出受访者可能存在的偏见、错误归因等 ] .pull-right[ 1. 提交 + 截止时间:2022-05-09 23:59 + 文件格式:docx,xlsx,rmd,pdf均可 + [提交链接-点我](https://send2me.cn/60FUwUId/Sh6MvAoF0YvAuQ) 1. 评分标准 + **认真**完成作业要求 = 12 + 体现社会科学视角:+3 ] --- # 访谈法实例 ## 教育研究 [刘云杉.自由选择与制度选拔:大众高等教育时代的精英培养——基于北京大学的个案研究.北京大学教育评论,2017,15(04):38-74+186.](image/liuyunshan.pdf) 本文基于北京大学的本科教学改革,从学生的自由选择与制度的严格选拔入手,聚焦于大众高等教育下精英培养的过程。本文分析了招生、人才培养与教学计划以及考试评价等制度,揭示出精英选拔的多重逻辑,广泛涉猎下的课程数量膨胀,严苛考评权力下的竞争主义,个体的理性经营和表现技艺。更进一层次,本文反思了在工具理性与消费主义侵蚀下校园的断裂、师生关系的异化以及教育本质的空洞。最后讨论了学生在自由选择的试错中所形成的性情特征。 --- # 访谈法实例 ## 访谈对象 笔者做了大量的访谈、座谈,访谈对象包括6个院系负责本科生教学的院长、 5名学校招生与教学部门的领导,还组织了18场次涵盖6个学部、63名本科毕业生的焦点团体座谈……并在此基础上做了24个深度个案。 --- # 访谈法实例 ## 访谈案例 > 从不翘课,多做往年的考题,平时多找老师答疑。用尽洪荒之力专业成绩达到70多分。再用大类平台课的成绩拉高绩点;用通选课、政治课让自己绩点更高。策略是精心选课,尽量扬长避短,打听好哪一门课给分好……最后GPA还可以。 > ——(FG07-2,某省高考理科前10名) > 学生总体学习能力下降,会背着书包上课,课下读书却不会;减了学时后,他不 是说这部分没讲,我自己去研究学习;而是闲着也是闲着,我去读个双学位,经济这么热,就读个经济双学位吧。一届160个学生,修经双的有50多个,占三分之一。最有可能的是,学不下去的人,没有目标的人会分流。 > ——(D03,FG07-2的院长) --- # 访谈法实例 ## 社会学视角 > 专业课要从80多学分压缩到60学分以下,只能精炼出最核心的部分,这是专业教育的最低要求。学院目前大概有四分之一的学生会继续做科研,他们会多选择学 些本专业课程——并不是要把他们都培养成科学家,培养专家的思维已经变了。挤出来的学分在理学部内部任选其他学科课程,组成不同套餐。但有学生喜动脑不喜欢动手,强硬要求他们上实验课就很难适应——不能为交叉而交叉,为跨学科而跨学科。强调尊重学生选择,但所有学科都有门槛,进入都有困难,如果怕过不了门槛就转专业,这将是个大问题。总之,大学四年,掐头去尾,在不到三年的时间里,如何又搞通识又搞专业…… > 事与愿违,教学计划中学分压缩后,学生却更忙了。这背后是专业教育与通识教育结合的艰难。通识教育是与专业教育并列的另一套知识体系吗?是靠跨专业、跨学科学习去实现的吗?院系与专业的壁垒可以靠学生对课程的自主选择去突破吗? --- # 访谈法实例 ## 概念 访谈法 > “访谈法”(interview),也叫“访问法”,是调查员运用有目的、有计划、有方向的口头交谈方式向被调查者了解社会事实的方法 1. 具有显著的目的性、计划性和方向性 1. 是以现场的口头交谈作为了解社会事实的主要方式 1. 访谈法的运作过程同时是一个直接的人际交往和人际沟通的过程 --- # 访谈法实例 ## 特点 .pull-left[优点: 1. 回答率大大高于问卷法 1. 能对搜集资料的过程进行有效控制语言环境(避免代答)、沟通过程(问题)、错误发生 1. 不仅能收集其他调查方法所能收集的资料,而且能通过与被访者相互刺激与互动得到其他调查方法没有的资料 ] .pull-right[缺点: 1. 调查成本更大 1. 匿名性差 1. 对访谈员的依赖 1. 个人印象失败、交际失败、询问误差、查究错误、引导误差、理解错误、记录错误、对象偏见错误、有意欺骗 1. 受访员影响 1. 访谈过程通常过于急迫,并易受当时环境的烦扰 1. 标准化程度较低,资料记录难度大 ] --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 访谈法的类型 --- # 访谈法的类型 ## 访谈方式 直接访谈:面对面 间接访谈:电话、网络 --- # 访谈法的类型 ## 访谈人数 .pull-left[ 个别访谈 对访谈对象逐一进行单独访谈的方式 一个访员和一个受访者 适用于:敏感性问题和深度问题的访问 访员对访谈效果影响显著 ] .pull-right[ 集体访谈 访谈者在一次访谈中同时与多个访谈对象进行交谈的方式 1-3名访员和6-10个受访者 常见形式:座谈会、调查会 适用于:团体心理治疗、社会工作、政策咨询等 访员:协调谈话的方向和节奏,不发表意见 群体压力,产生从众行为 不利于保密,不适合敏感问题的调查 ] --- # 访谈法的类型 ## 访谈内容 .pull-left[ 结构式访谈 按照预先设计好的测量工具(调查表或调查问卷)、谈话程序和谈话方法进行的访谈 高度控制、高度标准化: 选择受访者的标准和方式一致 访谈内容相同 提问顺序、提问方式、记录方式相同 如需解释,须按照访员手册上的统一规定进行解释 有些,访谈的时间、地点、周围环境等也要求一致 ] .pull-right[ 非结构式访谈 事先不规定任何要问的问题,也不规定资料调查的大致范围,而仅仅确定一个资料搜集的主题或题目,使访谈者和被访者都可充分自由地、不受限制地交谈的方法 适用于:深度了解受访者的心理、态度和行为 访员起辅助性作用,但素质要求高 ] --- # 访谈法的类型 ## 非结构式访谈——半控制 > 访员对访谈程序、访谈方法和测量工具有一定控制,但同时允许受访者积极参 与的一种访谈形式 调查提纲:调查内容范围、提问方向、若干主要问题 其他问题要求在交谈过程中形成 除少数封闭式问题,大部分问题是开放式的 提问方式具有充分的机动性、灵活性,可适当增减 深度访谈、重点访谈、焦点小组 --- # 访谈法的类型 ## 深度访谈 > 深度访谈能够发现被访者给出针对某一问题具体回答的详细背景原因。该方法能够获得被访者在观点、价值观、动机、记忆、经验,以及情感等方面的信息。 1. 1v1,面访 1. 访问时间比较长(1h-1.5h) 1. 要求访问员有很高的访谈技术和追问刺探技术 1. 可对被访者的非语言反应进行较长时间的观察 1. 访谈的结果很大程度上依赖于访问员 1. 样本量通常比较小 --- # 访谈法的类型 ## 重点访谈 > 集中于某一经验及其影响的访谈。先将访谈对象安排到预先设计好的情境中,如看一场电影、听一段音乐、读一篇文章,然后访谈他们对情境的认识和解释 原理:刺激——反应,需要研究者对情境过程的主要因素、模式及条件结构等进行深入分析,设计一般假设,编制相关问题,然后搜集个人反应经历或特殊情感资料。 ## 焦点小组 > 研究所确定的全部观察对象(总体)中抽取一定数量的观察对象组成样本,根据样本信息推断总体特征的一种调查方法 能够看到小组成员之间的互动,帮助理解研究问题在社会情境中的意义。 --- class: center, middle, inverse <!-- background-image: url("images/cool.png") --> # 访谈实施技巧 --- # 访谈实施技巧 ## 选择访谈方式 1. 验证理论假设 → 结构式访谈 1. 了解态度或看法 → 半结构式访谈 1. 探索 → 无结构式访谈 --- # 访谈实施技巧 ## 访谈工具 1. 结构式访谈 → 访问表或访问问卷 1. 半结构式访谈 → 访问提纲 1. 无结构式访谈 → 访谈主题或范围 --- # 访谈实施技巧 ## 访员手册 1. 结构式访谈 → 强调提问的方式、程序、答疑的一致性 1. 半结构式访谈 → 强调访员的开放心态和捕捉有价值信息的能力 1. 无结构式访谈 → 强调访员的开放心态和捕捉有价值信息的能力 --- # 访谈实施技巧 ## 访谈准备 1. 个案调查,根据研究需要选择受访者 1. 典型调查,选择典型意义的受访者 1. 抽样调查,采用概率抽样或非概率抽样的方式选择受访者 适当了解受访者 1. 一般背景,如,性别、年龄、职业、文化程度、家庭背景等 1. 行为心理特点,如,性格、语言习惯、认知水平、兴趣爱好等。 --- # 访谈实施技巧 ## 访谈安排 计划好访谈的时间、地点和场合 确定应以被访者方便为主要原则 1. 何时访谈、时间花费。 1. 何时:工作、家务空闲、心情舒畅的时候 1. 时间段:个别访谈(< 1小时),集体访谈。 地点:走出去(个别)、请进来(集体)、相约(公共场合) 场合:无外人干扰 --- # 访谈实施技巧 ## 访谈员的选择 访员的数量 1. 课题的性质(长期、短期) 1. 单次访谈所需的时间 1. 样本的大小 1. 受访者的分布状况 访员的质量 1. 教育程度 1. 语言能力(方言) 材料: 1. 介绍信、相关证件 1. 受访者的名册清单 1. 笔、纸、照相机、录音机或笔、录象机等 --- # 访谈实施技巧 ## 初步接触 .pull-left[ 条件允许,有引见者,容易快速建立信任关系; 如果没有引见者,需要技巧; 礼貌地表明来意,并出示相关证件; 主动谈谈受访者熟悉的事物,唠家常; 运用权威,来引起受访者的重视和接纳; 称呼要恰当。 ] .pull-right[ 介绍研究课题,并说明调查的重要性和权威性; 告诉受访者他是如何被选中作为受访者的; 告知受访者最好使用什么语言回答问题; 介绍进行交谈的规则;(有疑问;可否求助他人) 向受访者表明志愿原则和保密原则; 征询受访者使用音像设备的态度。(录音负面影响) ] --- # 访谈实施技巧 ## 控制访谈 1. 如何提问——提问的技巧 1. 如何追问——追问的技巧 1. 如何引导——引导的技巧 1. 对访员非言语行为的控制 1. 对无回答现象的处理 --- # 访谈实施技巧 ## 追问 1. 直接追问:重述原先问题,直接点明没回答到的方面要求补充 1. 延续追问:接着受访者的回答,提出进一步的问题 1. 迂回追问:询问与此相关联的问题,来获得对此问题的完整答案 1. 补充追问:只追问那些不清楚的部分或问题 1. 系统追问:需要进一步深入了解某一事件,按项目逐项追问 1. 反感追问:“激将法”示受访者回答的矛盾,使其情绪激动吐真言 --- # 访谈实施技巧 ## 引导 跑题: 正面的:“对不起,您刚才谈的问题我们可以一会儿再谈,下面我想了解的是…” 迂回的:“您刚才谈的我很感兴趣,那么,您对…是怎么想的呢?” 倒茶、递水等,借机打断话题,引导谈正题 换题: 解释性说明的方法,简单介绍下一主题 过渡性问题的方法,自然进入下一主题 中断: 概括中断前的谈话内容,引出被中断的话头 重新提出一个具有延续作用的问题,接上被打断的话头 --- # 访谈实施技巧 ## 集体讨论 冷场 1. 与会者不知从何谈起——先提简单问题 1. 怯场,不愿打头炮——物色带头发言者 讨论过于激烈 1. 漫无边际 1. 与会者之间争论过于激烈 及早发现及早控制、引导 --- # 访谈实施技巧 ## 控制自我 > 非言语行为的控制,是指访谈员通过自己的各种表情与动作,来表达一定的思想、感情,从而达到对访谈过程的控制 表情;体态语言 1. 要表现出礼貌、虚心、诚恳、耐心、感兴趣的表情 1. 访谈员的表情要适合被访者回答的内容。要对被访者回答的喜怒哀乐表示出同感 1. 要恰当地用眼, 既不能只顾低头记笔记,忽视被访者的存在,也不能一直盯着被访者。要在这二者中找一个适当的位置 1. 专心地用耳。听被访者回答时,一定要专心,不能随随便便,以免影响被访者谈话的情绪 --- # 访谈实施技巧 ## 访谈记录 当场记录与访后记录相结合 访谈记录的最理想方法是:进行访谈现场录音,但这一定要事先征得被访者的同意。如果不同意,安排专人做记录 对受访者讲述的事件、列举的实例,特别是事件或实例中的时间、地点、人物、状况、性质等要尽量完整地记录 对受访者关于某一问题所表示的观点、对某一现象的主要态度、见解等,要准确地记录,并且最好能记下他的原话,而不要用自己的话去“概括”或“归纳” 对于受访者在回答中的一些过渡性语言、承接性语言、重复性语言、口头语等等,则不要记 记录时,对不同问题的回答.以及对不同的事件、不同的方面、不同的内容等等的回答,都要在形式上明显地分开,各自形成单独的一段 还要记非言语性信息(表格),语气、神情、动作等 --- # 用R处理文本 ```r # install.packages(tidyverse) # install.packages(qdapRegex) library(tidyverse) teacher <- c("李代", "罗翔") ask1<- c("尊敬的") ask2<- c("老师,您好!我是中国政法大学法学院的一名本科生,想报名参加挑战杯……") invitation <- stringr::str_c(ask1, teacher, ask2) writeLines(invitation, "invitation.txt") ``` --- # 用R处理文本 假设1=副教授,2=教授。 ```r dt_teacher <- data.frame(teacher =c("李代", "罗翔"), teacher_title = c(1, 2)) ask1_1<- c("尊敬的") ask1_2<- c("敬爱的") ask2_1 <- c("副教授,您好!我是中国政法大学法学院的一名本科生,想报名参加挑战杯……") ask2_2 <- c("教授,您好!我是中国政法大学法学院的一名本科生,想报名参加挑战杯……") dt_teacher$invitation <- ifelse(dt_teacher$teacher_title == 1, str_c(ask1_1, dt_teacher$teacher, ask2_1), str_c(ask1_2, dt_teacher$teacher, ask2_2)) writeLines(dt_teacher$invitation, "invitation.txt") ``` --- # 用R处理文本 使用通配符(regular expression),可以实现很多有趣的功能。 ```r library(qdapRegex) # cheat() student <- c("2023年,我校共招收本科生20231名……", "在2022年,我校招收本科生20222人……") student %>% str_detect("2023") ``` ``` ## [1] TRUE FALSE ``` ```r year <- student %>% str_extract("2.*年") %>% str_remove("年") student_number <- student %>% str_extract("[0-9]*[名|人]") %>% str_remove("名|人") correct_text <- student %>% str_replace("我校", "中国政法大学") cupl_student_number <- data.frame(correct_text, year, student_number) ```