【DiVoMiner研究方法课6】做大数据内容分析时,不可不做信度测试!

2021-04-12 | 学术研究

导读:无论是传统的内容分析法还是大数据内容分析法,我们都需要两位或以上数目的编码员来进行编码工作,这些独立的编码员对一段信息或记录内容的特征(也就是记录单位)作出判断,并且达到一致的结论。这种一致性以量化方式呈现,称之为编码者间的信度。

 

上一讲我们介绍了什么是大数据技术辅助内容分析法,这一讲我们再来介绍一下使用大数据内容分析法中,一个非常关键、不可或缺的步骤——信度测试。

有的读者认为,使用大数据内容分析法,就是拿到数据后就可以直接编码。但没有经过信度测试的数据,真的能说服人吗?下面,让我们一起来看看,到底信度测试为什么如此重要。

什么是信度测试?

信度是指在研究过程中,测量数据所独立于测量工具的程度。即不同的研究者对同一现象进行重复测试后,所产生结果的一致程度。[1]
也就是说,如果测量过程要进行两次或多次,所得出的结论应该是类似的,这确保了内容分析的有效性或可靠性。
信度的测试可以在科学抽样的基础上进一步防范研究者对数据产生的影响,编码员之间信度可保证对数据较为一致的处理,使研究结果更为客观。 

什么是编码间的信度?

在大数据内容分析中,我们需要两位或以上数目的编码员来进行编码工作,这些独立的编码员对一段信息或记录内容的特征(也就是记录单位)作出判断,并且达到一致的结论。这种一致性以量化方式呈现,称之为编码者间的信度[2]
既然大数据内容分析的其中一个目标是相对客观地界定及记录信息的特征,那么信度就攸关重要。没有建立信度,大数据内容分析的测量只是空谈[3]。 

为何信度如此重要?

编码者间的信度是衡量研究质量的标准,编码者之间的高度差异性表示薄弱的研究方法,包括差劲的操作定义、类目和编码训练[4]。通常我们研究的信息有显性的内容(manifest content)隐性的内容(latent content)。对于显性的内容,例如版面面积或者消息来源,很容易以客观的判断来达至高度一致性。但是,对于隐性的内容来说,例如报道态度或者价值观,编码员必须根据他们自己的思维系统作出主观的诠释。这样的话,编码员之间的相互主观判断变得更加重要,因为这些主观的判断结果要尽可能也让其他读者有相似的认知[5]
从现实的角度来看,编码员间的信度至为重要,因为高信度意味者决策者作出错误决策的机会相对减少[6]。编码员间的信度乃衡量一个内容分析研究效度的必要条件(虽然不是充分条件),没有信度,那么,该研究的结论便值得怀疑,甚至显得毫无意义。 

怎么做信度测试?

可以利用必要的工具来计算信度指标,如手动(利用公式计算)或计算机程序。 我们以大数据内容分析法中进行编码员之间信度评估为例,具体的操作步骤如下:
第一,依据编码薄制作编码指引,编码指引需明确统一。帮助编码员熟悉议题,理解编码类目,保证所有编码员均理解类目所指代的含义。
第二,进行编码测试。选取少量样本作为测试编码之用的样本,这部分样本的测试编码过程中,各编码员需独立编码,不能相互讨论或指导。若使用了机器编码,则直接执行机器编码的信测测试(DiVoMiner®上只需点击该按钮即可一键完成机器编码的信度测试)。
第三,进行编码校正。测试编码结果如果未能达到理想信度,需重新测试编码。重新测试之前,对编码员再次进行培训和指导,尤其针对编码结果差异较大之类目,需再次给予说明。若有机器编码的部分,则需重新检查并修正编码簿各选项的关键词,尽可能完善类目的选项,再重新执行机器编码信度测试。
第四,正式编码。当所有编码员达至理想信度,即可开始正式编码。
编码员及机器编码信度测试流程
一个完整的信度报告应该包括以下信息:
  • 信度分析的样本数及理由。
  • 信度样本与总样本的关系:是总样本的一部分还是额外样本。
  • 编码员资料:人数(须为2或更多)、背景,研究员是否也是编码员。
  • 每名编码员的编码数量。
  • 信度指标的选择和理由。
  • 每个变量的编码员间之信度。
  • 编码员的训练时间。
  • 在总样本的编码过程中遇到不同意见时的处理方式。
  • 读者可以在哪里得到详细的编码指引、程序和编码表。
  • 要报告每一个变量的信度水平,不要只报告所有变量的整体信度。
小提示 

目前,大概有39种不同的同意度指标[7],传播学界常用的有Percent agreement,Holstis Coefficient Reliability,Cohens kappa(k),Scotts pi(π),Cohens kappa(k),Krippendorffs alpha(α)。Holstis Coefficient Reliability是当前最流行的指标。

 

那么,怎么计算信度呢?

根据公式手动计算或者运用工具计算,比如专门的信度结果计算软件或小程序(AGREE, PRAM, ReCal),或统计分析软件自带的一些信度结果计算功能(SPSS)。

 

参考文献

[1] 艾尔·巴比(2005)。社会研究方法。邱泽奇,译。北京:华夏出版社,137-140;迈克尔·辛格尔特里(2000)。大众传播研究: 现代方法与应用。刘燕南,等,译。北京:华夏出版社,94-97;Zeller, R. A. (1979). Reliability and validity assessment. Beverly Hills, CA: Sage, 12.

[2] Lombard, M., Snyder-Duch, J., & Bracken, C. C. (2004). A call for standardization in content analysis reliability. Human Communication Research, 30(3), 434-437.

[3] Neuendorf, K. A. (2002). The Content Analysis Guidebook. Sage Publications Inc., California.

[4] Kolbe, R. H. & Burnett. M. S. (1991). Content-analysis research: an examination of applications with directives for improving research reliability and objectivity. Journal of Consumer Research, 18(2), 243-250.

[5] Potter, W. J., & Levinedonnerstein, D. (1999). Rethinking validity and reliability in content analysis. Journal of Applied Communication Research, 27(3), 258-284.

[6] Rust, R. T., & Cooil, B. (1994). Reliability measures for qualitative data: theory and implications. Journal of Marketing Research, 31(1), 1-14.

[7] Popping, G. (1988). Stone parting device. EP0283674.

最新动态

博易代表应邀出席两大重要传播学会议并发表主旨演讲

近日,博易代表应邀出席两大重要传播学会议——亚太传播论坛2020和第五届中国公共关系学术年会,并分别在会上发表主旨演讲。亚太传播论坛嘉宾与各校师生合照第五届中国公共关系学术年会与会专家学者合照亚太传播论坛2020暨亚太传播论坛联盟成立大会于2020年10月24-25日在珠海横琴·澳门青年创业谷及澳门大学澳门研究中心举行,此会议由亚太传播交流协会(APCEA)主办,是新冠肺炎疫情以来澳门主办最重要的国际传播会议之一。博易代表应邀出席会议并发表题为《为什么大资料在研究方法论中很重要:从传统到创新?...

连接琴澳创新科技合作的秘诀是什么?

2020年10月28日,由三一(珠海)投资有限公司及珠海市青年创业协会主办的珠澳科技创新合作论坛暨招商成果发布会在珠海横琴新区三一南方总部大厦举行,澳门互联网研究学会会长、珠海横琴博易数据技术创始人兼总裁张荣显博士应邀出席,与珠澳两地专家学者及企业家等共同解读珠澳创新合作新机遇。 论坛出席嘉宾合照 论坛现场 当日,张荣显博士在论坛上发表题为《用数据架起琴澳科技合作的桥梁》的主题演讲。 易研张荣显博士...

长假之后,聊聊双节假期的热点和槽点

疫情稳定之后,等来了中秋加国庆,相信大家都度过了一个愉快的假期,那么今年国庆的哪些地区或景点较为受大家追捧呢? 为此,小编整理了9月30日至10月8日的微博数据,为大家梳理下国庆长假期间的热点。   01  今年长假旅游有哪些热门? 热门地区——江浙沪、西南、西北、北京、广东皆为大热门 据文旅部数据中心统计,国庆假期前七天,全国共接待国内游客6.37亿人次,实现旅游收入4665.6亿元。今年地处大西北的陕西、甘肃也成为微博上讨论热门旅游地区,有网友戏称“大西北堵骆驼”。 热门景区——双“黄”最热门...

【DiVoMiner x 浸大】社媒品牌分析比赛获奖作品赏析

这学期,香港浸会大学传理学院传播系的同学们,以“社交媒体品牌分析”为题举办数据分析比赛。一个月时间内完成分组报告,为指定品牌进行社交媒体运营分析及制定一系列商业数字传播策略。   本次比赛由DiVoMiner®与香港浸会大学传理系课程合作,利用社交媒体数据集(Facebook、Instagram、YouTube、Office Website、Mobile App),同学们使用DiVoMiner®文本大数据挖掘与分析平台作为分析工具。   “Digital Report...

张荣显博士应邀到浙江越秀外国语学院作讲座

2019年10月23日,澳门互联网研究学会会长、易研方案总裁兼博易数据创始人张荣显博士应邀到浙江越秀外国语学院网络传播学院作题为《人工智能与文本数据研究方法新路径》的讲座,分享了系统、科学、严谨的大数据技术辅助在线内容分析法在网络文本大数据研究中的实践和应用。 以下文章来源:微信公众号“长三角网络新舆情”,作者陈徐来,标题《张荣显博士来我校讲座》 讲座相关...