摄影师:宋艺
数字痕迹:心理科学研究的新数据、资源和工具
顾潇 雷雳
现如今,越来越多的技术保留了人们行为的数字痕迹,比如网站访问、电视观看记录、产品评论、社交媒体评论等等。研究者Rafaeli、Ashtar和Altman(2019)认为在心理学研究中使用数字痕迹有扩大被试群体、节约研究花费、避免主试效应三大优点。虽然心理学家们在实际研究中应用数字痕迹面临着一些挑战,比如在统计前清洗数据、考虑采样偏差、解决伦理问题、缺乏计算机技能等,但只要克服了这些挑战,心理学家们将在这个研究领域大有可为。当前,研究者可以通过应用程序编程接口或者爬虫技术在数据平台收集数据;使用各种传感器,如可穿戴设备、智能手机等采集数据;或通过和组织合作获取数据。在对数据进行转录后,研究者可以使用特定的自动化工具对数字痕迹信息进行分析,主要的分析工具包括计算机辅助文本分析、词典分析、深度学习以及情绪分析。计算机辅助文本分析主要用于对书面文本的分析,它依赖于预定义的术语词典来识别词簇和主题,同时具有语言查询和单词计数的功能,可以对预定义类别内的文本进行单词计数(例如,计算与权力或情感相关的词语)。词典分析则可以通过在文本分析中加入语法结构来细化分析,例如使用词汇补语将“不生气”和“非常生气”等文本区分开来。目前最先进的文本分析方法是深度学习(或机器学习),这种方法指的是通过计算来训练机器自动编码信息。具体的操作是使用数据样本来训练计算机将内容分类,并多次验证。情绪分析则是通过分析文本来研究情绪,比如识别发布在社交网站中帖子的情绪、自动评估个性特征等。许多计算机领域的学者已经利用数字痕迹进行了很多传统心理学范畴内的课题研究,心理学家的加入将有助于提升这些研究的理论价值。
资料来源:
Rafaeli, A., Ashtar, S., & Altman, D. (2019). Digital Traces: New Data, Resources, and Tools for Psychological-Science Research. Current Directions in Psychological Science. 28(6),560 –566.