文/张怡昕
本文原刊登于《举目》官网言与思专栏2016.04.25
科研是我工作中很重要的一部分。我的研究内容,主要是关于资讯技术对使用者的影响。
要点赞多还是原创多?
最近我和合作者在修改一篇研究文章,是关于Pinterest式的无限下拉用户接口,对使用者的影响。
这个研究的核心发现是,当网站从翻页式的用户接口,改版到Pinterest式的无限下拉式用户接口后,网站用户给别人的分享点出的赞更多了,但是用户原创性的分享却减少了。(注1)
我们的解释是,当接口改变成无限下拉之后,用户不需要点击下一页去翻页,也不需要等待下一页内容的下载(load),所以更容易在阅读体验中有流畅(flow)感,而不知不觉地读更多……
读得多,遇到自己喜欢的内容的可能性,就更高了,于是给出了更多的赞。
可是,人的注意力(attention)是个有限的资源,当用了更多的注意力在阅读别人的分享上时,可以用来做原创性分享的注意力资源就少了,于是原创性的分享就少了。
对于网站而言,用户的原创性分享和用户对他人的评论,都是很重要的用户贡献。但改成无限下拉的用户接口时,对这两者的影响是一负一正。
值得做一个研究吗?
其实上面的这些发现和推理听起来是蛮简单的。那么,为了检验这么简单的事情,值得做一个研究吗?
其实研究很多时候,不是为了“讲一个复杂的事情”而去讲复杂的事。研究的关键是,事实到底如何。研究者是要凭事实来说话的,而不是摸摸脑袋想当然。
如果一个研究者只是说,我觉得如何如何,我认为如何如何,却不能够用资料来证实他/她的想法,那么我们也只是把他/她所说的作为一种“说法”来看待。
做研究,真实的资料是非常重要的。以上面提到的我们的研究为例,所用的资料,是收集自一个网站真实的用户行为,而且用户当时的行为是自然的,他们并不知道自己在被观察。(注2)
作为一个还在起步阶段的学者,我现在的领悟是,研究是要求真,寻求真实。
研究者要回答的一个本质问题是,事实(facts)到底是什么?
虚假的关系
寻求真实/事实不是一件容易的事情。其实,如何确认因果关系(causality),怎么才能知道是因为A而引起了B,这个话题本身就已经引发了很深刻的哲学讨论。我对相关的哲学讨论了解有限,下面只简单讲讲我觉得大家日常生活中可能涉及的点。
夏天来了,冰激凌的销量高了。但同时,溺水的人也多了。看来吃冰激凌和溺水有关,是不是吃冰激凌会让人溺水?
听起来很可笑,对吧。但如果只是看相关性(correlations),我们是会看到冰激凌的销量和溺水的人数相关的(corrrealated)。
但如果我们再看一下气温,就会发现,气温和冰激凌的销量相关(correlate),气温也和溺水的人数相关。
更合理的解释是,气温升高,人们吃更多的冰激凌。气温升高,更多人去游水,也就有更多人溺水。吃冰激凌并不导致溺水,只是气温同时影响了冰激凌销量和溺水的人数。
如果看到冰激凌的销量与溺水人数恰巧同时增长,就认为二者之间有因果的关系,则此关系用科研术语是称为虚假关系(spurious relationship)。
虚假关系的存在提醒我们,只是看到两件事情同时发生,并不代表这两件事情之间存在因果关系。为了更好地确认因果关系,我们常常需要多考虑一些有可能会影响我们所感兴趣的变量的因素。
有一次,我妈妈转发给我一篇新闻报导,报导里说,科研文章的标题越短,被引用的次数越高。我能理解我妈妈转发给我看,是希望我的文章也可以被多引用。但我真是挺怀疑标题的长短就能影响文章被引用次数的。
可惜,我看了一下这篇报导,并没有讲研究者到底都考虑了什么因素。
如果我们真的想要了解是什么因素会影响科研文章被引用的次数,那我们至少要看一些很可能影响引用次数的因素,比如,这篇文章发表的时间,发表在什么期刊上,文章的话题领域是什么,文章的作者是谁,等等。如果不考虑这些因素,而是单单看文章标题长短和引用次数之间的关系,所得出的结论其实是不可靠的。很有可能会误导人。(注3)
喝果汁,和吃水果一样吗?
有的时候,我们会看到某个研究号称所回答的问题,和它实质上所能回答的问题,是两回事。我曾经在《三联生活周刊》上,读到过一篇关于吃水果能否帮助减肥的短文。
文中引用了一个研究:“在午餐前喝果汁的志愿者在8周后不但没有像预期中那样体重降低,反而平均增加了3.5磅到5磅体重。”
请问,喝果汁,和吃水果一样吗?如果只是让参与实验的人喝果汁,那么,我们只能得出和喝果汁相关的结论,并不能得出和吃水果相关的结论;如果我们让参与实验的人喝橙汁,那我们其实只能得出和喝橙汁有关的结论,这个结论并不能直接推测到喝苹果汁或喝西瓜汁。(注4)
我认识的Prof. Robert S. Wyer,是一位很有经验的社会心理学和消费者行为学教授。他读学术文献时,常常是先去看研究到底是怎么设计,怎么执行的,而不是只看研究者宣称(claim)他们的研究有什么贡献。
事实上,研究到底是怎么设计怎么执行的,决定了这个研究能回答什么问题,也在很大程度上决定了这个研究所能达到的实质性贡献。
对总结留个心眼
现在,我读一些新闻报导里所总结的学术研究的时候,常常留个心眼。我会看一下那篇报导里有没有提供那个学术研究的具体资讯,如果那是我感兴趣的话题,我会去找那篇研究来看,而不是只看报导里的总结。
根据我个人的经验,新闻报导有时为了吸引读者,会只讲研究的某方面。或者,为了方便读者的理解,就高度概括了研究的发现。但这种目的性太强的高度概括,常常会偏离研究本身真正的发现。
其实,不仅新闻报导如此,连中学教科书也会这样,只是告诉学生一个被高度概括之后的结论。当然,中学教科书的编写者可能是考虑到学生当时的知识水准。但是,我多么希望在教科书里,可以这样写,“这个年份测定是用某某方法得到的,某某方法是基于一系列的假设,在这里不具体讨论。”(注5)那么,当我的知识水准提高之后,我可以去看一看那些假设是否合理。
在谎言充斥的世界中
我个人觉得,任何不告诉你初始假设,也不告诉你推理过程,只告诉你结论的文章,你都需要再多些思考,而不是立即接受文中的结论。
听来好像很累,是不是?
好像是比较累。但很可惜,我们所生活的世界,是一个充满了谎言的世界。有意的谎言,无意的谎言。如果不在让资讯进入脑袋之前,先鉴别和过滤一下,那我们就真是愚蒙人是话都信了。
科研工作者对一般的社会大众是有一份责任的,我们更该谨慎求真。无论读者你在做什么行业,相信你也喜欢真实而不喜欢虚假。求真不容易,恳求上帝帮助我们!
注:
1.原创性分享,指的是用户自己原创,发在自己页面上的内容。
2. 我们所收集的资料是完全公开的,是任何其他人都可以在这个网站上看到的,从这个意义上讲,不涉及隐私问题。
3. 果壳网上对此有一些讨论
http://www.guokr.com/article/440678/
根据果壳网的文章提供的资讯,我后来找到了这篇文章。
The advantage of short paper titles
Adrian Letchford, Helen Susannah Moat, Tobias Preis
Published 26 August 2015.DOI: 10.1098/rsos.150266
http://rsos.royalsocietypublishing.org/content/2/8/150266
这个研究只考虑了文章的题目长短和文章所发表的期刊。
4.我所搜到的中文资料如下。我没有找到英文的那篇study,有可能他们也做了吃水果的实验。文中的评论只基于从中文资料里得到的资讯。
“水果的迷思
多年来,“水果减肥法”一直受到许多女性的追捧。与大鱼大肉汉堡比萨相比,苹果橘子番茄的热量没那么恐怖,而且,有专家认为,水果中富含的果胶——一种可溶性膳食纤维——有助于增加饱腹感,抑制食欲。基于这一理论,近年来果汁减肥法更是风靡一时。不过,发表在最新一期《国际肥胖杂志》上的研究结果却为上述说法画上了一个大问号。
美国普渡大学的研究小组发现,在午餐前喝果汁的志愿者在8周后不但没有像预期中那样体重降低,反而平均增加了3.5磅到5磅体重。在实验持续期间,这些人平均每天多摄入400卡路里的热量。与之相对应,新鲜水果和干果似乎在抑制食欲上表现略佳,但这种效果仅在短期内有效。长远来看,多吃水果并不会帮助人控制体重,反而令他们摄入更多热量。”
http://m.dooland.com/index.php?s=/article/id/249053/from/faxian.html。
5.关于鉴别年份的方法,苏绯云博士有提供很好的讲解。
GoodTV有制作节目https://www.youtube.com/watch?v=pBqtdrRfc8g。
我还在网上找到了这篇文章,值得和大家分享。
碳十四可信吗? ——再思放射性鉴年法 (一)
作者为信息管理系统博士,目前在芬兰University of Jyväskylä任教。
Leave a Reply