科学论文越来越难读了吗?

随着时间的推移,科学变得越来越难以理解,甚至对其他科学家来说也是如此……
11月22日

采访

威廉·汤普森,卡罗林斯卡学院

科学论文越来越难读了吗?威廉·汤普森告诉克里斯·史密斯,为什么越来越多地使用科学术语会影响人们的理解。

威廉:我们是四个在读博士,因为阅读不同的科学文献而感到沮丧。我们一起参加了杂志俱乐部,有一个人的作品我们一直在反复阅读,我们认为他很难读懂。我们一开始开玩笑说,这个人一直很难读懂吗?还是随着思想的发展而发展?
我们意识到我们可以量化它,当我们意识到我们可以量化一个人的时候,我们意识到我们可以应用同样的工具,得到一个更大的语料库,有超过70万篇科学摘要。所以一旦我们意识到这一点,我们就觉得一起工作,一起研究,一起探索这个问题会很有趣。

克里斯:那你到底做了什么来进行这项研究,你为它设定了什么界限?

William:我们列出了来自12个不同领域的123份高引用期刊,这些期刊可以从PubMed下载,因为这些是我们下载摘要的工具,然后我们试图量化每个摘要的可读性。例如,每个句子的单词数和每个单词的音节数,并试图估计阅读的难度。

克里斯:这是什么时候发生的?

威廉:最早的文章是在1881年,但大多数科学文献都是在1960年左右出现的,我们可以拿到,然后一直到2015年。

克里斯:当你将这些摘要中的文本通过分析器进行分析,并要求它对使用的语言进行评分时,会出现什么趋势?

威廉:正如我之前所回避的那样,我们认为文本很难阅读,我们发现可读性有一个很大的下降趋势,这意味着文本现在比以前更难阅读,这对我们来说并不太奇怪,但我们对这种趋势的强劲程度感到惊讶。这种向下的趋势非常强烈。

克里斯:你看了大量不同的期刊,这意味着你可以考虑不同的科学学科。那么,有哪个学科特别容易出现这种情况呢,还是所有的科学家现在都倾向于过度复杂化和使用长多音节的单词,而简单的术语实际上可能是可行的?

威廉:我认为最重要的信息是,我们研究的所有领域都在变得更糟。有一些差异,例如,临床医学是最差的,而分子生物学在其中一个指标中是最差的。但我认为不应该强调这一点。我认为重点应该放在所有领域都变得越来越糟。

克里斯:你怎么解释这个?

威廉:根据我们掌握的数据,我们试图探索两种可能的原因:其中之一是:作者的数量是否会影响可读性,因为作者的数量一直在增长。现在你经常看到一篇论文有四到五个作者,而在1960年只有一两个。作者的数量确实对可读性有影响,所以如果作者越多,通常可读性就越差,但这并不能解释这种趋势。

克里斯:如果你有多个作者,你是否认为这是“厨师太多反而会破坏汤”的情况?太多的人往太多的方向拉。
威廉:没错。我想我们在论文中有这个术语。

克里斯:尽管如此,这并不是一个强大的驱动因素,因为即使你看到了影响,除此之外,还有一个强大的特征,即随着时间的推移,无论作者数量如何,复杂性和不可访问性都在增加。

威廉:对,没错。所以,我们的另一个假设是,科学家们可能是从越来越常见的词汇中汲取灵感的。我们试图找出科学家最常用的3000个单词,我们发现这3000个单词随着时间的推移而增加。然后,我们将这3000个单词分成几个类别,以分离出一个类别,我们称之为“一般科学术语”。这样的话越发增多了。所以,科学家们更多地使用一种常见的科学语言,我们称之为“科学用语”,来自于一般的科学术语。

克里斯:你认为有些论文晦涩难懂真的很重要吗?因为有些人会说,“我是分子生物学家,这对我来说很重要,我不太在乎天体物理学家看不懂我的分子生物学论文”,反之亦然?

威廉:我非常赞同这种观点,但与此同时,当神经科学领域的博士生很难阅读一些神经科学书籍时,这种努力就开始了。所以它会阻碍人们在主题本身。然后,在更广泛的背景下,跨学科领域非常非常重要。否则,你可能会在一个领域有某些方法的发展,在另一个领域非常有用,学科之间的交叉讨论通常会导致更大的科学进步。所以,其他学科完全无法理解是有问题的。

最后,科学不仅仅是科学家的事。人们应该能够利用科学知识使社会变得更好。如果社会上更广泛的部分不能访问诸如科学记者或政策制定者之类的论文,如果他们很难解释或理解科学文本,这将意味着科学不能在更广泛的背景下有效地使用。

评论

添加注释