读我的话

新的计算机软件可以读取一本书的文学指纹,这是作者所独有的。
十二月十三日

新的计算机软件可以读取一本书的文学指纹,这是作者所独有的。

事实证明,随着书变得越来越长,即使是最优秀的作家最终也会用不上新词。但是,新词消失的速度取决于作者的技巧,而且对每个作者来说都是一样的,这给了他们一个独特的词频指纹。

在对赫尔曼·梅尔维尔、托马斯·哈代和DH·劳伦斯这三位伟大作家的作品和故事进行分析后,由塞巴斯蒂安·伯恩哈德森领导的瑞典研究小组提出了一个观点,即每个作家的头脑中都有一本“元书”。作家们会打开自己的元笔记本,抽出文字写在纸上或电脑屏幕上。

这项发表在《新物理学杂志》上的研究提供了对语言使用方式的见解,尤其是最伟大的作家。

这一发现违背了一个有75年历史的理论,即齐夫定律,该定律认为,对于任何书面作品,任何单词的出现频率与其排名成反比。所以,如果单词“the”是使用频率最高的,占所有使用单词的7%,那么第二频繁的单词“and”大约占3.5%,以此类推。

但是,这项新的研究并不是普遍的文学规律,而是表明,在决定新词的使用频率方面,个别作者的语言能力更为重要。

该团队正计划对其他文学作品进行类似的研究,并最终认为有可能从他们文字中留下的指纹中找出身份不明的作者。

评论

添加注释