Chrome Extension
WeChat Mini Program
Use on ChatGLM

基于信息熵的语言风格分析方法初探

Acta Scientiarum Naturalium Universitatis Sunyatseni(2020)

Cited 0|Views5
No score
Abstract
提出一种对于词汇丰富程度的量化标准——信息熵,并验证信息熵的确可以反映文本的词汇丰富程度.先将英文小说分成四类,分别是魔幻/科幻小说,推理小说,幽默讽刺小说,儿童文学.并计算每一类中的每一本英文小说作品的信息熵,然后通过图表的方式对这四类小说的信息熵进行对比,并且根据以往的对于小说风格的研究和平时的阅读经验,观察四类小说的信息熵差别是否如同预期所猜想的一致.通过验证发现,儿童文学的信息熵普遍偏低,而魔幻/科幻小说的信息熵普遍较高,而根据以往的研究和平时的阅读体验来看,魔幻/科幻小说词汇丰富程度确实较高,儿童文学词汇丰富程度的确较低.之后用假设检验的方法验证不同类型作品信息熵的差异.由此说明信息熵可以作为反应词汇丰富程度的一个指标.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined