论文降重法
论文降重法是一种分析语言学文本的技术,主要用于减少语言文件的体积,以便更加容易地处理和分析。通常将其应用到大型语料库中,减少不必要的信息并减少文本的体积,以便使用其中包含的信息。
论文降重法通常包括一系列步骤,如剔除冗余部分、重复部分等;还可能删除如标点符号、格式、字数之外的无关语言成份、释义连接词或介词之间的多余部分。此外,还可能对相似或重复出现的单词采用特定含义作为代表性单词来表达意思,进而减少体积。
论文降重流程
报告降重的流程
1、找出重复的文字语句:
①查看全文,找出重复内容。
②逐句检查,找出重复部分。
③从正文中将重复句子去除。
2、关联语句去除:
①寻找同一个观点或者事实的表述,去除多余的表述。
②检查可以合并的部分,例如副词、连词等等。
3、转折语句删除:
①寻找不必要的转折语句或者停顿性表述,将其删除。
4、形式化内容删除:
① 检测是否有可以电子化或者图片化的内容,将其简化到最小的内容中。
5、背景材料删减:
① 分开背景材料和正文内容;
② 分开必要背景材料和无用背景材料并去除无用背景材料。
阅读量: 4810