学术论文中关键词标引的常见问题剖析
2016年10月25日 | 作者: admin | 分类: 行业新闻
关键词是检索文献的人口之一,其作用是反映主题,便于检索。由于很多作者不了解关键词标引的意义,对关键词的选取不够重视,标引关键词比较随意,有些论文所标引的关键词不能确切地反映文章的主题,起不到关键词标引应有的作用。这里拟通过分析关键词标引中常见的错误,讨论如何正确选取和表述关键词。
l.揭示主题不深,遗漏主题信息
一些作者习惯于直接从题名中选取关键词。这是一种便捷的方式,但是这种做法的基础应当是题名已经基本涵盖了文章主题。如《科技论文关键词标引方法的误导必须纠正》一文标引的关键词为:科技论文,关键词标引,叙词。该文的主要内容是讨论期刊界对关键词标引方法的某些误导、关键词概念和含义、关键词与叙词的不同之处?,所标引的关键词已经充分地反映了主题内容。但有相当部分的论文不是这样的情况,如《差异分化改革》,题名未能直接揭示文章的主题,题名中的现有词语即便全部用作关键词也不能确定文章的归类。在题名本身文学意味很强的情况下,关键词就更不能直接取自题名。
所以,选取关键词时切忌把关键词仅仅当题名或摘要的缩影,否则会造成揭示主题不深,遗漏主题信息。如果题名没有涵盖文章主题,就必须从摘要和正文中选择关键词。关键词出自题名、摘要还是正文并不重要,重要的是所选择的词语必须是文章的核心概念。要做到这一点,首先必须真正理解全文,透析出文章的主题。还有一些作者虽然不是只从题名中选取关键词,但由于疏忽或不知道应该如何选取关键词,对主题分析得不够充分,致使选择关键词时有遗漏主题的现象。如《高教改革背景下的信息需求与信息服务》,原文选取的关键词为:信息需求,信息服务,高教改革。
通读全篇内容可以知道,该文旨在通过对高校在教育改革中信息需求的内容与特征进行分析,指出高校图书馆为高等教育改革提供信息服务与支持的具体措施。“信息服务”这个概念显然不能涵盖“高校图书馆”的独特含义,“高校图书馆”不仅是文章中的一个基本语词,而且是文章主题中的一个基本概念,它应是检索文章主题的人口之一,但是文章的关键词却遗漏了这个语词。
2.通用词汇多,专指词汇少
关键词兼具专指与通用2种属性.这是它能够明确地反映文献主题归类的原因,但是必须指出,我们应该用通用性较强的词语而不是用通用词做关键词。人们在表述文章主题时经常会使用一些通用词。通用词是适用范围广泛的词语,如“差异”“简介”“探讨?‘意义”“影响”“对策”“原则”等,它们适用于不同的领域,可用以解说各种不同的问题,所指示的对象千差万别,根本不能归于一类。使用通用词作为关键词显然不便于对数据库进行分类和管理;如果读者选用某个通用词来检索,将会把数据库中包含该词语的各学科文献都归总到一起,形成一个大杂烩,很难从中找出所需要的信息:所以通用词不适合用做关键词。将通用词尤其是题名中的通用词直接用做关键词却是目前比较普遍的现象。如《贵州与全国经济发展差距及对策》一文中,作者标引的关键词为:经济,差距,产业结构,投资,研究。文章通过对贵州和全国及周边省区经济发展现状和落后原因进行对比分析,指出贵州主要在产业结构、工业经济内部结构、自身经济实力、人民生活水平等方面与全国及周边省区存在的差距,并对此提出了缩小差距的具体对策。显然,作者将“研究”作为关键词是不恰当的。“研究”反映了什么主题呢,是法学的还是经济学的,是医学的还是物理学的,不得而知。该文的关键词可以修改为:贵州,经济差距,产业结构,非国有经济,投资渠道。这些词语在本研究领域既具有较高的通用性,又具备一定的专指度,能够明确地反映文献主题的归类。
与标引通用词刚好相反的一种错误是漏标专有名词。一些重要的、直接关乎文献主题的专有名词应当作为关键词加以标引,但忽视选取专有名词的情况也很常见。如《(习静斋诗话)评介》一文深入分析了《习静斋诗话》在理论上的4个特点。既然是专门研究《习静斋诗话》,“《习静斋诗话》”显然是文章的一个核心概念,但原文标引的关键词中却没有它。一个专门研究的问题(著作、人物或地域等)被遗漏在关键词之外,这也是不恰当的。
3.标引深度不恰当
有些论文提供的关键词不是太多就是太少,对揭示论文主题的程度往往有直接影响;因为关键词的数量隐含着一个标引深度的概念,而标引深度是指对一篇文献所给予的全部检索标志的数量之和,它标志着关键词所达到的对文献主题揭示的程度。一般地说,关键词越多,揭示文献主题就越深,越详细,可供检索的范围也就相对越小,这与概念的内涵越多,外延就越少是一个道理。通常要求每篇文章提供3~8个关键词,这个弹性是相当大的,是标引8个还是标引3个关键词对揭示文献主题的深度显然有很大的区别。适当的标引深度应该是在文献的检全率与检准率之间达到某种平衡,既能把文献定位于某一特定的类别,又能充分揭示文献的主题。作者在标引关键词时,一般可考虑按次序选取3~4个最能概括文章主题的词语。选取关键词不是多多益善,也不是越少越好,而是恰到好处。这个“恰”,就是能够反映文章的主题内容。
4.逻辑关系混乱
关键词各条目之间有一定的排序规则,即排列次序要反映出词与词之间的逻辑联系,而有些论文作者在关键词的排列顺序上忽视了这种逻辑关系。例如,有的文献按研究结果一研究目的一研究类别的顺序来组织关键词,还有的文献按研究方法一研究结果~研究目的顺序来标引关键词,造成词序颠倒或层次不清,引起逻辑上的混乱,势必对理解文章的主题产生误导,给检索或计算机数据库管理都带来不必要的麻烦。因此,关键词的排列顺序必须有利于清楚明晰地、层层深入地反映文献主题。一般地,标引顺序应为研究目的一研究类别一研究方法一研究结果。关键词排序时,对于同一序列的2个或多个具有属种关系或在深浅程度上有差异的关键词(如均为标志研究类别或研究对象的关键词),应按属种关系或由浅到深的顺序排列。
5.词性不明。信息冗余
一些论文作者在关键词的标引中不注意词性,把一些形容词、副词选来做关键词。如有一篇公开发表的论文,题名为:《走不出的激情炼狱——评(红与黑)于连形象的塑造》,选择的关键词有:走不出,激情,炼狱。显然这样的关键词是不恰当的,因为它丢失了真正有用的名词性关键词《红与黑》、雨果,而把形容词性质的词(走不出(的))用来作为关键词,造成了检索信息的混乱。选取关键词时应主要考虑名词、动名词、名词性词组,避免用形容词、副词来修饰和限定关键词。同义词、近义词不能并列作为关键词,化学分子式不能作为关键词使用,复杂有机化合物一般以其基本结构的名称作关键词,分析和讨论中引进的其他学科的词语不能作为关键词,外来语也要慎做最好不做关键词。择词要精练,宁简勿繁。
6.构词不准确。内涵不清晰
有些作者在选复合结构的词语做关键词时,将构词词序随便互换,使关键词表达的内涵与原文基本思想产生差异。词序的变化经常引起词组的内涵和外延发生变化,如“哲学逻辑”与“逻辑哲学”就相去甚远,“电导”与“导电”也完全是不同的概念,所以固定搭配且具有特定含义的词组和科技术语,不宜拆分开来,而应以词组和科技术语作为关键词。这样可以明确地表达文献的主题,不致产生词义上的理解误差,也便于文献的标引和检索。比如,《浅谈信息高速公路与资源共享》一文,可选取“信息高速公路”和“资源共享”作为关键词,而不宜将这2个已被普遍认同且具有特定含义的词组拆分开来,如选取“信息”“高速公路”“资源”“共享”作为关键词,就是不妥当的。