基于汉语言表达习惯的因果模型检索策略浅析
来源:用户上传
作者:徐晓梅
摘 要:对于细节技术特征较多的权利要求,一般的检索策略除了描述机械特征本身,有时还结合技术特征带来的效果进行检索,通常情况下,这种检索结果范围较大,浏览耗时较多,本文主要针对细节特征较多的权利要求提出一种检索策略,其基于汉语言表达习惯的因果模型,并能够有效降低检索浏览量。
关键词:细节技术特征 汉语言表达习惯 因果模型 降低检索浏览量
我们在涉及检索时,都会基于这样的思路:理解技术方案-提取关键词-构建检索式,基于对发明技术方案的理解,我们从中抽取具有代表性的关键词,以此在庞大的数据库中猎取我们的目标[1]。例如,具有以下特点的权利要求:
一个权利要求要求保护一种A,其特征在于A包括Bi(i为1以上的整数), Bi之间的关系为C,并且A具有功能D。
其中,A可以为一种产品或者方法,Bi可以为具体部件(i为1以上的整数),C为部件间的相互关系,D为A具有的效果或者功能[2]。
在实际检索中,通常情况下,我们选取检索要素时,通常的选择方式为:
(1)技术领域,B(部件),C(部件间的相互关系);(2)技术领域,B(部件),D(技术特征带来的效果或功能)
在构建检索式时,通常把技术特征带来的效果或者功能作为部件相互关系的扩展或延伸,上述检索方式可以用以下模型来表达:
通过分析以上模型可以得知,在通常的检索思路中,我们把一个技术方案中的技术特征进行分解,然后各个层面去表达,例如相互作用关系、功能效果方面等,然后分别基于这几个角度去检索,就如同数据库是一个黑匣子,检索时,要通过对技术特征的描述来提取目标信息,于是,在利用选取的关键词检索时,就出现了以上各种不同的检索方向,我们期待并尝试从各种不同的侧面表达时,能够命中目标文件,然而,我们却忽略了一个问题:就是基于技术方案来选取关键词时,通常会以技术方案本身的内容为基础,然后把技术方案分解成各个技术特征,试图分别从各个技术特征的不同层面去描述,简而言之,我们是利用从一个技术方案整体中抽取出的离散个体去与黑匣子中的目标文件相匹配,然而,文件存在于数据库中的形式是用语言来实现的,众所周知,语言是具有一定关联度的词语的集合,在将这些具有关联度的词语以一定的方式来反映一份文件时,必然存在其表达习惯,也就是说我们要用和对比文件一样的表达方式才能命中,当然用技术特征也是一种表达方式,我们不否认通常情况下,从不同侧面进行检索的策略,但当我们用从技术方案中分裂出来的技术特征去检索目标文件时,割裂的技术特征与目标文件的表达习惯必然存在差距,这种差距的直接结果便是给检索结果带来了很多噪音,也因此导致了检索目标与实际结果之间的差距,那么如何才能有效缩小这种差距呢?
1 基于汉语言表达习惯的因果模型的建立
要从数据库这个黑匣子中快速提取出目标信息,就需要我们遵循黑匣子中文件的存在规则,作为一个文件,描述时用其惯用的表达方式去表征事物,作用到权利要求中,也就是目标文件的存在形式,是用技术特征之间的关联性(比如位置关系,因果关系)来反映技术方案的,只有对技术方案的具體表达与目标文件的关联度提高,才能快速命中目标,降低噪音。
进一步分析图1所示的模型,我们可以得到,技术特征以及技术特征之间的相互作用关系,也就是要求保护的产品或者方法为达到某种目的或者效果的手段或者具体方式,相应地,技术特征和其所具有的功能效果为要求保护的产品或者方法在经过一系列手段或者具体方式后的现象或者效果。
基于汉语言的表达习惯,我们在描述具有上述模型特点的权利要求时,通常会如是表达:B经过一系列的手段C(量变,连接关系改变等原因),而得到什么样的效果D(结果,目的,现象),以从整体上表征A。在此,我们称这一系列的手段为导致某种现象的原因,而得到的效果为一系列原因导致的结果,于是,基于汉语言表达习惯的因果模型表示如图2所示。
基于上述模型可知,要准确地表达一个完整的技术方案,离不开该技术方案对应的技术特征,以及由这些技术特征造成的一系列因果反应,要从黑匣子中准确抓取数据,需要遵循目标文件的语言表达习惯。因此,用因果模型进行检索时,可以从权利要求限定的技术特征中,确定要求保护的产品或者方法具有的功能、效果或者现象,然后分析导致这种功能、效果以及产生这种现象的原因,从who(特征)-how(什么原因)-what(变成了什么结果)这条因果链的角度去检索,如此一来,在检索的结果中会既包含原因(即技术特征间的作用关系),又包含由此原因带来的技术效果。综合以上分析,不难发现,通常的检索方向与基于汉语言表达习惯的因果模型之间的差异可用图3来表达。
可见,由于汉语言的表达习惯,因果链提高了各技术特征之间的关联度,而不是孤立的技术特征,从而使得检索结果中具有相关度较大的文件,因此而减少需要阅读的文献量,提高检索效率。
从技术方案中分解出的技术特征,无论是技术特征本身还是技术特征之间的作用关系,或是技术方案带来的效果,我们分别选取角度检索时,就造就了它们宏观上的独立性,也就是说这样的表达方式缺乏要素之间的凝聚力,可想而知,散落带来噪音。而语言自身具有的完整性,恰恰弥补了这种缺憾,因果链造就了要素之间的凝聚力,提高了要素间的关联度,因而利用基于汉语言表达习惯的因果模型去检索,可以大大降低噪音,从而提高检索效率。
2 结语
审查效能的提高离不开检索效率的提高,检索时,若不综合考虑细节技术特征本身、特征之间关系以及要素之间的因果关系,则会增加检索浏览量,降低检索效率,通过对以上案例的分析可知,基于汉语言表达习惯的因果模型检索策略,可以减少检索结果,降低浏览量,从而有效地提高检索效率,尤其是具有细节技术特征的权利要求,具有很好的去噪效果。
任何检索方法都需要在实践中不断完善,由于笔者自身经验有限,纰漏之处,请批评指正。
参考文献
[1] 专利审查指南[M].北京:知识产权出版社,2010.
[2] 田力普.发明专利审查基础教程[M].北京:知识产权出版社,2008.
[3] 审查操作规程[M].北京:知识产权出版社,2011.
转载注明来源:https://www.xzbu.com/1/view-15273176.htm