专利地图理论与工具
上QQ阅读APP看书,第一时间看更新

1.6 专利地图的研究现状与发展趋势

专利地图作为一种重要的技术分析、战略规划和管理工具,通过对其信息的不同分析与解读,可以将专利地图应用于不同的方面,从而对企业的管理指导、技术研发以及权利维护等多个领域发挥了重要作用。因此,国内外专利地图研究众多、发展日新月异。本节梳理了国内外学者在此领域的最新研究成果,探讨了该领域的研究热点与不足,展望了未来研究方向。

1.6.1 研究现状

基于专利地图的制作流程,可将中外专利地图研究归纳为以下三个方面。

1.数据源分析及检索方法的确定

(1)数据库的选择。可靠的专利数据源是专利地图的基础。各国为了开展专利研究,建立了各自的专利数据库,目前常用的数据库主要有德温特(DERWENT)DII专利数据库、美国USPTO专利数据库、欧洲ESP@CENET专利数据库、日本PAJ专利数据库、中国CNPAT专利数据库、PATENTSCOPE专利数据库等,每种数据库由于收录时间、地域以及收录对象不同,适用于不同目的的检索。早期研究大都选择采纳单一数据源,近年来数据源的选择有多样化的趋势。李阳、许培阳(2014)认为面对多种专利数据库,为了保证分析结果的全面性,应该在明确各类数据源收录范围的基础之上综合考虑多数据源的纳入和排除[23]

(2)检索方法的确定。一般而言,IPC分类和关键词是筛选和提取专利的基本方法,诸多学者围绕这两种基本方法展开研究。

霍翠婷、蒋勇青(2013)认为,IPC分类号检索存在着对单一技术进行分类、分类不准确和不统一、IPC分类不够细等诸多不足之处。因此,他们利用日本专利检索体系中的IF/F-term分类体系进行数据分类标引预处理,并基于实例进行实际应用可行性验证,从而形成面向特定技术主题的专利技术/矩阵分析方法。虽然细化了的IF/F-term分类体系更有利于专利文献的检索,然而这种分类体系只适用于日本特许厅,并没有覆盖所有的技术方面,因此应用受到极大的限制[24]。沈君、高继平(2012)通过关注分类代码之间的差异及功能,提出了特温特手工代码贡献分析法,并以华为公司PCT专利申请进行了实证研究[25]

庞德良、刘兆国(2014)在研究日本新能源技术发展趋势中认为IPC检索法的一个缺点在于分类号的确定存在争议,易造成遗漏,而关键词检索法可以通过定义关键词对分布在不同专利分类中的技术进行合并检索,可以克服IPC检索法的一些缺点,确保专利信息的指向性[26]。然而张晨(2014)认为关键词检索存在着翻译不准确、同义词、缩写、专指性不强、创新词汇、错误和疏漏以及检索时间方面的不足,因此,简单地使用关键词检索难以保证专利文献的查全率和查准率[27]

覃冬梅、丁君军(2013)认为关键词属于人类自然语言,由于表达方式的多样性会造成检索不准确或者不全的问题,因此在检索时应对关键词进行扩展,可以借用现有工具,如搜索引擎的关键词工具、相关搜索、搜索提示或者专利局专利检索与服务系统(S系统)的关联词查询工具;也可以利用本领域词典、标准和技术术语库等工具书进行扩展,从关键词的同近义表达形式、上下位概念、音形相近词、外来词及其相关概念等角度进行扩展,然而盲目地拓展关键词会给检索带来极大的干扰[28]

马婷婷、汪雪锋(2014)在分析基于专利地图的技术机会发现时,设计了一套“多级布尔”专利检索,基本形式是首先寻找专家确定领域及关键词,然后进行专利初级检索,在检索结果中随机抽取相关文档阅读,进而发现新的高频关键词,按照布尔逻辑整合原有关键词与新关键词进行二次检索,同时通过加入IPC分类号限制等降低干扰,如此反复提高了专利检索的准确性[29]

周栋、刘建勋(2014)等人研究了关键词提取在专利现有技术中的运用,分析了单频词去除、TF方法、TFIDF方法、BM25方法、基于语言模型的方法、给予相关反馈的方法以及基于IPC分类7种关键词的提取方法,开展了CLEF-IP数据集上的大规模试验和评测工作,结果表明信息检索中的检索方式未必适用于专利检索,从准确率角度来讲,TFIDF方法性能最高,而IPC分类方法在提升查全率上效果较好[30]

2.专利数据挖掘及专利分析

专利数据挖掘及专利分析是专利地图制作的关键。邱洪华、余翔(2009)认为,专利信息中包含着结构化信息和非结构化信息,前者主要包括申请号、申请人等语义和格式统一的项目,后者包括专利摘要、说明书等内容和长度不同的项目,非结构化项目的分析是比较复杂的,也是非常重要的[31]。根据目前文献研究,关于结构化信息的提取研究已趋一致,而对于非结构化信息的提取与挖掘还在探索中。

Jong Hwan Suh, Sang Chan Park(2008)研究出一种基于服务业的技术路线图制作方法(So-TRM),它主要包含专利、关键词、技术与服务四个方面的内容,通过在关键词方面将专家意见与采用计算机技术提取的关键词相结合,克服了传统专利信息挖掘中的主观性判断的缺点,可以全面地分析技术的演进方向以指导企业的战略,并通过知识型服务业进行了实证分析[32]

Young Gil Kim, Jong Hwan Suh(2007)改进了数据提取和专利地图的制作方法,通过基于K-means算法的聚合分析,将关键词形成语义网络,并根据申请日期和在数据库中的使用频率重新进行排列,制成可视化地图,同时兼顾了结构化和非结构化的专利信息,使人们可以更好地理解现有技术状况以及未来的发展方向[33]

翟东升、周娟(2006)等人研究了基于多Agent的专利地图,通过多Agent系统的人机协同协作处理结构化和非结构化的信息,增强了专利地图决策支持信息的使用率和准确率[34]。顾振宇、卞志锌(2009)等提出了一种通过TDA专利分析软件,对德温特改写过的专利文摘中用途字段进行数据挖掘,同时结合IPC分类与应用领域相关专利数据的获取方法,大大提高了数据收集的查全率和查准率,并在燃料电池应用领域进行实证研究[35]。张颖、黄卫来(2010)研究了基于XML schema的专利地图,从XML格式角度出发,组织专利数据,挖掘获取专利信息,并以湖北大重型数控机床产业为基础进行了实证研究[36]

谷俊(2013)根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层K-means聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计了一套领域本体的半自动构建系统,提高了专利信息挖掘的准确性[37]。Linda Andersson (2013)等将词组分析方法引入到专利检索中,用以分析一词多义现象,进而解读不同领域的专业词汇。研究发现,运用名词词组检索比单词检索更能准确地避免一词多义现象的发生,提高专利信息挖掘的准确性[38]

Walid Magdy, Gareth J.F.Jones(2010)介绍了一种专利信息的检索算法PRES (Patent Retrieval Evaluation Score),在不完全相关判断中,在一些文献缺失的情况下,相比于传统的MAP(Mean Average Precision)检索算法有更好的一致性和查全率上的稳定性[39]。Zeljko Tekic(2013)等设计了一款基于专利地图的商业情报分析软件PSALM (Patent Search and Analysis for Landscaping and Management),可分析结构化和非结构化专利数据。软件包括信息搜集、关键词提取、向量减少、聚类分析、地图形成等模块。研究中比较了K-means、Neural-Gas、Fuzzy C-means以及Ronn四种常用的聚群算法的性能,PSALM采用Fuzzy C-means算法对文本信息进行聚类分析,并运用三个案例进行了实证研究[40]

Aviv Segev(2012)设计了自组织地图分析模型,用于分析现有的技术趋势以及预测未来趋势,主要流程为首先用TF/IDF提取专利知识,其次运用SOM制作并展示专利地图,用六边形展示专利地图,并用不同的颜色表示专利集群,用形状大小标志专利数量的多少。在分析中,对比了SOM、K-means以及DBSCAN的聚类效果,认为SOM具有更高的精确度[41]。姚长青、杜永萍(2014)在文本聚类研究中,将K-means算法与基于密度的DBSCAN算法相结合,改进了K-means算法初始聚类中心的选择方式,将其应用于专利文本聚类,分析认为改进后的K-means算法聚类性能显著性提高[42]

Hyunseok Park, Janghyeok Yoon, Kwangsoo Kim(2012)在分析公司专利侵权现象时,使用了SAO技术分析法来提取专利信息,并对基于关键词的文本信息提取方法进行了批判,认为在分析侵权现象时,关键词分析法既不能反映技术发现,也不能反映技术间的结构关系,而SAO技术可以进行语义结构分析,并将专利间的技术相似性生成到二维地图中[43]。郭俊芳、汪雪锋(2014)等人在技术路线图分析中引入了SAO结构分析方法,同时运用定量分析法将改进前后的技术路线图进行对比,在降低对领域专家经验依赖和不确定性的同时,从关键问题出发,能有效地反映针对特定关键问题的核心技术方案的发展脉络。但是,这种分析方法仅限于对关键问题的研究,而不能完整地反映技术发展的全貌,这给分析上带来一些限制[44]

3.技术机会发现分析

专利地图应用的一个主要目的是识别R&D机会,基于专利地图的技术机会分析主要有以下两种类型。

(1)基于动态分析的技术机会发现研究。动态分析往往是根据时间轨迹来分析专利变动趋势,进而对未来的发展进行预测,主要包括基于技术生命周期的研究、主要领域技术趋势变化研究、相关领域技术趋势变化研究等几个方面。

曹雷(2005)基于技术发展趋势设计了一系列的竞争对手分析指标,认为在专利分析时,不但要分析专利的数量,更要通过引证分析来确定某企业的专利质量,而通过技术相对成长率指标、技术相对发展潜力指标组成的二维矩阵,可以分析某项技术的未来发展状况,预测技术价值和技术趋势,进而发现研发机会[45]。张韵君、柳飞红(2014)认为专利的新颖性、创造性和实用性三个特征分别象征了专利技术的发展方向、技术发展水平和技术发展潜力三个方面,因此通过对这三个方面进行点线面的分析,可以预测某项技术的未来发展状况,并进行技术机会的鉴别与预测[46]。黄鲁成、武丹(2014)认为,专利的分析不但应考虑专利数量,更应分析专利质量,在考察技术竞争态势时,应该从基础竞争态势、核心专利竞争态势和原创性与普遍性专利态势三个侧面分析以及技术领域综合竞争态势这个整体分析来进行,他们设计了专利数量分析的PAiF指标和用于质量分析的PQiF指标,从质量和数量对专利全面分析[47]

张杰、娄永美(2010)研究了基于Logistic曲线的技术生命周期,通过引入Logistic模型,分析了技术生命周期的曲线斜率、转折点以及所对应的时间[48]。陈红运、张文德(2011)认为技术机会选择最重要的一点就是判断技术生命周期,为此,他们研究设定了技术新兴率、技术成长系数和技术成熟或者衰老系数三个指标,同时配合企业自身规模和研发能力,来判断企业应该进行的战略选择[49]。费琳(2014)在研究我国纳米技术发展趋势时,采用了新技术发展态势N=V2+α这一公式来确定技术发展衰退状况,同时通过分析专利数量和申请人数量增长状况来确定技术生命周期,进而发现技术价值[50]。于小勇、赵晨晓(2011)研究我国电动车技术发展趋势,认为通过专利的IPC分类聚集状况和技术热点的聚集状况可以反映出技术研发热点,进而获取研究机会,同时认为企业对专利持有年限的长度与专利技术价值成正比[51]

H.Park, J.Yoon(2013)通过SAO技术,建立了包括申请日期、申请人以及专利集群变动在内的动态专利地图,深入分析了技术空白、技术热点区域以及专利集群变动等多方面,通过动态专利地图,可以判断某项技术的未来发展状况,进而识别技术机会[52]。Masatsura Igami(2008)研究基于专利地图的纳米技术发展历程,提出了技术知识流的概念,采用引力模型分析专利间的引用关系,通过不同年代专利关系及其变动状况,发现技术知识的流向,进而根据此趋势推断未来的流向[53]

张古鹏(2013)在研究基于专利地图的技术机会预测时,采用了技术演进路线的分析方法,通过分析不同时间技术的演进路线,观察技术之间关系的收敛和发散程度,通过制图分析,发现技术之间的空白所在,同时定义了根据关键词的增减状况来分析技术兴衰状况的概念,通过解读空白周围技术的兴衰状况来分析空白技术的价值大小[54]。Yujin Jeong, Byungun Yoon(2014)提出了专利路线图的概念,认为通过对技术演进图的研究,在绘制专利地图的基础上,可以研制出包括技术和专利双层信息的专利路线图,根据专利路线图的指示可以向技术路线图那样预测未来的技术发展方向并进行专利注册,利于抢占专利先机[55]

苗红、张伟(2013)从专利引用的角度分析了专利的发展路径,认为在专利发展过程中会出现“会聚专利”,即技术发展过程中的交叉点与聚集地,这是良好的研发机会所在[56]。黄鲁成、蔡爽(2010)分析认为在基于专利进行技术机会判断时,不仅要关注所在技术领域的发展轨迹,也要把与主要技术相关的其他领域一并分析,在研究中重点关注新兴技术的主要障碍出现在哪些领域,以及围绕主要障碍各个研发机构的技术创新活动如何变动两个问题,如果新兴技术的主要障碍已经发现,并且相关领域的创新活动很多并有大量专利产出,则技术机会可能性更大[57]

(2)基于静态分析的技术机会发现研究。静态分析主要指的是在某一时间点上专利的布局状况,通过专利自身与竞争者专利布局分析、技术空白分析、研究热点分析、技术功效分析等来确定技术机会。

许海云、方署(2014)研究了基于专利功效矩阵的技术主题关联分析及核心专利的挖掘,认为在现有的关于技术/功效主题探究中,存在着高频共现分析对低频的忽略以及IPC分类号和德温特分类滞后性两个弊端,因此通过技术规则分析获取低支持度、高置信度的技术功效关联对低共现—弱关系技术主题的遗漏进行弥补。同时通过二模网络分析识别具有相同技术功效、相同技术或者相同功效的专利簇,进而寻找技术功效的空白点[58]

康宇航、苏敬勤(2008)认为技术创新机会的识别应该从技术和市场两个角度进行,在技术分析中,采用集群分析,寻找中心专利,并分析中心专利之间的关系和各集群之间的关系,来确定有价值的技术机会;在市场分析中,应通过专利申请人在各地申请的数量来确定市场的大小,认为所受保护的国家越多,该技术越有价值[59]。王珊珊、田金信(2010)研究了基于专利地图的R&D战略联盟,从专利管理地图、专利技术地图以及专利权利地图三个方面对可能合作者及自身进行分析,以确定专利自主研发或者收购兼并决策,获得技术机会[60]。H.Park, J.Yoon(2013)研究了企业基于专利地图的兼并联合行为,认为根据企业兼并目标的不同,可以根据自身专利状况以及合作者或者被兼并者的专利状况将专利分为主要技术领域、次要技术领域以及新进技术领域三个方面,同时认为应从技术水平、研发水平以及技术协同性三个方面对合作者进行分析,最终确定自身的合作对象[61]

Changho Son, Ongyoon Suh(2011)提出一种基于GTM的专利地图,通过二维坐标制图,自动生成专利空白区域并解释专利空白领域,这样就增加了专利空白解释的客观性,防止了由于专家知识限制或者主观性解释造成的偏差以及疏漏问题[62]。J.Yoon, K. Kim(2012)提出一种全新的寻找技术机会的思维方式——孤立点监测分析。通过对专利文献SAO结构的提取、降维制图,根据技术之间的联系形成二维专利地图,通过分析与其他专利相关性不大的专利,来确定可能的技术机会。他们认为这种孤立的专利往往代表着全新的技术机会[63]

1.6.2 研究热点与不足

根据所收集的1986—2014年国内外相关文献的关键词,制作了专利地图的研究热点图[64],如图1-2所示。

从图1-2可见,近年来国内外关于专利地图的研究主要有以下三个热点。

(1)IPC与关键词法的改进研究。鉴于IPC分类适于族性专利数据搜索,而关键词适于特性搜索,各有优劣,近期研究大多聚集在利用其他分类体系改进IPC、关键词抽取技术的优化以及两种方法的互补使用。

(2)非结构化专利数据挖掘。这是近年专利地图应用要攻克的一个难点。国外在该领域聚集了大量研究,涵盖了从文本信息提取、文本矢量降维到文本聚类算法等各个方面。近期研究采纳SAO技术分析法较多,有取代基于关键词的文本信息提取之势。

(3)专利技术价值评价指标及方法研究。这是R&D机会发现的技术支撑。国内外学者从定性/定量、技术/市场、数量/质量、孤立/相关等多个维度探讨建构基于专利地图的技术价值评价指标及评价方法。

目前该领域的研究存在以下不足。

(1)关键词确定问题。在应用专利地图识别R&D机会时,应以何种方式从何种专利数据库中提取专利尚未达成共识。当前关键词提取主要有7种方法,众多学者在研究中仅使用某一种方法,而对于多种关键词提取方法的使用效果并未进行系统的比较分析。而且,目前的领域关键词确定在大部分研究中都是由领域专家提供的,人工确定的主观性极易造成关键词的疏漏,需要新的关键词确定方式来解决。同时,词组的提取方法是否比单词提取有效还需要更多验证。

图1-2 专利地图研究热点

(2)文本矢量降维问题。文本矢量维度降低有着诸多算法存在,比如潜在语义索引(LSI)以及ALSCAL等,目前有诸多的软件如SPSS等可以实现MDS功能,然而每种算法的试用情况与效果缺乏对比研究。

(3)文本聚类问题。文本聚类的算法多种多样,包括K-means、c-means、ronn、neural-gas、SOM以及DBSCAL等算法,目前的研究中使用最多的是K-means聚类算法,有研究认为SOM聚类方法效果最好,但缺乏相应研究印证。也有研究将两种或者多种算法结合进行改进,以提高聚类性能。因此,在对聚类算法的选择以及性能提高方面还有待进一步的研究。

(4)技术选值问题。囿于专利地图技术的限制,目前研究中的技术选值指标比较单薄,主要基于一维或二维视角,需要综合定性/定量、技术/市场、数量/质量等多个维度建构基于专利地图的技术价值评价指标及评价方法。

(5)技术发现信度和效度的检验问题。基于专利地图的R&D机会发现研究的信度和效度如何是该领域研究的一个薄弱环节。鉴于R&D机会发现的高度技术/行业依赖性,针对特定技术/行业的技术发现信度和效度的检验值得期待。

1.6.3 未来研究方向

(1)数据来源的多元化。专利分析是目前技术分析的最好手段之一,然而,企业作为一个半封闭的动态系统,是由多个子系统构成的,而技术仅是企业构成系统的一个部分,在通过专利分析发现技术机会的基础上,还应整合财务、市场分析、国家政策等方面的信息来全面分析某项技术机会的发展前途。因此,R&D机会研究的数据来源趋向多样化,同时也将开发甄别专利数据的有效工具,以减低垃圾专利数据的干扰。

(2)分类与关键词融合。良好的专利数据搜集是进行专利地图制作的前提,随着研究的不断深入,IPC分类和关键词这两种基本方法有不断完善、走向融合之势。相对于关键词提取,SAO基于句子语义结构分析,能更好地反映了专利文献中技术之间的关系,但SAO的实用性受到所分析问题的限制,因而探究SAO分析的局限及其最佳应用情景是一个有价值的方向。

(3)开发非结构化专利数据挖掘模型。近年来国内外专利地图分析技术的研究有着从简单到复杂演进的过程,从传统的技术生命周期研究、IPC分类研究到基于语义挖掘技术的专利聚群分析,从结构化专利数据挖掘进阶到非结构化专利数据挖掘,分析技术日趋专业化,提高了技术识别的准确性。但在文本矢量降维算法和文本聚类算法改进上有较大空间,更先进的新算法和模型的研究仍是未来的一个研究重点。

(4)技术选值研究的多维化。R&D机会发现是建立在技术选值的基础之上的。专利分析不仅是发现技术机会,同时要根据技术机会的质量来探究技术价值,增强实用性。未来研究技术选值的维度将趋向多维化,在专利地图的技术约束下,将影响技术选值的主要因素纳入考量范畴,综合定性/定量、技术/市场、数量/质量等多个维度建构技术价值评价指标及评价方法。

(5)填补技术发现信度和效度研究的空白。专利地图在R&D机会发现领域的推广和应用取决于其技术机会发现的信度和效度。因此,填补这一领域的研究空白是当务之急。