182-1095-8705
最新公告:NOTICE
8月1日起,国家知识产权局停征和调整部分专利收费,详情参阅资讯中心公告

资讯中心

当前位置:专利申请 > 资讯中心 >

专利信息学:任务与工具,专利分析及其应用

专利代理 发布时间:2024-02-23 10:11:27 浏览:



今天,乐知网律师 给大家分享: 专利信息学:任务与工具,专利分析及其应用。



专利信息学:任务与工具


专利信息学是一门应用科学,科学技术的日新月异已大大丰富了它的研究手段和应用范围。

专利信息分析的过程,就是在准确把握分析目的的基础上,利用各种方法完成所设定的一系列任务,并最终获得所需情报的过程。

本文将就专利信息分析中通常需要解决的一些任务,以及可以帮助和支持完成这些任务的分析工具作一概述。

一、专利信息分析的任务   为了获得最终的分析结果,专利分析员往往需要完成各种不同的任务。

总的来说,专利信息分析过程中常见的任务包括:  1。术语的清理与分组,即手工或自动对所分析的数据中的各种术语进行标准化。

例如更正拼写错误,将表达类似概念的同义词或近义词归类为一组等。

这样做的目的是为了获得准确的统计结果,以真实反映某个术语或某项信息在整个数据组中的重要程度。

2。绘制直方图,即对各个数据组中与专利相关的各种量度(例如专利申请量、专利授权量等)进行记数。

这样做可以对同一数据组中的两个或多个量度的结果进行统计学对比。

3。绘制曲线图,即将数据分置在X轴和Y轴上,既满足X轴条件又满足Y轴条件的交叉点的数据就是矩阵中的一个个数据。

完成这项任务可以使我们了解两个或多个信息之间的相关性,以及相关性的强弱。

在比较不同的数据项,例如专利权人和申请年或技术主题(例如可以用专利分类号表示)之间的关系时,这种类型的分析是非常有用的。

如果将专利权人情况表现在Y轴上,将申请年表示在X轴上,就可以迅速地看出各个公司各年的专利申请趋势。

4。对结构化(域化)数据进行聚类分析。

当数据被标引或被包含在某一个数据域中,称之为被结构化。

数据的结构化并不能由作者写作时自动完成。

按照某种规则设定的分类系统可以产生标准化的编码,这些标准化编码可以用作对具有类似编码结构的文献进行组织的工具。

聚类有时候也称之为聚集,即以一种系统化的方式来归置大量文献。

例如将所有关于开关的文献集合在一起,而将关于插座的文献集合在另一个地方。

这种分析方法的原理是基于文献的构思,彼此之间具有相同编码的百分比越高,文献的内容越可能相近。

5。对未结构化的(文本)数据进行聚类分析。

未结构化的文本是指没有被标引到各个数据域中的文本,它们唯一的结构就是作者写作时将不同的词连成句子、再将句子组成段落……,如此而形成的结构。

这种类型的数据对于专利分析员来说极具挑战性,因为专利文献的作者可以自己造词,只要他能在说明书中向专利审查员清楚地解释出该词的含义即可。

对未结构化的数据进行聚类分析,就要对原始文本进行加工,以识别出其中的概念和术语。

与结构化数据的分析一样,用编码代替其中的概念和术语,然后按照编码相似的程度将文献分组。

同样,彼此之间编码的相似度越高,文献的内容越接近。

6。将文献集合作图,即将聚类分析获得的一个个文献集合排列在一个二维空间中,获得一个二维图像。

在图形中,包含有共同元素的文献集合被排列在更为接近的位置,而相似性不太高的集合则被放置在较远的地方。

这种方法使得分析结果可视化,从图中可以清楚地看出不同文献集合之间的关系。

7。绘制三维图像,既在上述二维图像中再加入一个时间维度。

加入时间维度时通常利用不同的颜色来表示。

当用不同的颜色来表示不同的年份时,分析员可以通过不同颜色在图中的走向或变化来追踪某项分析主题的进展情况。

8。引证分析。

当我们阅读专利文献时,会在其检索报告或是扉页上看到相关的在先技术的信息,这些就被称作专利引证。

可以对引证的次数进行计数,或者按照引证关系将相关文献聚集在一起。

通过查看这些文献是按照怎样的引证历史而联系在一起的,就有可能获知早期的技术是如何随着时间而不断进化发展成新的技术和专利的。

有时候会采用双向引文树来显示彼此引用的专利之间的关系。

引证数可以用来揭示潜在的核心专利。

9。主题/功能/目的(SAO)分析。

SAO是专利文献的作者用来描绘想要给出的教导时所采用的语言的一部分。

关键的SAO中包含了文献中给出的技术知识。

SAO也可以称为是问题/解决方案。

例如,“清洁双手用的肥皂”这一陈述中包括了主题(肥皂)、功能(清洁)和目的(手)。

通过确定SAO,可以从文献的其它部分分离和检查出文献给出的有用的教导。

二、专利信息分析工具  上文中提到的专利信息分析过程中的各种任务往往需要借助一定的分析工具才能够完成。

这些工具可以大致分为三类:软件,它们可以在公司内部服务器或者是客户的个人电脑上运行;资源,即提供静态统计分析结果的印刷品或参考资料;和网站,它是由外部服务器驱动的分析设备,用户一般按月或年度购买使用权限。

下文将就常用的一些分析工具进行综述。

(一)软件:  Aureka IPAM  Aureka IPAM 系统是Aurigin公司 最成熟的专利分析系统。

IPAM是“知识产权资产管理”的缩写,应用这套系统可以组织和管理知识财产(不仅仅是专利,还包括各种公司文件)。

该系统包含的专利分析工具是智能知识财产管理的一部分。

这套系统具有很强大的功能,很高的兼容性和安全性(因为它是安装在公司的防火墙后面的),但是使用这套系统的花费相当高。

Aurigin 在它的平台上预装了专利数据,这些数据来自四个主要的专利授权机关(美国、欧洲、日本和WIPO),并且包含一个用于查找相关文献的搜索引擎。

专利数据定期更新,检索得到的文献可以储存,创建成若干组以备进一步分析之用,也能和其它同事共享。

Aureka平台的另一个优点是能对专利文献进行注释。

由于Aurigin是从SmartPatents公司起家的,所以用户能够通过这套系统实现SmartPatents所有的注释和浏览功能。

作为一个集成化的系统,Aureka平台的兼容性很好,它能兼容很多其它的应用软件。

Aurigin与一些优秀的分析软件公司合作或合伙,并将这些公司的软件集成到了Aurigin的管理系统之中。

Aureka 系统集成的分析软件中有一个是ThemeScape主题文本挖掘工具。

它最早是由一家叫Cartia的公司进行市场开发的, Aurigin公司在2000年收购了它,并将其集成到Aureka平台中。

ThemeScape 采用一种构思绘图法来生成技术分布地形图。

该程序能读取文件全文,通过提及的频率来确定主题,并通过对这些主题的同现情况进行分析,应用聚类运算将这些文献重组。

在一张ThemeScape地形图中,每篇文献用一个黑点代表,高峰表示某一特定主题下集中了大量文献的聚类;图中两篇文献距离越近,表明它们的主题相关度越高。

ThemeScape是一种文本挖掘工具,同时也具备一些数据挖掘功能,这增强了系统进行聚类分析的能力。

根据用户需要,你可以在一张专利地图中确定一个具体的专利权人。

这用小白点的形式表示,可反映出该专利权人正从事的开发领域。

系统中的Aureka引文树软件(Aureka Citation Tree)是平台中的另一项重要分析工具。

该工具获得InXight的授权,这项技术引入了一个双向树状图浏览器。

引文树工具能利用美国专利数据中的引证信息创建出一个双向引文树。

选择某篇美国专利,把它看成树根,向前的一级级引用可以形成若干树枝。

向后引用同样也可形成这种树状形式。

用户可以按照申请人、公开日期、发明人等不同内容来构建引文树,也能按照日期或者专利权人信息给树干着色。

对某一篇美国专利来讲,通过引文树可以快速了解该专利的引用历史。

不过该软件有一个缺陷,即获得的引文树的树干都是直线形式的,因此无法看出某一级和下一级引用文献之间的交叉关系,因而无法观察到整个引文链的全貌。

此外该软件仅适用于美国专利数据。

Aureka 系统中还有一个生成报告的工具,它能对专利数据进行各种统计分析。

报告模式可以分成三大类:n  关键信息摘要报告(Key summary report)。

此类报告就某一特定领域的信息要素形成排名前十的统计分析,比如某技术领域专利申请量排名前十位的专利权人或发明人等。

详细报告(Detailed report)。

这类报告中包括一系列对不同主题进行分析后得到的文本式的子报告,比如发明过程分析、引证分析、发明人和专利权人分析、矩阵分析(比如IPC分类与专利权人的组合)报告等。

要点图表式报告(Pivot tables)。

这是功能最强大的报告模式,它是根据专利权人、发明人、美国专利分类、引证关系和其它一些信息要素做出来的。

收集到上述信息要素后,分析员可将其输出到Microsoft Excel中,据此作出各种图表,并进行深入的分析处理。

对分析人员来讲,几乎所有的专利著录项目都能用来合并、组合、匹配到一张要点图表里。

用这种方式,可以进行各种极为复杂和出色的分析。

关于该系统的更多信息可登陆网站:http://www。micropat。com/static/aureka。htm。

ClearForest  ClearForest系列软件是ClearForest公司的产品,它们是非常强大的文本挖掘工具。

大多数文本挖掘工具从进行主题词提取开始,即利用该过程从文本中挑选出相关的主题词,并将它们提取出来用于后续的分析。

主题词提取类似于过去那种创建一个全文本的、反向索引的特定文件的过程。

主题词一旦从文本中提取出来后,就可以各种方式进行分析。

信息提取比主题词提取更加深入,它不仅要挑选出主题词,而且随后还要自动地将它们分到预定义的类别中。

它是基于未经加工的文献工作的,这些文献中没有特别标记出发明人或专利权人信息。

信息提取技术能分析这些未经加工的文献,并且自动提取和分类有关信息,比如人名、它们的职务、所在公司以及其它一些特征。

ClearForest 开发了两个不同的软件来处理信息提取工作,它们是ClearStudio 和 ClearLab。

ClearStudio界面友好,能够让用户快速设定自动将信息分类的语言关联规则。

ClearLab 也允许创建关联规则,但它的界面使用的是C++语言,是针对熟悉这种程序语言的用户而设计开发的。

ClearForest系列软件的第三部分叫做ClearResearch。

这一软件能对经过分类的信息进行分析,其中包括很多不同的分析功能。

最强大的一个功能是可应用圆圈图来显示一类信息与另一类信息之间的关系。

比如说,可以将一组文献中提到的所有公司分成一类,假设左边的圆圈显示的是技术主题,右边的圆圈代表公司名称。

他们之间不同粗细的连线代表该家公司与该技术主题之间的关联情况。

连线的粗细和颜色反映了基于所涉及的文献总量计算出的关联强度。

双击一条连线,用户就能看到相应的专利文献。

双击某个技术主题或公司名称圆圈的边缘,就会打开一个新的窗口,被点击的项目列在窗口的中间,其余相关内容显示在它的周围。

例如,点击一个公司名会产生一个新窗口,这个公司名出现在窗口中央,与该公司有关的技术主题则显示在周围。

右键单击窗口中的某一项技术主题,就会出现一个显示了上下文的菜单,分析人员可以针对能得到的任何一类信息作进一步的划分。

以这种方式,人们可以利用与之关联的相应技术主题将公司的发明人分类。

ClearForest系列工具包含许多强大的文本挖掘功能,目前该公司也对其软件进行了整合,新的ClearForest文本分析平台主要由两部分组成:先进的文本标记和分类引擎(ClearForest Tags)和文本分析系统(ClearForest Analytics),更多信息可登陆网站:http://www。clearforest。com/。

VantagePoint  Search Technology公司的产品VantagePoint是一种数据挖掘工具,主要是对数据域内的各种项目进行统计分析。

如果该数据域里含有书面文本的话,该软件也能应用某些自然语言运算法则进行主题解析。

该软件所使用的数据由用户直接向数据供应商购买。

用户利用数据供应商提供的搜索引擎进行检索,并将检索结果下载到用户的计算机上,然后借助导入编辑器将这些数据导入VantagePoint并进行解析。

几乎任何来源的域化数据都可被准确地解析并导入到系统中以备分析之用。

用域化的数据生成了一个数据库后,该系统可使用软件进行数据清理。

VantagePoint提供了一个数据清理工具(Data Cleaning Tools),它应用模糊逻辑法则帮助用户合并某些相似项目。

在清理公司名和发明人名称时,常常使用这一功能。

好的统计分析需要好的准确的数据,VantagePoint的数据清理功能能够使得原本耗时费力的工作变得更加容易,例如它可以自动处理拼写错误、大小写、连字符、不同拼写习惯等。

VantagePoint使用的主要统计方法是交叉矩阵。

Y轴显示一类信息,X轴显示另一类信息。

矩阵中的数字表示同时具有X和Y轴相应特征的专利的数目。

点击该数字单元会出现一个相应专利文献的标题列表。

含义相同的项目可以归为一组,并将其与矩阵中的另一组项目作比较。

例如,机构可以按照它们的一般属性分为企业、政府部门或教育科研单位等。

用户可以据此比较分析某特定关键技术领域中不同类型机构拥有的专利数量。

使用交叉矩阵,该系统也能对任何项目的主要构成作进一步分解,从而生成要素地图。

该系统还能根据预定指令自动选取并把矩阵表导入Microsoft Excel中,进一步生成三维图、线形图和其它各种各样的图表。

该软件的更多相关信息参见网站http://thevantagepoint。com。

Invention Machine  Invention Machine系列产品是由Invention Machine Corp。公司开发的一系列用于帮助进行计算机辅助发明设计的应用软件,其中在专利分析方面最相关的两个产品是Co-Brain 和 Knowledgist。

这两个软件都是用于实现从全文数据中提炼主题/功能/目的(SAO)函数的。

该公司将这一分析方法称之为问题/解决方案法。

这一方法是基于以下观念:专利是指导阅读者如何解决一个实际问题的。

我们将主题和功能看作是解决方案,将目的看作是问题。

举例说,如果目的是洗净衣服,解决方案就可能是用肥皂洗——正如功能和主题揭示的。

一旦该软件从文献中提炼出了主题/功能/目的函数,它就可以将问题和解决方案联系起来,将类似的问题归到一起,以便用户可以对比解决同一问题的不同方法。

这两个软件的区别在于应用范围和处理能力。

Knowledgist针对个人台式电脑设计,可以使用个人数据库,而Co-Brain为公司服务器设计,可以充当公司信息入口。

这两个系统都附带有同义词处理工具,可大大减少生成的问题/解决方案组的数目,并极大地提高系统识别解决同一问题的两个不同解决方案的能力。

这两个软件经常会创建出通过上下滚动列表都难以浏览的很大的问题/解决方案函数。

为了帮助确定相关函数,用户可以使用一个搜索按键快速地找到问题或解决方案。

有关细节可浏览具体网站:http://www。invention-machine。com/。

BizInt Smart Charts  BizInt Smart Charts for Patents是BizInt公司开发的用于专利方面的产品,这是一种用于专利文献图表制作的软件。

该软件允许用户使用来自STN、Derwent、IFI、Dialog上的化学文摘库的专利数据,并生成由其得到的信息图表(包括许多种内置图像形式)。

系统可以简便地定制各种图形,并有多种存储和输出选择。尽管该软件本身并不是一个文本或数据挖掘工具,但它能很好地将用于终端用户的专利数据标准化。

生成的图表可以根据用户需求变化,甚至可以在其中加入几栏来记录同一分析项目 起工作的同事所作的注释。

有关详细信息可浏览具体网站:http://www。bizcharts。com/patents/index。html。

OmniViz  Battelle的SPIRE是最早提供文本挖掘和可视化软件包的公司之一。

SPIRE研发队伍中的一些成员后来离开建立了Cartia公司。

Cartia生产前文中介绍过的ThemeScape软件。

Battelle的另一组科学家认识到SPIRE技术不仅可以用于直接进行文本挖掘,而且开始将该软件应用于生物和化学数据。

这项工作再次剥离出来,创建了另一家新的公司:OmniViz。

就核心部分,OmniViz与ThemeScape有很多相似之处,但OmniViz的技术人员在Cartia/Aurigin所做工作的基础上又作了大量改进。

在文本挖掘方面,OmniViz可以导入多种不同文本格式的文献,还可以风格化和识别已著录的文本。

当分析人员在选择想要用于进行聚类分析的那部分文献记录时,该系统可以区分该文本的关键内容,例如发明人、专利权人、发明名称、摘要,公开年份等。

OmniViz系统可以识别这些不同信息项,题目和摘要可用于进行聚类分析,其余信息项可以用于获得令人感兴趣的图表,诸如基于类似的发明标题和文摘,哪些专利权人拥有类似文献,或者在哪些年份公开了哪些主题。

以前人们也可进行一些这样的分析,但都不如OmniViz做得深入和方便。

OmniViz可以对来自生物学、化学和文本原始资料的数据进行整合分析并从中发现趋势的能力使其成为一种独特的工具。

它能让生物学家对大量的细胞检测数据进行分析,例如,找出具有类似试验结果的候选药物,即使这些候选药物在结构上有很大差异。

该系统还允许将两种或多种具有共同要素的分析关联起来。

这可以使分析人员利用一种类型的数据源和分析方法来发现趋势,同时利用一种相关的数据源和方法来观测是否有类似的趋势出现。

例如,设想某一项分析显示了对于某种目标酶均具有活性的几类分子。

对基于其化学相似性进行了分类的候选药物的关联分析显示,有两种可能的抑制剂具有类似结构,而第三种结构很不同。

于是对含有所述候选药物的各类专利和非专利文献增加一个三项关联聚类分析。

由于三种分析都联系起来了,因此可以容易地发现这两种相似化合物已实际上被数篇相关专利覆盖,而第三种化合物在非专利文献中提到了。

了解具体信息可登陆网站:http://www。omniviz。com/。

Thomson Data Analyzer  Thomson Data Analyzer是汤姆森科技公司在Thomson Derwent公司之前成功开发的一款专利分析软件Derwent Analystics的基础上后续开发的。

它是一款适于在台式电脑上使用的专利分析软件,依托  VantagePoint作为技术支持,具有较为强大的数据挖掘和可视化功能。

Thomson Data Analyzer可以针对来自Dialog、STN、Questel。Orbit、Delphion、Aureka等的多种专利数据进行分析,例如业界最权威的世界专利索引数据库(Derwent World Patent Index(DWPI))数据、Aureka和Delphion的全文专利数据。

此外,借助导入编辑器(Import Engine Editor),该软件还可以导入任何结构化的数据进行分析。

Thomson Data Analyzer的使用界面友好直观,它将VantagePoint最新功能和众多高质量专利数据结合在一起,可以满足专利分析的多种需要。

此外,它还具有多种输出选择,其分析结果甚至可以输出到其他应用软件,例如Aureka(包括ThemeScape)、Mircosoft Office和BizInt Smart Charts等中做进一步的分析,有关详细信息可以浏览网站:http://scientific。thomson。com/products/tda/。

INAS  INAS(Information Analysis System)是韩国WinsLAB株式会社开发的专利分析软件,由专利信息分析系统(INAS)和专利信息下载系统(PatentGet)两部分组成。

它具有多种数据入口,特别是利用其专利信息下载系统可以从包括美国、欧洲、日本等国家的免费专利数据库和中国专利检索数据库免费自动下载专利数据,然后直接应用到其专利信息分析系统中。

INAS系统依据专利地图理论研发而成,可以进行定性和定量两种分析。

定量分析主要用于对专利文献扉页上的著录项目进行不同的组合分析。

定性分析则首先需要对专利文献的技术内容进行标引后,再进行矩阵分析、时间趋势分析等。

分析结果可以用图表显示,方便、直观。

专利分析及其应用


一、专利分析的概念  专利分析,是指从专利文献中采集专利信息,通过科学的方法对专利信息进行加工、整理和分析,转化为具有总揽性及预测性的竞争情报,从而为企业的技术、产品及市场开发中的决策提供参考。

专利分析通常按以下程序进行:  1、准备期  专利分析首先要确定分析目的。

根据分析目的(比如分析竞争对手、分析行业技术、分析特定技术等)的需求,收集背景资料,选定分析工具(分析软件)、选择专利信息源。

2、分析期  在准备的基础上,进行数据采集和数据分析。

数据采集包括确定专业领域,拟定专利检索策略,进行检索和修正,以及分析样本数据库。

分析包括数据清洗,按专利指标聚集,生成工作图表,生成深度分析目标群,分析与解读以及撰写分析报告。

分析方法包括定性分析、定量分析、拟定量分析、图表分析等。

3、应用期  应用期包括对分析报告进行评估、制定相应的专利战略和实施专利战略。

二、专利分析的作用  1、把握相关领域的技术状况  专利文献是技术资料的宝库。

据世界知识产权组织的统计,全世界发明成果的90%以上会出现在专利文献中。

通过对相关产业和技术领域的专利技术进行检索和分析,能够把握相关产业和技术领域的整体状况(包括重点技术现状)和发展趋势,明确行业技术创新热点及专利保护特征。

2、了解相关企业的技术活动 专利制度是被广泛认可的保护自主创新的有效方式。

大多数企业通常会将自己开发出的技术尽早申请专利以求得以保护,企业的技术路线,技术布局必然会体现在其专利信息中。

通过对企业的专利信息进行分析,便可以了解其技术活动及其战略布局。

3、了解竞争对手动向  互为竞争对手的企业必然处在相同或相近的技术领域,通过对该技术领域的专利信息进行分析,不仅可以发现现实的竞争对手,挖掘潜在的竞争对手,还可以通过对竞争对手在不同国家的专利文献进行分析,了解其在不同国家、不同地域的市场经营活动,竞争企业间的技术合作、技术许可动向等。

4、了解人才分布  通过对专利文献中的发明人信息进行分析,可容易的找到该领域的技术专家,并可以了解到这些技术专家在技术上的侧重点。

5、预测新产品新技术的市场情况  专利文献记载着目前最先进的科学技术。

据世界知识产权组织统计,同一发明成果出现在专利文献中的时间要比出现在其它媒体上的时间平均早1~2年。

通过对专利文献信息进行分析,可以预测新产品、新技术的推出,以及相关国家的市场分布和规模等。

6、为企业的研发、投资、兼并决策等提供依据 通过对相关领域的专利文献信息进行分析,可以了解相关领域的技术发展现状和发展趋势,可以为企业决策者把握特定技术的开发、投资方向、兼并收购等决策提供依据。

7、为建立企业专利数据库指明方向 通过对相关领域的专利信息进行分析,并结合企业自身的发展现状和发展目标,确定合适的技术领域,确定合适的目标跟踪对象,为建立符合企业特色,又符合行业发展趋势的专利数据库指明方向。

8、为制定企业专利战略提供依据  专利信息不仅包含着大量的技术信息,还含有大量法律和经济的信息,仔细分析和科学利用这些信息,可以为企业制定专利战略、企业发展战略乃至市场战略等竞争战略提供依据。

三、专利分析案例  专利分析会根据不同的目的确定不同的分析方案。

下面通过日本东海公司打火机相关专利分析情况,说明如何利用专利数据了解该公司的技术发展特征和趋势。


更多关于 专利信息学:任务与工具,专利分析及其应用 的资讯,可咨询 乐知网。

(乐知网- 领先的一站式知识产权服务平台,聚焦 专利申请,商标注册 业务)。


关键词: 发明专利申请 专利代理