AI技术完成吉利德专利组合技术分类

因为新冠疫情,吉利德公司走入了大家的视线。网上有诸多介绍吉利德的文章,而从专利角度分析吉利德,大家最常用的手段是通过IPC、CPC、德温特手工代码等进行分类分析。但是,如果我需要把吉利德的专利组合归类成图1这样更贴合产品线、针对具体疾病的技术分类框架,该怎么办?这个问题似乎就比较棘手了。

图1技术分类框架

遐想与DDA

在DerwentInnovation数据平台下,截止到年2月9日,吉利德有共计件专利/专利申请,合并DWPI家族[1]为项。人工手动把这个技术方案划分到图1的技术分类框架,需要多长时间?我们知道,技术领域不同,工作人员熟练程度不同,将专利进行人工分类,平均每天完成的数量从几十篇到两三百篇不等。以每天人工分类篇为计,人工完成吉利德专利组合的分类需要大约7个工作日。不仅工作量大且比较枯燥。

如果有一个工具能让我先进行人工分类,达到一定可信度后,再让系统学习我的分类规则并完成剩余所有数据的分类,岂非美哉。等等,DerwentDataAnalyzer(简称DDA)不就是我想要的神器吗?

DDA具有基于人工智能的自动分类功能,使用者先在DDA上对专利进行手动分类,后台算法便会捕捉人工分类规则,随着人工分类数据逐渐增多,DDA人工智能技术会不断学习并贴近人工分类偏好与逻辑;为了方便使用者判断何时可以进行自动分类,DDA给出了“置信度”参考,人工分类数据越多,“置信度”参考值越高,代表您可以放心把剩余数据交给DDA进行自动分类;最后,通过在设置的训练字段中进行文本切分、提取、比对和分析,根据拟合程度,DDA将自动完成剩余所有数据的技术分类。

说起来似乎有些复杂,大家直接看我的工作成果吧。

[1]DWPI专利家族是德温特在INPADOC专利家族的基础上,结合专利公开文本的具体技术方案,整合加工的一种更能体现专利间技术关系的专利家族体系。

DDA完成吉利德专利组合分类过程

第一步:建立分类框架体系。点击DDA“记录分类”功能按钮,将已经梳理好的技术分类框架直接输入或者文本“导入”方式在DDA上建立。

图2.1在DDA中建立技术分类框架

第二步:设置训练字段。设置需要DDA人工智能技术学习人类分类规则的目标内容。建议选定经过改写的“DWPI摘要”和“DWPI标题”作为训练字段,分类效果更佳。为什么选择德温特标题和摘要,简而言之,他们是帮您快速发现专利隐藏信息的好帮手。

图2.2在DDA中设定“训练字段”供机器学习

第三步:人工分类。即使是人工分类,也是有方法的,我们建议您从已有的专利分类入手,比如德温特手工代码。

我的技术分类中有一个是“INDOLENTNON-HODGKINLYMPHOMA(惰性淋巴瘤)”,它是“NON-HODGKINSLYMPHOMA(非霍奇金淋巴瘤)”的一种。手动分类时,我惊喜地发现,在DWPI手工代码中可以直接找到“NON-HODGKINSLYMPHOMA”这个细分类,在IPC和CPC却不能,这无疑对我的分类工作是一个很大的帮助!如下图。

图2.3在“DWPI手工代码”中直接查到

NON-HODGKINSLYMPHOMA细分类

人工分类过程中还有一个很棒的工具,那就是“查找相似专利”,帮您快速找到已经分类专利的相似专利,提高分类效率。

图2.4DDA中“查看相似记录”功能

第四步:自动分类。当人工分类数据越来越多,DDA分类界面左上角的置信度会不断增加。

图2.5DDA“记录分类”窗口及“置信度”

达到您认可的置信度后,便可以一键点击“开始分类”,请DDA完成剩余记录的自动分类工作。

图2.6点击“开始分类”完成“记录自动分类”

技术分类是专利分析的基础

DDA的“记录分类”功能,基于对人工分类的学习,利用机器学习技术最终帮助我们完成了吉利德专利组合技术分类。如下图3.1。

图3.1利用AI技术最终完成“吉利德”专利组合技术分类

专利的技术分类是分析挖掘一个专利包的基础,有了“技术分类”就有了分析的基础。如下我们简单快速地在DDA中制作了两个技术相关矩阵。图3.2的矩阵,您可以看到吉利德针对不同病种所开发技术方案间的关联性。图3.3,您可以看到吉利德哪些领域对其技术和治疗方案进行了“降低耐药性”、“减轻副作用”、“简化治疗方案”的改进。

图3.2不同“疾病类型”技术方案交叉分析

图3.3“疾病类型”与“功效”技术交叉分析

后记:

“夜雨晓得春风意,缤纷落尽绿满枝;新冠疫情终将尽,春归大地会有时。”

本文是“吉利德”系列的第三篇,作为一个医药领域的门外女汉纸,凭着兴趣和一点专利技能,完成了吉利德专利的检索、初步分析以及技术分类的全部工作。整理文章开头提到的“技术分类框架”大约耗费作者数小时,粗略算来完成本文涉及的所有工作花费了将近两天时间,衷心希望本文能为您提供一种专利分类的方法和思路。

??如对前两篇感兴趣,请移步以下入口查看:

《抗新冠传奇公司吉利德专利分析》

《DDA助您快速完成吉利德专利组合技术分类》

如果您有任何需求,欢迎点击文后,我们收到您的信息后会及时与您联系。

作者简介

王颖鑫

科睿唯安解决方案顾问

王颖鑫,专利代理人资格,目前任职于全球领先的专业信息服务提供商科睿唯安,担任知识产权解决方案顾问,业务范围涵盖数据库、专利分析、数据服务、专业培训等。王颖鑫顾问拥有十年以上的知识产权工作经验,曾在政府、外资公司的知识产权部门服务。熟悉包括DerwentInnovation在内的多个专利数据库,并精通海量数据分析工具DerwentDataAnalyzer,熟知各种专利分析方法论。她尤其擅长融合专利和科技文献数据为客户解决问题,已为企业、政府及学术研究机构客户完成数百个复杂的项目。在政府任职期间,也曾负责多个国家级、部级项目,并作为主要成员完成科技部首批核高基重大专项。

预览时标签不可点收录于话题#个上一篇下一篇



转载请注明地址:http://www.jilisx.com/jlbr/125618.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章