本书主要围绕专利分析中数据处理流程,以分步讲解、整体演示的形式,结合具体专利检索分析工具的操作实例,将数据处理分析图清晰地展现出来。本书分为数据源处理、数据的清洗和记录、数据的规范化及标引、数据信息的可视化呈现,根据市场上不同专利检索分析工具的特点,设计出了一些简单、实用的操作攻略,供用户按图索骥完成数据处理流程。
专利分析智能化在我国是一种专利分析趋势,也是以后的一个发展方向。
数据处理是专利检索和分析报告撰写的沟通桥梁,是将检索到的原始数据转化为专利分析样本数据的关键环节,是专利分析中的基础性环节之一。数据处理的好坏直接决定了专利分析结果的准确性。掌握数据处理技术将在很大程度上提升专利分析的质量和效率。
本书详细介绍数据处理的方法,希望能够为专利分析人员提供帮助。
本书内容分为三大部分:第一部分(第1~2章)概述了数据处理的基本概念及数据源,意在让读者大概了解数据处理及数据源;第二部分(第3~6章)介绍数据处理的具体内容及方法,重在让读者掌握专利分析中数据处理的基本方法,并在此基础上能够发现使用专利分析工具进行数据处理时可能存在的问题;第三部分(第7~9章)介绍了第二部分的具体方法在专业分析工具中的应用,并对数据处理的未来前景进行了展望。
本书第一章由潘光虎、李宗韦执笔;第二章由汤艳莉、孙跃飞、危峰、叶晓林执笔;第三章由井庆涛、刘伟、王进锋执笔;第四章由褚战星、孙琨执笔;第五章由潘光虎执笔;第六章由陈涛、左良军执笔;第七章由李斌、邵景春执笔;第八章由赵佳睿、江钒执笔;第九章由叶晓林、孙跃飞、危峰执笔;全书由潘光虎、叶晓林统稿。
苏州慧谷知识产权服务有限公司给予了大量的人力和物力支持,在此表示诚挚的感谢。
希望本书的出版,能为提升专利分析中数据处理水平、促进专利分析软件优化起到积极的作用。专利分析方法知识浩瀚如海,数据处理知识巍峨如山,虽然本书竭尽作者之能,但仍难免存在偏差和错误,敬请广大读者见谅。
国家知识产权局专利局
审查业务管理部
2018年7月15日
褚战星,2007年,毕业于北京师范大学高分子化学与物理专业,进入国家知识产权局专利局工作。现就职于国家知识产权局专利局审查业务管理部研究处。曾就职于国家知识产权局专利局化学发明审查部。具有6年化工、材料领域发明专利实质审查经验,PCT审查员、兼职复审员。目前就职于国家知识产权局专利局审查业务管理部,担任国家知识产权局专利分析普及推广项目负责人,组织和管理专利分析研究课题,从事专利分析理论和方法的研究。参与和指导生物医用天然多糖、高性能纤维、氟化工等10余个专利分析研究课题。熟悉专利分析全流程。参与《专利分析实务手册》的撰写和统稿工作。从态势、布局、竞争对手和特色等方面对专利分析方法进行了总结,撰写了专利分析方法一章。在专利布局分析、竞争对手分析等方面有较深入的研究。参与《产业专利分析报告(第6册)》、《产业专利分析报告(第14册)》和《产业专利分析报告(第26册)》的撰写和统稿工作。全国专利信息师资人才。国家知识产权局专利分析评议培训讲师。国家知识产权示范城市专利分析指导专家。多次担任知识产权示范城市专利分析实战班和专利布局实战班培训讲师。担任全国知识产权分析评议培训班讲师。担任中国视像协会专利分析培训班讲师。担任医药领域专利分析培训班讲师。多次担任知识产权研究会专利分析培训班讲师。多次担任中国专利保护协会培训班讲师。多次赴企业进行专利分析、专利挖掘、专利布局和专利申请撰写等方面的培训和指导。
第1章数据处理概述
1.1专利分析基本概念
1.2数据处理概述
1.3数据的内容及分类概述
1.4数据处理的基本工具
1.4.1专利分析工具
1.4.2Excel在专利分析中的应用
第2章数据源
2.1专利申请/公开信息
2.1.1申请/公开数据类型
2.1.2申请号的标准化处理
2.2相关案件信息
2.2.1相关案件数据类型
2.2.2专利族信息的处理
2.3相关人信息
2.3.1相关人数据类型
2.3.2专利权人/申请人信息的处理
2.3.3专利地域标准化数据的处理
2.4引证/施引信息
2.4.1引证/施引相关数据
2.4.2引证/施引信息来源与处理
2.5技术信息
2.5.1技术信息相关数据
2.5.2技术信息的来源与处理
2.6法律状态信息
2.6.1法律状态相关数据
2.6.2法律状态信息来源与处理
2.7无效宣告/复审信息
2.8诉讼信息
2.8.1诉讼信息相关数据
2.8.2专利诉讼信息来源
2.9统计/索引信息
2.10总结
第3章数据清洗
3.1数据清洗方法及实现
3.2数据清洗流程
3.3清洗示例
3.4清洗常见问题及处理方法
第4章数据记录处理
4.1数据的拼接
4.1.1数据拼接的意义
4.1.2数据拼接的实现
4.2数据记录的去重
4.2.1数据去重的意义
4.2.2数据去重的实现
4.3数据记录的去噪
4.3.1数据去噪的意义
4.3.2数据噪音的来源
4.3.3数据去噪方式
4.3.4数据去噪主要手段
4.4数据记录处理常见问题
第5章数据规范化
5.1数据规范化概述
5.1.1数据规范化定义
5.1.2数据规范化作用
5.1.3数据常见问题
5.1.4数据规范化基本内容
5.2数据字段的规范化
5.2.1日期型数据处理
5.2.2数值型数据处理
5.2.3文本型数据的规范化
第6章数据的深加工:标引
6.1数据标引的基本内容
6.2数据标引的基本原则
6.2.1技术主题分解环节的定位
6.2.2技术主题分解的原则
6.2.3技术分解环节的几种常见形式
6.2.4数据标引的基本原则
6.3数据标引的基本方法
6.3.1基于Excel的人工阅读标引方法
6.3.2基于检索辅助的批量标引方法
6.3.3基于专利分析系统的数据标引方法
第7章信息的呈现
7.1信息可视化概述
7.2专利分析维度与图表的适用
7.2.1专利态势分析
7.2.2专利技术分析
7.2.3申请主体分析
7.3主流专利分析系统数据可视化的表现
7.3.1信息可视化的人性化表现
7.3.2信息可视化的智能化表现
第8章数据处理的全流程实例
8.1Power Query、Power BI自动化分析实例
8.1.1概述
8.1.2数据来源
8.1.3数据校验和准备
8.1.4数据加工
8.1.5数据建模和可视化
8.2Patentics客户端软件专利分析实例
8.2.1概述
8.2.2专利分析的检索
8.2.3分析数据的导入
8.2.4分析数据的处理
8.2.5专利数据标引
8.2.6数据统计
8.2.7可视化
第9章结束语
9.1向着智能化和人性化发展的专利分析方法
9.2不远的未来
'