基于数据挖掘的企业竞争情报系统

朱永武

(南京航空航天大学图书馆,南京 210016

 

    知识经济时代,数据、信息成为重要的经济资源。在日新月异的海量数据里迅速提取有价值信息并尽快做出反应,成为许多企业的“致胜秘笈”。本文首先介绍了竞争情报、企业竞争情报系统。然后给出了数据挖掘的概念和数据挖掘的一般过程。在此基础上提出了一个基于数据挖掘的企业竞争情报系统模型,并介绍了相应的过程。

关键词  数据挖掘   竞争情报   企业竞争情报系统

分类号  G350

文献标识码 A

 

 

1.企业竞争情报系统

1.1什么是竞争情报?

竞争情报(Competitive Intelligence,简称CI是能够系统化的对那些可能影响公司计划、决策和运营的外部信息进行采集、分析和管理所形成的知识性信息。它主要通过合法手段从公开信息资源中依靠方法和工具收集和分析竞争对手的能力、弱点和意图等。其主要面向服务对象从研发和市场的具体业务到宏观战略决策等。

美国竞争情报从业者协会给出了一个竞争情报的标准模型(1)

 

 

1.2什么是企业竞争情报系统?

竞争情报系统(Competitive Intelligence System,简称CIS)是在企业竞争战略管理实践中出现的新概念。中国科技情报学会竞争情报分会名誉理事长包昌火先生认为,竞争情报系统是以人的智能为主导、信息网络为手段、增强企业竞争力为目标的人机结合的竞争战略决策支持和咨询系统。竞争情报系统可为企业赢得竞争优势提供强有力的智力支持和情报保障。

企业竞争情报系统主要由三个子系统组成:竞争情报收集子系统;竞争情报分析子系统;竞争情报服务子系统。竞争情报收集子系统是企业CIS的重要构成,它是企业CIS的输入系统,是竞争情报工作的基础。因此,它的工作质量和速度,决定着企业CIS的效能和效益。竞争情报分析子系统是企业竞争情报系统(CIS)的核心,是竞争情报的“制造车间”。它是以人的智力为主导,通过“黑箱”操作实行信息的集成、重组和智化。CIS及其企业竞争情报中心(CIC)的专职和兼职分析人员采用人工分析与机助分析相结合的手段,将竞争情报采集子系统所收集的信息有序化、系统化、层次化,将Information转化为Intelligence,“生产”出真正有用的竞争性情报。竞争情报服务子系统是企业CIS的输出系统,它的主要功能是面向企业各级决策层和各类用户提供情报产品和情报服务。因此,它的高效与否,关系到企业CIS的形象和成败。

可以认为,企业CIS的收集、分析、服务三个工作流程呈一个金字塔型。竞争情报收集子系统就位于这个金字塔的最底层,而竞争情报分析子系统、竞争情报服务子系统分别构成了该塔型的中间层和最高层。

 

2.数据挖掘

2.1数据挖掘的概念

数据挖掘(Data Mining,简称DM)就是利用各种分析工具从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的,但却非常有用的信息、模式(规则)和趋势,这种模型能对未来作出预测和评估。要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识。目前,数据挖掘技术在商业领域已经不是一个新名词,它最早成功应用于高投入、高风险、高回报的金融领域,现在正在不断向电信、保险、零售等客户资源信息密集的行业拓展。

2.2数据挖掘的一般过程

数据挖掘的一般过程由六个阶段组成:(图2

 

(1)定义问题:首先明确定义将要解决的问题。所以,数据挖掘者要熟悉该行业的数据和业务问题,缺乏这些,就不能够充分发挥数据挖掘的价值,很难得到正确的结果。模型的建立取决于问题的定义,有时相似的问题,所要求的模型几乎完全不同。

(2)数据准备:有些人喜欢将数据挖掘看作一个不可思议的过程,认为它吞进的是原始数据,吐出来的则是钻石。而数据准备则是这个过程的核心。这一阶段又可分为3个子步骤:数据集成、数据选择、数据预处理。数据集成将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊性、处理数据中的遗漏和清洗脏数据等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。预处理是为了克服目前数据挖掘工具的局限性。

(3)确定主题:数据挖掘过程的第三步是确定研究主题。数据挖掘是一个经常需要回溯的过程。因此,没有必要在数据完全准备好之后才开始进行数据挖掘。随着时间的推移,你所使用的数据、你对它们分组的方式以及数据清洗的效果等都将改变,并有可能改进整个模型。这一步会涉及到了解研究主题的局限性,选择待完成的良好研究主题,确定待研究的合适的数据元素,以及决定如何进行数据操作等。

(4)读入数据并建立模型:一旦确定要输入的数据之后,接着就是要用数据挖掘工具读入数据并从中构造出一个模型。根据所选用的数据挖掘工具的不同,所构造出的数据模型也会有很大的差别。

(5)挖掘操作:依照上述准备工作,利用选好的数据挖掘工具在数据中查找。这个搜索过程可以由系统自动执行,自底向上搜索原始事实以发现它们之间的某种联系,也可以加入用户交互过程,由分析人员主动发问,从上到下地找寻以验证假设的正确性。对数据挖掘的搜索过程需要反复多次,通过评价数据挖掘结果以不断调整数据挖掘的精度,以达到发现知识的目的。

(6)结果表达和解释:根据最终用户的决策目标对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策支持工具提交给决策者。

 

3.基于数据挖掘的企业竞争情报系统模型

知识经济时代,数据、信息成为重要的经济资源,随着信息资源总量的日益膨胀,企业面对堆积如山的数据往往无可奈何,无法充分发掘出应有的经济价值。在日新月异的海量数据里迅速提取有价值信息并尽快做出反应,成为许多企业的“致胜秘笈”。CIS是一个以竞争情报为处理对象的决策支持系统,它要求其数据平台建立在企业集成数据环境下,仅以企业的MISMRPⅡ、ERP数据库为数据源是不足以支持CIS的决策分析系统的。因此,利用数据挖掘技术充分实现数据的分析,从而构成一个全面高效的为企业高层决策服务的CIS系统。

基于数据挖掘的企业竞争情报系统模型如图3所示:

 

竞争情报收集子系统是企业CIS提供决策支持的基础。从上图我们可以看出,在企业竞争情报的收集阶段,企业内外部的信息源主要通过企业Intranet、企业Web站点、Internet资源、联机数据库等平台存放到竞争情报的数据仓库中。对于企业而言,不管是内部的人事、财务、生产、销售等信息,还是外部的宏观政策、市场需求、竞争对手等情报,都是纷繁复杂的。且表现形式也多种多样,包括报告、报表、图形、声音、视频、演示文稿等。因此,不论对于何种形式、何种渠道收集的数据和信息,竞争情报收集子系统都应具备收集、存储的能力。从技术角度来讲,竞争情报收集子系统应该具备录入、数据格式转换、信息分类导入、信息自动收集等基本功能。

竞争情报的分析是企业CIS的核心。常规的分析方法诸如SWOT分析、BCG产业矩阵、、战略联盟、回归分析法、核心竞争力分析、经验曲线、多元化业务分析等。对竞争情报人员而言,仅仅依靠直觉、判断以及归纳、推理等常规方法来进行数据分析是远远不够的。如何对存放在数据仓库中的数据进行挖掘成为关键。有人曾这样比喻:数据仓库和数据挖掘好比一个大的厨师烧菜,开始需要选择原料,然后,将各种原料加工完毕(洗、切、剁等等),分门别类的放在厨房,这时候厨房就像数据仓库。厨师根据这些原料做出菜肴,就像数据挖掘得出有意义的知识。通俗地讲,数据挖掘就是对海量数据进行精加工;严格地说,数据挖掘是一种技术,从大量的数据中抽取出潜在的、不为人知的有价值信息、模式和趋势,然后以易于理解的可视化形式表达出来,其目的是为了提高市场决策能力、检测异常模式、控制可预见风险、在经验模型基础上预言未来趋势等。

竞争情报服务子系统的主要功能是根据各类用户包括情报人员、决策者以及企业内部其他人员的信息需求,动态地建立各类分析报告,诸如情报产品、情报服务、情报传播等,并通过约定的方式及时地将它们传递给用户。情报产品是情报服务和情报传播的主要内容和形式,是企业CIS的最终产品和成果体系。其中,尤以各类情报分析报告为主要形式。情报服务应具有分类浏览、多途径检索、最新推送服务三大功能。同时,情报服务应该突出其高效、快捷的服务特点,企业Intranet平台将有助于提高服务的效率。竞争情报服务子系统的服务效果体现在以适当的形式及时将情报传递到用户手中。竞争情报的传播方法应当与用户需求相呼应。企业在选择传播方法时,应当对速度、准确度、清晰度和安全性等因素综合考虑。

随着企业市场竞争的日益加剧,企业竞争情报已经不限于原有意义上的数据采集、整理、分类、发布的概念,“在线”需求逐步超越“离线”需求,“受动式服务”正为“主动式、自助式”服务所取代,数据挖掘技术已经成为“信息分析”这个企业竞争情报系统中核心模块的技术支撑。企业级数据挖掘在CIS中的应用,也将成为知识经济下新兴的数据服务模式。

 

 

【参考文献】

[1] 王振强.用知识管理思想建设企业竞争情报——通过信息综合利用实现企业竞争智能.

    http://www.ccw.com.cn/htm/center/app/02_10_10_2.asp2004-12-15.

[2] 包昌火等编著.《企业竞争情报系统》[M].北京:华夏出版社,2002

[3] 陆琼,彭志杰.浅谈数据挖掘[J].西部探矿工程,2004(11)229-231.

[4] 苗杰,倪波.面向集成竞争情报系统的数据挖掘应用研究[J].情报学报,2001(8)443-450

 

A Model of Corporation Competitive Intelligence System

Based on Data Mining

 

Zhu Yongwu

(Library of Nanjing University of Aeronautics and AstronauticsNanjing 210016)

 

Abstract : In knowledge economy era, data and information become important economy resources. Drawing valuable information quickly from great amount of datum and reacting immediately, will become the key of corporation success. The paper introduces Competitive Intelligence and Corporation Competitive Intelligence System (CIS) firstly. Then, the paper gives the concept of Data Mining and general process. Furthermore, the paper gives a model of Corporation Competitive Intelligence System based on data mining and its relevant process.

Key Words : data mining; competitive intelligence; Corporation Competitive Intelligence System