浅谈数据挖掘在CRM中的应用
CIO时代 发表于:13年05月30日 12:21 [转载] 比特网
一、CRM理论
CRM是Customer Relationship Management的缩写,即客户关系管理。CRM 是一种商业策略,目的是在企业和特定的客户之间,保持一个长期的、提高企业的赢利和销售收入的业务关系。
1.CRM定义
目前对CRM的定义,不同的研究机构有着不同的表述。Swift认为CRM是企业经营方法,通过企业和客户之间交流来了解并进一步影响客户行为,从而为企业赢得更多的新客户,留住老客户。Kincaid认为,CRM是一种综合使用了企业管理中的信息、企业运营机制、信息技术特别是互联网技术的商业战略。Parvatiyar and Sheth认为CRM是一种综合的策略和进程,包括赢得新客户,留住老客户,以及与特定的客户合作。这些CRM的定义强调的重点是,认为CRM是为了获得新客户和留住老客户而采取的商业流程,在商业智能的帮助下,使企业最大化的获得客户价值。
2.CRM分类
从体系结构的观点来看,CRM分为操作型CRM和分析型CRM。操作型CRM指的是业务流程(企业的市场、销售、服务等)的自动化,而分析型CRM指的是分析企业的客户关系管理系统中的各种数据,从而了解客户的消费特点和预测客户的行为,目的是为企业的经营和决策提供科学依据。
二、数据挖掘理论
数据挖掘的定义:Turban, Aronson, Liang, 和 Sharda认为数据挖掘是从巨大的数据库中通过使用统计、数学、人工智能和机器学习技术,识别和提取有用的信息并随后获得知识的过程。Lejeune,Ahmed, Berry 和Linoff, Berson et al也提供了类似的定义,认为数据挖掘是从巨大的数据库中提取或探知隐藏的模式、信息的过程。
三、CRM的维度和数据挖掘模型
Swift, Parvatiyar and Sheth, Kracklauer认为,CRM包含四个维度:客户识别、客户吸引、客户保留和客户开发。
这四个维度可以被看作是一个客户管理系统的封闭循环。数据挖掘能够根据数据建立模型。每种数据挖掘技术可以生成一个或更多个以下类型的数据模型:关联、分析、分类、聚类、预测、回归、序列的发现和可视化。
1.CRM维度
(1)客户识别。CRM开始于客户识别,有些文章中也称作客户获得。这个阶段的目的就是找到最有可能成为企业的新客户;对企业来说最有价值的是老客户;本阶段还要识别出那些即将流失的客户并且研究如何挽回。
(2)客户吸引。本阶段是客户识别完成后的下一阶段。发现了潜在客户群后,企业可以采取相应的营销策略来吸引这些潜在客户群。吸引客户的一个有效方法就是直接营销,直接营销是企业向客户直接进行推销,通过多种多样的渠道刺激客户直接下单。
(3)客户保留。CRM最关心的部分。企业为防止老客户流失而运用的一系列策略来提高客户的满意度。客户满意度指的是客户对企业的期望值与客户本身所感知之间的比较,是企业能留住老客户很重要的条件。企业保留老客户的方法包括一对一营销、客户忠诚度项目和投诉管理。一对一营销指通过分析、发现和预测特定客户的行为,对客户进行的有针对性的个性化营销活动;客户忠诚度项目的目的是企业和客户维持较长时间的业务联系。客户忠诚度项目包括客户流失的分析、信用评分、服务质量和对忠诚度项目的满意度。
(4)客户开发。包括交易强度,交易价值和个别客户盈利能力持续的发展。客户开发的要素包括客户生命周期价值的分析,升级销售/交叉销售和市场购物篮分析。客户生命周期价值指企业从客户身上所获得的总净收益。升级销售指在合适的时间,为合适的客户提供合适的服务。交叉销售指将各种资源(时间,金钱、构想、活动等)整合,从而降低成本,通过多渠道使企业接触到更多的潜在客户。市场购物篮分析的主要目的是通过分析客户购买行为的数据,挖掘出隐藏在客户购买行为后面的规则,最大化客户交易强度和价值。
2.数据挖掘模型
(1)关联。关联的目的就是找到所给记录之间存在的某种规律。市场购物篮分析和交叉销售都是关联模型典型的例子。关联模型的常用建模工具是统计和apriori算法。
(2)分类。分类是数据挖掘中最常见的学习模型之一。分类是将数据库中的记录按照预先定义好的标准进行分类,从而建立一个模型来预测客户的未来行为。常见的分类工具是神经网络、决策树和if-then-else规则。
(3)聚类。聚类的目的是将多样化的人群分组成若干相同性质的群里。聚类与分类是不同的,聚类在算法开始的时候是未知的,聚类的常用工具是神经网络和判别分析。
(4)预测。预测用来估计记录模式的将来价值。它涉及到建模和未来某一段时间内模型的逻辑关系。预测模型的一个典型例子就是需求预测。预测的常用工具是神经网络和生存分析。
(5)回归。回归是一种统计估计技术,目的是将每个数据对象映像到真正有意义的预测价值。回归包括曲线拟合、预测、建模的因果关系和测试的科学假设变量之间的关系。回归的常用工具包括线性回归和逻辑回归。
(6)序列发现。序列发现是关联识别或超时模式。目的是模拟序列产生过程的状态,提取和报告偏差和超时趋势。序列发现的常用工具是统计和集合理论。
(7)可视化。可视化指数据显示从而使用户能查看复杂的模式。
一般与其他的数据挖掘模型一起使用,可以更明白地了解已发现的模式或关系。可视化模型的典型例子是三维图形。
3.根据数据挖掘技术进行分类的文章分布统计
根据数据挖掘技术进行文章分类如表1。
表1 关于数据挖掘技术的文章分类
本文的研究有以下几个重要的意义:(1)数据挖掘技术在CRM中的应用研究,在将来会明显地增加。(2) 34种数据挖掘技术已经被应用到CRM里,神经网络是最常用的技术。87篇文章中30篇(占34.5%)是关于神经网络;其次是决策树21 篇(占24.1%);关联规则20篇(23.0%)。本研究还有一些局限性。首先,此次研究只调查发表在2000年到2006年之间的文章,而且这些文章都是基于关键词“客户关系管理”和“数据挖掘”的搜索而得到的。其次,本研究所用的文章是在7个在线数据库找到的,可能还有其他的学术期刊能够提供一个更全面的有关数据挖掘在CRM中的应用的文章。最后,非英语出版物被排除在这个研究。