5.Assess──模型和知识的综合解释和评价
从上述过程中将会得出一系列的分析结果、模式或模型。若能得出一个直接的结论当然很好。但更多的时候会得出对目标问题多侧面的描述。这时就要能很好的综合它们的影响规律性提供合理的决策支持信息。所谓合理,实际上往往是要你在所付出的代价和达到预期目标的可靠性的平衡上作出选择。假如在你的数据挖掘过程中,就预见到最后要进行这样的选择的话,那末你最好把这些平衡的指标尽可能的量化,以利你综合抉择。
你提供的决策支持信息适用性如何,这显然是十分重要的问题。除了在数据处理过程中SAS软件提供给你的许多检验参数外,评价的办法之一是直接使用你原来建立模型的样板数据来进行检验。假如这一关就通不过的话,那末你的决策支持信息的价值就不太大了。一般来说,在这一步应得到较好的评价。这说明你确实从这批数据样本中挖掘出了符合实际的规律性。
四、案例分析
本案例是应用SAS的数据挖掘方法(SEMMA)、工具(SAS/EM)及采用人工神经网络模型对某集团对其某一个产品客户是否愿意购买的调查表响应的分析和决策。如果不采用数据挖掘这一工具,对此问题,企业的决策者可能会显得茫然,或凭经验或凭直觉给出极为粗略的答复。
图1是用SAS/EM一个数据挖掘的界面。在SAS/EM的窗口下,只需Drag-and-Drop即可迅速的实现该项目的挖掘过程的搭建,包括创建数据源、数据取样、数据分割、变量转换、数据探索及预处理、人工神经网络建模、模型评估和决策及展示等。
图1:SAS/EM数据挖掘的过程及界面(点击见图)
图2是对该活动利用人工神经网络做出的结果。从图2中可以看出,当企业不进行任何建模分析时,盲目的将调查表发出,其响应率约为23.9%。这样既浪费了人力、才力和时间,又不能调查者进行分析,我们并不知道具有什么特征的客户喜欢这个产品并将调查表提交。神经网络能够根据数据集的分布特征自动的发现规律,并以权值表示之。这些权值实际上表征着并隐藏着客户的特征,如年龄在30-45岁之间的大多数客户喜欢该产品并乐意将调查表提交。从图2中看出,如果企业将调查表减少为原来的30%,并按神经网络权值隐含的规则散发调查表,其响应率可望达到33%。如果企业将调查表减少为原来的10%,并按神经网络权值隐含的规则散发调查表,其响应率可望达到51%。
图2:神经网络模型的分析(点击见图)
图3是在图2神经网络模型指导下,对新的数据源进行决策的结果的展示。按照该神经网络模型权值隐含的规则,发出调查表,响应率高达48%。这样,既节约了人力,财力,又对客户的特征进行了分析,为企业的决策提供了支持。
图3:利用神经网络作出的决策的展示(点击见图)
小结
在信息时代,要充分利用企业的信息资源,从以产品为中心的管理模式转变为以客户为中心的管理模式上来,利用数据挖掘技术,分析客户的特征,探索企业和所对应市场的运营规律性,不断提高企业的经济效益是企业发展的必由之路。
国能科诺-赛仕企业数据挖掘实验室愿意同您共同成长,通过我们的知识和您的实践经验相结合,携手建立符合您企业自身特征的商用模型,为企业的发展做出贡献。
[赵纪元 国能科诺--赛仕企业数据挖掘实验室]