数据挖掘平台从海量数据中,通过算法搜索隐藏于其中信息。平台通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现目标。通过数据挖掘平台,将海量数据转化为宝贵的“数据资产”。
以一家银行为例,银行拥有客户相关的很多数据,包括客户 ID、年龄、性别、婚姻状况、职业、账龄、储蓄存款户头、是否使用信用卡、平均余额、信用交易数量、借记交易数量等。在银行日常业务中,我们经常需要回答下面的问题:如何将客户进行细分,便于从中找出有价值的部分客户?在现有客户中那些客户对银行具有有潜在风险?哪些客户与众不同,是否存在商机?哪些客户是信用卡业务的潜在客户,如何进行预测?
采用数据挖掘中的分群、预测、孤立点识别等方法,基于银行客户基本信息数据、交易数据构建数据挖掘模型,进行客户分群、孤立点识别以及分类预测等挖掘分析,从而找出有价值的客户、规避潜在风险、找出商机、找到潜在客户,真正将海量数据转化为宝贵的“数据资产”。