脏数据的隐患

http://tech.ddvip.com   2008年01月18日    社区交流

内容摘要:本文引用一些经典案例为你讲述当数据整合出现问题时会遇到的麻烦……

  这并不是客户的疏忽,只是自然发生的问题。私营企业上市、被并购或者拆分,而他们的股东数据却一直被保留着,甚至长达数十年之久。不过这些垃圾数据所引起的问题可能比起在不必要的邮寄费用上浪费一点钱更为严重。最令人担心的问题莫过于欺诈和盗窃ID,如果这些情况发生在颇具影响力的机构组织里,必会导致更为严重的现实问题,例如已故股东的红利被陌生人兑现,继承人的继承权被剥夺,公司机密泄漏等等。

  那么要怎么解决这个问题呢?利用商业评测软件可以识别不同系统的异常数据并做好标记方便检查。即便如此,所有的企业都应当加强重视,做好内部监控,严格执行例行的基本检查。事实上,每一个企业都或多或少存在垃圾数据方面的问题。从风险管理的观点来看,最好的解决方案就是持之以恒地检查。如果你从上文的内容能认识到这个自然发生的现象可能会对你产生什么影响的话,已经有了一个好的开始。

  3. 数据重复的代价

  用户出错会引发麻烦事,用户自作聪明造成的问题可能更严重。某保险公司从上世纪70年代开始就将大部分客户资料保存在一个主应用软件中,并规定数据录入操作员录入新数据前先要搜索数据库中是否已经有该客户的记录,但是搜索功能执行起来非常慢而且不够准确,所以大多数操作员不再执行这一步骤,而从头开始输入新记录,这样做确实简单轻松多了。然而,结果是很多客户公司的记录在数据库里重复达几百次,使系统运行地更慢,数据搜索结果更加不准确,形成了恶性循环。

  不幸的是,这个应用软件已经根深蒂固的嵌入到该公司的其他系统了,管理部门不愿意花钱把它替换掉。最后,该公司的IT部门发现如果公司再也无法查找用户资料了,将会造成的每天75万美元的损失。直到这时候,公司才如梦初醒,使用识别系统来清洗数据,最终清除了近四万条重复记录。

来源:IT专家网    作者:cyw    责编:豆豆技术应用

正在加载评论...