数据埋点的大而全陷阱
抓大放小,从核心数据着手:数据埋点是指针对特定用户行为或事件进行捕获,处理和发送的相关技术及其实施过程,是数据治理中范围圈定的一环。 出于对**的考虑,客户往往倾向于做一个覆盖全业务和技术域的、大而全的数据治理项目,将每个数据都纳入到数 据治理的范围中,这就导致进行数据埋点时放纵提需,埋点需求爆炸,给后续的数据治理和数据分析带来隐患。为避免数 据埋点的大而全陷阱,企业应该做到抓大放小,谨记2/8原则——80%的问题产生于20%的系统和数据——从较核心的系 统、较重要的数据、较容易产生问题的地方开始着手做数据治理。
什么是数据埋点:数据埋点是指针对特定 用户行为或事件进行捕获, 处理和发送的相关技术及其实施过程,是数据治理中范围圈定的一环。针对不**为的埋点采集,从埋点在应用中的位置也可 以区分成前端埋点、后端埋点等;从实现手段上划分,可分为:代码埋点、可视化埋点、全埋点等。
数据埋点的大而全陷阱:出于对**的考虑,客 户往往倾向于做一个覆盖全业务和技术域的、大而全的数据治理项目,每个数据他们希望 都能被纳入到数据治理的范围中。这就需要尽可能捕获、处理和发送产品的大量事件的相 对全面的属性,而这就挟持了 厂商进行“大而全”的数据埋 点,但“大而全”的数据埋点会随之带来许多问题。
潜在危害:大而全的数据埋点会占用大量空间和流量,数据治理后 得到数据质量低,后续数据 分析困难,从而沟通协作和 整体项目推进出现问题。
预防措施:埋点需求和设计需要有明确的提需规范和把控。 a.需求侧:确立好自身AI 应用的需求,以及需求对应 下的数据范围。 b.供给侧:充分了解客户 的公司架构与数据结构,引 导客户选定可行性高、实施 性高的应用落地与数据框
数据治理体系的流转运营:沟通、组织、聚焦、文化
为能充分发挥数据治理的价值、避免一次性数据治理,供需两侧要齐心协力,共同、持续、优质地运营数据治理体系。数 据治理是系统性工程,是由上至下指导,由下而上推进的体系工作。因此,供给侧企业与需求侧厂商,在体系运营和建设 方面需形成共识,具备明确的目标、合理的组织、严格的监管、完善的系统,这样才能使数据治理工作得到**,达到体 系的流转运营。
完善数据安全治理框架,确保数据安全合规
数据泄露事件在大数据时代层出不穷,随着行业新网络形态、新技术以及新应用场景的发展,新的数据类型、数据生产方 式、数据处理方式和终端形式不断涌现,数据安全挑战也随之加剧。国家已出台各级各行业的法律法规及配套文件,不断 加大数据安全与隐私保护的监管力度。对此,企业需建立符合企业管理现状及发展需求的数据安全治理框架,数据在采集、 存储、传输、处理上均有对应的执行管理依据,做到挖掘数据资产、发挥数据价值的同时,确保数据全周期的安全与合规。
将数据治理流程化、自动化、智能化
数据规模的指数级增长给数据治理工作带来巨大压力,传统人工方式做数据的清洗、分辨与调优使治理工作耗时冗长,带 来高昂的人力成本,且愈发难以满足智能应用对数据在规模量与质量的高要求,传统的人工数据治理工作已变得捉襟见肘。 如今,人工智能和RPA等技术手段已被逐渐应用于数据治理的模型管理、质量管理、资产管理、元数据管理等模块,较终 实现数据系统的“自治与自我进化”。总体来看,*技术手段应用可以让数据治理工作趋于流程化、自动化与智能化, 同时让数据变得可扩展、更负责可溯、更可信,已然成为未来数据管理发展的必由之路。
最后,珠海银弹谷数据治理服务中心表示:数据治理有效的解决企业数据难以整合利用、数据质量差乱、数据共享服务低、数据资产管理手段等痛点,为企业提供高效的数据分析工具!
详情请查看报告,文章主要信息来源《2022年中国面向人工智能的数据治理行业研究报告》。
珠海银弹谷网络有限公司专注于零代码开发,原型工具,协同工具等