03 理解用户数据在数据仓库的落库逻辑
在熟悉了数据表里的字段和表的相互关系后,接下来就需要感受数据在业务逻辑中的流动和落盘。
一个数据老鸟在和业务沟通时候,会在脑子里带着表结构去询问业务的SOP。
当业务说用户注册账户,脑子里就要想着在用户维度表增加一行,用户注册的相关信息会被记录在这个维度表里。
然后用户填写相关的表格提交信息,就会知道我们收集的用户信息会按SOP流程在规定的时间落盘在用户信息表中。
其中哪些信息是必须非空的,哪些是可以有缺失的,缺失的时候数据表里是None值还是默认值。
如果用户更新这些信息,数据表是新增一个记录还是覆盖已有的记录?会对我们后续建模有无影响?是否有未来信息泄露的可能?
用户在从下.........
在数据分析中,大家往往会比较重视数据清洗,数据统计和特征构建这些所谓的高级工作,而比较容易忽略数据获取这个环节。 大家可能会说,从数据仓库取数据不是一件很easy的事…
原文转载:https://www.kjdsnews.com/a/1524360.html
qid:https://m.ikjzd.com/w/496
朱希:https://m.ikjzd.com/w/1684
芒果店长:https://www.ikjzd.com/w/1533
折扣网:https://www.ikjzd.com/w/74
crowd:https://m.ikjzd.com/w/880
bargain:https://m.ikjzd.com/w/2019
twin:https://m.ikjzd.com/w/1338
pixabay:https://m.ikjzd.com/w/702
圣诞节:https://www.ikjzd.com/search?keyword=圣诞节
独立站优秀案例分析:宠物服饰品牌SparkPaws是如何打动铲屎官的?:https://www.kjdsnews.com/a/1524359.html
金融风控数据分析策略 :https://www.kjdsnews.com/a/1524360.html
No comments:
Post a Comment