数据整理
Last updated
Last updated
根据订单购买记录表,提取出一张用户基本信息表。
💡 通过 AI 理解哪些字段属于用户记录,自动推断需要保留的列,同时根据会员编码去重,即可达到目的
2024-08-20 18:15:03
杭源垣
未知
[50]正式会员
PP240321689842
0
2
维生素 AD 滴剂
12051054
91.60
2024-08-20
91.6
上海高济余天成大药房有限公司
45.80
活跃 A
3
3,352
22859008
0
91.60
2
2024-08-20 18:00:26
宁媚如
男
[50]正式会员
PP181127268580
0
1
甲磺酸溴隐亭片
22041774
90.50
2024-08-20
90.5
高济总部
90.50
活跃 A
6
3,730.9
22858992
0
90.50
1
2024-08-20 15:09:14
蓬妤殉
女
[50]正式会员
PP181127269347
0
1
萘敏维滴眼液
13186276
13.97
2024-08-20
30.2
一德泰和药房
13.97
活跃 A
230
15,987.1
22858897
0
13.97
1
2024-08-20 15:09:14
蓬妤殉
女
[50]正式会员
PP181127269347
0
1
复方醋酸地塞米松乳膏
13187858
16.23
2024-08-20
30.2
一德泰和药房
16.23
活跃 A
230
15,987.1
22858897
0
16.23
1
首先,根据用户的基本信息,我们可以识别出以下与用户相关的字段:
会员名称
会员性别
会员状态
会员编码
出生日期
信息完整度
接下来,通过这些字段生成一张用户表,并根据会员编码进行去重。以下是处理步骤:
从原始数据中提取与用户基本信息相关的字段。
根据会员编码去重,保留唯一的用户记录。
以下是实现这些步骤的 pandas 代码:
杭源垣
未知
[50]正式会员
PP240321689842
0
宁媚如
男
[50]正式会员
PP181127268580
0
蓬妤殉
女
[50]正式会员
PP181127269347
0
苏丰宽
女
[50]正式会员
PP181127269016
0
贺蓉凝
男
[50]正式会员
PP181127265499
0