数据整理

根据订单购买记录表,提取出一张用户基本信息表。

💡 通过 AI 理解哪些字段属于用户记录,自动推断需要保留的列,同时根据会员编码去重,即可达到目的

示例数据

交易时间会员名称会员性别会员状态会员编码信息完整度出生日期可退换货数量商品名称商品编码支付金额最后购买时间最后购买金额来源渠道标准售价活跃度累计购买次数累计购买金额订单编码退货数量销售净额销售数量

2024-08-20 18:15:03

杭源垣

未知

[50]正式会员

PP240321689842

0

2

维生素 AD 滴剂

12051054

91.60

2024-08-20

91.6

上海高济余天成大药房有限公司

45.80

活跃 A

3

3,352

22859008

0

91.60

2

2024-08-20 18:00:26

宁媚如

[50]正式会员

PP181127268580

0

1

甲磺酸溴隐亭片

22041774

90.50

2024-08-20

90.5

高济总部

90.50

活跃 A

6

3,730.9

22858992

0

90.50

1

2024-08-20 15:09:14

蓬妤殉

[50]正式会员

PP181127269347

0

1

萘敏维滴眼液

13186276

13.97

2024-08-20

30.2

一德泰和药房

13.97

活跃 A

230

15,987.1

22858897

0

13.97

1

2024-08-20 15:09:14

蓬妤殉

[50]正式会员

PP181127269347

0

1

复方醋酸地塞米松乳膏

13187858

16.23

2024-08-20

30.2

一德泰和药房

16.23

活跃 A

230

15,987.1

22858897

0

16.23

1

提示词

这是一份用户订单数据,请根据表头识别哪些字段和用户基本信息相关,帮我整理出来,最终生成一张用户表,注意根据会员编码去重

AI 回复内容

首先,根据用户的基本信息,我们可以识别出以下与用户相关的字段:

  • 会员名称

  • 会员性别

  • 会员状态

  • 会员编码

  • 出生日期

  • 信息完整度

接下来,通过这些字段生成一张用户表,并根据会员编码进行去重。以下是处理步骤:

  1. 从原始数据中提取与用户基本信息相关的字段。

  2. 根据会员编码去重,保留唯一的用户记录。

以下是实现这些步骤的 pandas 代码:

import pandas as pd

user_columns = ['会员名称', '会员性别', '会员状态', '会员编码', '出生日期', '信息完整度']
df_users = data["CRM Data"][user_columns].drop_duplicates(subset='会员编码')
df_output = df_users.reset_index(drop=True)

结果

会员名称会员性别会员状态会员编码出生日期信息完整度

杭源垣

未知

[50]正式会员

PP240321689842

0

宁媚如

[50]正式会员

PP181127268580

0

蓬妤殉

[50]正式会员

PP181127269347

0

苏丰宽

[50]正式会员

PP181127269016

0

贺蓉凝

[50]正式会员

PP181127265499

0

Last updated