算法
用Python算法预测客户行为案例!
这是一份kaggle上的银行的数据集,研究该数据集可以预测客户是否认购定期存款y。这里包含20个特征。 1. 分析框架 2. 数据读取,数据清洗 # 导入相关包 import numpy as np import pandas as pd # 读取数据 data = pd.read_csv('./1bank-additional-full.csv') # 查看表的行列数 data.shape 输出: 这里只有nr.employed这列有丢失数据,查看下: data['nr.employed'].value_counts() 这里只有5191.0这个值,没有其他的,且只有7763条数据,这里直接将这列当做异常值,直接将这列直接删除了。 # data.drop('nr.