函数 | 作用 |
---|---|
df.sample() | 打乱数据 |
df.replace() | 替换数据 |
df[‘id’].astype(int) | 类型转换 |
df.coloumn[df.column.?]=x | 修改满足条件的数据 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
# 打乱(shuffle)数据 df = df.sample(frac=1).reset_index(drop=True) # 打乱数据 ''' Args: frac: 保留的比例,如果30%保留,则设置为0.3 ''' # 替换某一列的值 merge['f7']=merge['f7'].replace({'CPC':0,'CPM':1,'CPD':2}) # 修改类型 df['id']=df['id'].astype(int) # 修改满足条件的数据 df.probability[df.id.isin(b)]=0.000000 # 删除数据 q=p.drop(['uid_aid'], axis=1, inplace=True) # 删除一列,inplace表示是否需要保留副本 q=p.drop([0,1,2,3]) # 删除行 condition=p[p['id']<10] q=p.drop(condition.index) # 删除满足条件的行 # 删除变量(释放内存) del df |