用numpy和pandas进行数据分析

   日期:2024-12-27    作者:b934944 移动:http://mip.riyuangf.com/mobile/quote/68510.html

入门
1.Series
2.DataFrame
3.pandas io 操作
4.indexing & Selecting
5.reindx(对列,行
6.Nan
7.多级index
8.map和replace
进阶
1.Series,DataFrame简单计算(加减乘max,min,describe
2.Series,DataFrame排序
3.DataFrame重命名
4.DataFrame的merge
5.Concatenate和Combine(结合,填补
6.用apply处理数据
7.Series,DataFrame中用duplicated去重
8.时间序列简单操作
9.时间序列的采样和画图
10.数据分箱技术Binning
11.数据分组技术Groupby
12.数据聚合技术Aggregation
13.透视表
14.分组和透视功能实战

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

对索引值进行排序

 
 
 
 

唯一值
显示具体的唯一值

 

显示列唯一值个数

 

缺失值

 
 

1.移除重复值

 
 
 
 
 
 
 
  • 查看数据属性
 
  • 常用方法
 
  • 轴的使用
    axis
    0值表示沿着某一列或行标签索引值
    向下执行方法
    1值表示沿着某一行或列标签横向执行对应的方法
  • 增加删除列的操作
 
  • 缺失值和文本字符串的处理
    • 缺失值
 
  • 文本数据(字符串处理
 
  • 设置索引和索引提取数据(loc、iloc
  1. set_index()设置多重索引
 
  1. sort_index 将索引进行排序
 
  1. 切片(slicers)对多重索引操作
    slice表达的是范围,有几重索引就写几个条件,用冒号代表去全部的列
    第一重索引取值范围0-1000
    第二重索引取值为给定值
    第三重索引没给限定条件
 
  1. reset_index还原索引
 

iloc是按照位置索引,loc是按照名称索引

  • 数据的查询、修改、分组计算

1.查询

 

2.修改

 

3.分组计算

  • 分组查看每组大小
 
  • 单个统计量
 
  • 多个统计量
 
  • 对所有列球多个统计量
 
  • 不同列球不同统计量

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号