pandas深化学习之时间序列索引

标签: 数据分析  python  

系列文章目录

pandas深化学习之索引
pandas深化学习之排序重塑
pandas深化学习之缺失值处理
pandas深化学习之字符串处理
pandas深化学习之数学运算
pandas深化学习之日期时间处理
pandas深化学习之重置索引、选择



前言

本文主要记录pandas中缺失值异常值相关的api使用:
通过对真实数据的一系列操作帮助我们熟练掌握相关api的使用。


提示:以下是本篇文章正文内容,下面案例可供参考

1.引入库

代码如下:

import pandas as pd
import numpy as np
from faker import Faker
import warnings
warnings.filterwarnings('ignore')

2.造数据

代码如下:

f =  Faker('ZH-cn')
peridx = pd.PeriodIndex(pd.date_range('20201001',periods=10,freq='D'))
df = pd.DataFrame(np.random.randint(1,100,(10,4)),index=peridx)

结果

在这里插入图片描述


3.数据基本信息查询

我们在理解DataFrame时要类比Excel表格,可以帮助我们更清晰的分析

在DataFrame中,我更倾向于叫一行为样本或者记录,叫一列为特征或者属性

df.info()

结果
在这里插入图片描述

4.时间序列索引相关api

  • 转换为指定频率的时间序列索引

前缀

df.asfreq('Q')

结果

在这里插入图片描述
相关频率如下

B	工作日频率
C	自定义工作日频率
D	日历日频率
W	每周频率
M	月末频率
SM	半月(15日和月末)
BM	月末工作日
CBM	自定义月工作日结束频率
MS	月开始频率
SMS	半个月开始频率(第1和第15)
BMS	月工作日开始频率
CBMS	自定义月工作日开始频率
Q	季度
BQ	季度末
QS	季度初
BQS	季度工作日开始频率
A, Y	年终频率
BA, BY	年度工作日结束频率
AS, YS	年开始频率
BAS, BYS	年度工作日开始频率
BH	工作日时间频率
H	每小时频率
T, min	分钟频率
S	秒
L, ms	毫秒
U, us	微秒
N	纳秒

还可以在频率字母前加上数字,表示倍数

df.asfreq('30T')

结果

在这里插入图片描述

  • 返回where条件之前非空的最后一行。
df.asof('2020-10-05 22:00')

结果
在这里插入图片描述

  • 偏移

偏移方法并不是时间序列特有的方法,是DataFrame和Series的方法

df.shift(2,fill_value=0)

结果

在这里插入图片描述

如果没有指定fill_value,则会默认填充nan

df.shift(2)

在这里插入图片描述

  • 切片偏移,不保留已偏移行或者列
df.slice_shift(3,axis=1)

结果
在这里插入图片描述

  • 返回第一个非空值的索引。
df.first_valid_index()
# 结果
Period('2020-10-01', 'D')
  • 返回最后一个非空值的索引。
df.last_valid_index()
# 结果
Period('2020-10-10', 'D')
  • 重采样

重新采样时间序列数据,返回的是Sampler对象

可以使用聚合函数

df.resample('3D').max()

结果

在这里插入图片描述

  • 将非时间序列索引转换成时间序列索引
df1 = pd.DataFrame(np.random.randint(1,100,(10,4)),
                   index=pd.date_range('20200101',freq='M',periods=10))

在这里插入图片描述
此时的索引是日期时间索引

df2 = df1.to_period()

在这里插入图片描述

此时查看基本信息可以发现已经转换成时间序列索引了

在这里插入图片描述

  • 将时间序列索引转换成非时间序列索引

同样的我们也可以将时间序列索引转换成日期时间索引

df.to_timestamp()

结果
在这里插入图片描述

转换完成后,并不能直观的发现区别,但是我们可以通过查看基本信息,或者查看索引

peridx = df.to_timestamp().index

结果

在这里插入图片描述

  • 时间序列索引的方法

时间序列索引可以使用日期时间类型的大部分方法和属性

# 天
peridx.day
# 星期
peridx.day_name()
# 季度
peridx.quarter
# 是否闰年
peridx.is_leap_year

在这里插入图片描述

其他方法不再演示,可以查看同系列的日期时间处理的文章。

总结

代码的功底都是通过不断的练习一步步积累起来的,和我一起学pandas吧!
在这里插入图片描述

版权声明:本文为weixin_41546513原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_41546513/article/details/109477059

智能推荐

Ubuntu 14.04 下,安装 Java8

下载Java http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 打开上述链接, , 下载 特定的 Java8 版本。笔者选择的是 jdk-8u172-linux-x64.tar.gz。 - 配置Java环境变量 将 jdk-8u172-linux-x64.tar.gz 解压至指定目...

OpenCV学习之路(五)图像的几何变换

在这一章将要学习图像的移动、旋转,仿射变换等 扩展缩放 我们如果想要改变图像的大小,我们就需要对图像进行扩展缩放,opencv提供给我们控制扩展缩放的函数: 参数解释: src:进行扩展缩放的原图片 dst:可以在此处设置缩放因子,也可手动设置尺寸 interpolation:在缩放时我们推荐使用cv2.INTER_AREA, 在扩展时我们推荐使用cv2.INTER_CUBIC(慢) 和 cv2....

2018.8.27

2018.8.27...

HTML 表单元素的基本样式

HTML 表单元素的基本样式 原创 ixygj197875 发布于2018-02-22 17:48:53 阅读数 2296 收藏 更新于2018-05-20 15:35:58 分类专栏: 揭秘 CSS 揭秘 CSS 收起 表单元素主要包括 label、input、textarea、select、datalist、******、progress、meter、output等,以及对表单元素进行分组的 ...

php输出语句

php输出语句 常见的输出语句 echo(): 可以一次输出多个值,多个值之间用逗号分隔。echo是语言结构(language construct),而并不是真正的函数,因此不能作为表达式的一部分使用。 print(): 函数print()打印一个值(它的参数),如果字符串成功显示则返回true,否则返回false。 print_r(): 可以把字符串和数字简单地打印出来,而数组则以括起来的键和值...

猜你喜欢

工厂模式

简介 常见的实例化对象模式。 用工厂方法替代new操作的一种模式。 当我们使用new操作实例化对象时,调用构造函数完成初始化。若初始化仅是进行赋值等简单的操作,写入构造函数即可。但如果初始化时需要执行一长串复杂的代码,将多个工作装入一个方法,是不妥的。 创建实例与使用实例分离。将创建实例所需的大量初始化工作从基类的构造函数中分离出去。 简单工厂模式、工厂方法模式针对的是一个产品等级结构;而抽象工厂...

B1105 Spiral Matrix (画图)

B1105 Spiral Matrix (25分) //第一次只拿了21分 矩阵的长和宽,求最大因子,从sqrt(num)开始枚举. 每次循环一次,s++,t--,d--,r++ 测试点四运行超时,是因为输入一个数字的时候,需要直接输出这个数字。//1分 测试点二运行超时,最后一个数字不必再while循环一次,直接输出即可。//3分 最后一个测试点卡了好久/(ㄒoㄒ)/~~ 螺旋矩阵...

Java基础=>String,StringBuffer与StringBuilder的区别

字符串常量池 什么是字符串常量池? JVM为了减少字符串对象的重复创建,其维护了一块特殊的内存,这段内存被称为字符串常量池(存储在方法区中)。 具体实现 当代码中出现字符串时,JVM首先会对其进行检查。 如果字符串常量池中存在相同内容的字符串对象,如果有,则不再创建,直接返回这个对象的地址返回。 如果字符串常量池中不存在相同内容的字符串对象,则创建一个新的字符串对象并放入常量池,并返回新创建的字符...

java调用其他java项目的Https接口

项目中是这样的: 用户拿出二维码展示,让机器识别二维码, 机器调用开门的后台系统接口, 然后开门的后台系统接口需要调用管理系统的接口, 管理系统需要判断能不能开门.这两个系统是互相独立的.当时使用http调用是没有问题的.当时后来要求必须用https.废话不说,直接代码: 我的项目中调用的是 HttpsUtils.Get(utlStr) 这个接口 开门系统接口如下图:   管理系统的接口...

Hadoop1.2.1全分布式模式配置

一 集群规划 主机名            IP                               安装的软件 &nbs...