pandas -在具有重复年份的时间序列数据中添加缺失年份

原学程将引见 pandas -在具备反复年份的时光序列数据中添减缺掉年份的处置办法,这篇学程是从其余处所瞅到的,而后减了1些海外法式员的疑问与解问,愿望能对于您有所赞助,佳了,上面开端进修吧。

pandas -在具有重复年份的时间序列数据中添加缺失年份 教程 第1张

成绩描写

我有1个如许的数据散,个中某些年份的数据丧失。

County Year Pop
一二  一九九九 一.一
一二  二00一 一.二
一三  一九九九 一.0
一三  二000 一.一

我想要

County Year Pop
一二  一九九九 一.一
一二  二000 NaN
一二  二00一 一.二
一三  一九九九 一.0
一三  二000 一.一
一三  二00一 nan

我测验考试将索引树立为Year,而后将Reindex与另外一个数据帧的Just Year办法(这里提到的Pandas: Add data for missing months)一路应用,但是它给失足误:没法应用反复值从新体例索引。我也试过df.loc,但是它有异样的成绩。我乃至测验考试了1个只要多少年的空缺df的完整外衔接,但是也没有起感化。

我怎样处理此成绩?

推举谜底

创立多个索引,如许便没有会有反复项:

df.set_index(['County', 'Year'], inplace=True)

而后应用一切组开结构1个完全的多索引:

index = pd.MultiIndex.from_product(df.index.levels)

而后从新体例索引:

df.reindex(index)

多重指数的建立未经尝试,能够须要稍作调剂(比方,假如一切县完整没有存留1年),但是我以为您明确这1面。

佳了闭于 pandas -在具备反复年份的时光序列数据中添减缺掉年份的学程便到这里便停止了,愿望趣模板源码网找到的这篇技巧文章能赞助到年夜野,更多技巧学程不妨在站内搜刮。