pandas读书笔记算数运算和数据对齐

pandas最重要的一个功能是，它可以对不同索引的对象进行算数运算。在对象相加时，如果存在不同的索引对，则结果的索引就是该索引对的并集。

Series

s1=Series([7.3,-,3.4,1.5],index=['a','c','d','e'])

s2=Series([-2.1,3.6,-1.5,,3.1],index=['a','c','e','f','g'])

s1

Out[]:

a     7.3

c   -25.0

d     3.4

e     1.5

dtype: float64

s2

Out[]:

a   -2.1

c    3.6

e   -1.5

f    4.0

g    3.1

dtype: float64

它们相加就会产生：

s1+s2

Out[]:

a     5.2

c   -21.4

d     NaN

e     0.0

f     NaN

g     NaN

dtype: float64

自动的数据对齐操作在不重叠的索引处引入了NA值。

DataFrame

对齐操作会同时发生在行和列上：

df1=DataFrame(np.arange().reshape((,)),columns=list('bcd'),

index=['Ohio','Texas','Colorado'])

df2=DataFrame(np.arange().reshape((,)),columns=list('bde'),

index=['Utah','Ohio','Texas','Oregon'])

df1

Out[]:

          b  c  d

Ohio

Texas

Colorado      

df2

Out[]:

        b   d   e

Utah

Ohio

Texas

Oregon

把它们相加后会返回一个新的DataFrame,其索引和列为原来那两个DataFrame的并集：

df1+df2

Out[]:

            b   c     d   e

Colorado  NaN NaN   NaN NaN

Ohio      3.0 NaN   6.0 NaN

Oregon    NaN NaN   NaN NaN

Texas     9.0 NaN  12.0 NaN

Utah      NaN NaN   NaN NaN

在算数方法中填充值
在对不同索引的对象进行算数运算时，你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值：

df1=DataFrame(np.arange().reshape((,)),columns=list('abcd'))

df2=DataFrame(np.arange().reshape((,)),columns=list('abcde'))

df1

Out[]:

   a  b   c   d

df2

Out[]:

    a   b   c   d   e

将它们相加时，没有重叠的位置就会产生NA值：

df1+df2

Out[]:

      a     b     c     d   e

   0.0   2.0   4.0   6.0 NaN

   9.0  11.0  13.0  15.0 NaN

  18.0  20.0  22.0  24.0 NaN

   NaN   NaN   NaN   NaN NaN

使用df1的add方法，传入df2以及一个fill_value参数：

df1.add(df2,fill_value=)

Out[]:

      a     b     c     d     e

   0.0   2.0   4.0   6.0   4.0

   9.0  11.0  13.0  15.0   9.0

  18.0  20.0  22.0  24.0  14.0

  15.0  16.0  17.0  18.0  19.0

与此类似，在对Series或DataFrame重新索引时，也可以指定一个填充值：

df1.reindex(columns=df2.columns,fill_value=)

Out[]:

   a  b   c   d  e

灵活的算数方法
add ->用于加法（+）的方法
sub ->用于减法（-）的方法
div ->用于除法（/）的方法
mul ->用于乘法（*）的方法

DataFrame和Series之间的运算

arr=np.arange().reshape((,))

arr

Out[]:

array([[ ,  ,  ,  ],

       [ ,  ,  ,  ],

       [ ,  , , ]])

arr[]

Out[]: array([, , , ])

arr-arr[]

Out[]:

array([[, , , ],

       [, , , ],

       [, , , ]])

这就叫做广播（broadcasting）。DataFrame和Series之间的运算差不多如此：

frame=DataFrame(np.arange().reshape((,)),columns=list('bde'),

index=['Utah','Ohio','Texas','Oregon'])

series=frame.ix[]

__main__:: DeprecationWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated

frame

Out[]:

        b   d   e

Utah

Ohio

Texas

Oregon      

series

Out[]:

b

d

e

Name: Utah, dtype: int32

匹配列，沿行进行广播
默认情况下，DataFrame和Series之间的算数运算会将Series的索引匹配到DataFrame的列，然后沿着行一直向下广播。

frame-series

Out[]:

        b  d  e

Utah

Ohio

Texas

Oregon

也可以理解为纵向广播↓。

如果某个索引值在DataFrame的列或Series的索引中找不到，则参与运算的两个对象就会被重新索引以形成并集：

series2=Series(range(),index=['b','e','f'])

frame+series2

Out[]:

          b   d     e   f

Utah    0.0 NaN   3.0 NaN

Ohio    3.0 NaN   6.0 NaN

Texas   6.0 NaN   9.0 NaN

Oregon  9.0 NaN  12.0 NaN

匹配行在列上广播
则必须使用算数运算方法：

series3=frame['d']

frame

Out[]:

        b   d   e

Utah

Ohio

Texas

Oregon      

series3

Out[]:

Utah

Ohio

Texas

Oregon

Name: d, dtype: int32

frame.sub(series3,axis=)

Out[]:

        b  d  e

Utah   -

Ohio   -

Texas  -

Oregon -

传入的轴号就是希望匹配的轴。

可以理解为横向广播 →

pandas读书笔记算数运算和数据对齐

pandas读书笔记算数运算和数据对齐的相关教程结束。

相关推荐

「学习笔记」模运算与 BSGS 算法

Python从零到壹丨图像增强的顶帽运算和底帽运算

WPF中Popup控件在Win7以及Win10等中的对齐点方式不一样的解决方案 - 简书

OpenCV计算机视觉学习（2）——图像算术运算 & 掩膜mask操作（数值计算，图像融合，边界填充）

小白学 Python 数据分析（10）：Pandas （九）数据运算

Python笔记·第三章—— 逻辑运算

2022-10-09：我们给出了一个（轴对齐的）二维矩形列表 rectangles 。对于 rectangle[i] = [x1, y1, x2, y2]，其中（x1，y1）是矩形 i 左下角的坐

解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析

pandas读书笔记 算数运算和数据对齐

pandas读书笔记 算数运算和数据对齐的相关教程结束。

相关推荐

「学习笔记」模运算与 BSGS 算法

Python从零到壹丨图像增强的顶帽运算和底帽运算

WPF中Popup控件在Win7以及Win10等中的对齐点方式不一样的解决方案 - 简书

OpenCV计算机视觉学习（2）——图像算术运算 & 掩膜mask操作（数值计算，图像融合，边界填充）

小白学 Python 数据分析（10）：Pandas （九）数据运算

Python笔记·第三章—— 逻辑运算

2022-10-09：我们给出了一个（轴对齐的）二维矩形列表 rectangles 。 对于 rectangle[i] = [x1, y1, x2, y2]，其中（x1，y1）是矩形 i 左下角的坐

解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析

pandas读书笔记算数运算和数据对齐

pandas读书笔记算数运算和数据对齐的相关教程结束。

2022-10-09：我们给出了一个（轴对齐的）二维矩形列表 rectangles 。对于 rectangle[i] = [x1, y1, x2, y2]，其中（x1，y1）是矩形 i 左下角的坐