關於 Pandas 系列的一些快速提示

我們假設我們有以下系列:

>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64

以下是一些簡單的事情,當你使用 Series 時,它們會派上用場:

要得到 s 的長度:

>>> len(s)
8

要訪問 s 中的元素:

>>> s[4]
8

要使用索引訪問 s 中的元素:

>>> s.loc[2]
6

要訪問 s 內的子系列:

>>> s[1:3]
1    4
2    6
dtype: int64

要獲得值大於 5 的子系列:

>>> s[s > 5]
2    6
4    8
5    7
dtype: int64

要獲得最小值,最大值,平均值和標準差:

>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065

要將 Series 型別轉換為 float:

>>> s.astype(float)
0    1.0
1    4.0
2    6.0
3    3.0
4    8.0
5    7.0
6    4.0
7    5.0
dtype: float64

要將 s 中的值作為 numpy 陣列獲取:

>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])

製作一份 s:

>>> d = s.copy()
>>> d
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64