Pandas 有三个基本数据结构:Series
、DataFrame
和 Index
。
NumPy 数组通过隐式定义的整数索引获取数值,
而 Pandas 的 Series
对象用一种显式定义的索引与数值关联。
导入
1 | import numpy as np |
Series对象
1 | data = pd.Series([0.25, 0.5, 0.75, 1.0], index=['a', 'b', 'c', 'd']) |
1 | data.values |
1 | data.index |
1 | data[1:3] |
1 | data['b'] |
1 | 'a' in data |
1 | data.keys() |
1 | list(data.items()) |
1 | data['e'] = 1.25 |
字典
1 | population_dict = {'California': 38332521, |
1 | population['California'] |
1 | population['California':'Illinois'] |
显式指定索引
1 | pd.Series([2, 4, 6]) |
1 | pd.Series({2:'a', 1:'b', 3:'c'}, index=[3, 2]) |