开启成长之旅!这是我参与「日新计划 12 月更文应战」的第27天,点击检查活动概况

目录

一、Pandas库

二、Pandas库数据结构——Series, DataFrame

1.Series——索引 index,值 values

2.DataFrame——索引index, columns,值 values

正在上传…从头上传取消

指定或修正索引办法

创立时:

创立后:

三、Series, DataFrame运算

1.根本运算

2.矩阵运算、通用函数

3.根本核算办法 axis指定操作轴

四、Series, DataFrame 索引与切片

1.Series 索引与切片 Index索引/数字索引/布尔值索引

2.DataFrame 索引与切片

五、Series, DataFrame 删去操作

1.Series删去操作 pop/drop/del

2.DataFrame删去操作 pop/drop/del

六、Series, DataFrame 兼并操作

1.Series兼并操作

2.DataFrame兼并操作

七、Pandas库其他常用函数或办法


一、Pandas库

import numpy as np
import pandas as pd

机器学习——Pandas库

二、Pandas库数据结构——Series, DataFrame

a = pd.Series([1, 2, 3, 4, 5])

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

data = np.array([[95, 96, 97], [80, 85, 86], [56, 65, 70]])
frame = pd.DataFrame(data)
frame

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

我们不难看出来Series, DataFrame的差异:DataFrame更加美观哈哈,接受矩阵数据

具体见:

pandas中的两种数据类型Series和DataFrame差异_jolingcome的博客-CSDN博客_series和dataframe差异

1.Series——索引 index,值 values

a = pd.Series([1, 2, 3, 4, 5], index = ['a', 'b', 'c', 'd', 'e'])
a

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

2.DataFrame——索引index, columns,值 values

frame = pd.DataFrame(data, index=['xiaoming', 'xiaohong', 'xiaohei'],
                      columns=['yuwen', 'yingyu', 'shuxue'])
frame

机器学习——Pandas库

机器学习——Pandas库
机器学习——Pandas库​修正

指定或修正索引办法

创立时:

index, columns 指定索引,已经有索引可以按索引从头排序

创立后:

reindex办法,从头建立索引或指定索引排序

rename 修正索引

frame_.rename(index={"xiaohong":"damao","xiaoming":"ermao","xiaohei":"Nicolas Cage"},
              columns={"yingyu":"English", "yuwen":"Literature", "shuxue":"Maths"})
Series.index = []
DataFrame.columns = []

机器学习——Pandas库

三、Series, DataFrame运算

1.根本运算

按照索引位置进行核算

data = {"English":[80,70,60],
        "Literature":[70,70,85],
        "Maths":[80,90,50],
        "Music":["A","B","C"]}
df = pd.DataFrame(data,index = ["alpha", "beta","theta"])
df * 2

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

DataFrame、Series “相加”时,按照DF的columns(列)进行匹配

data1 = {"English":[80,70,60],
        "Literature":[70,70,85],
        "Maths":[80,90,50],}
df1 = pd.DataFrame(data1,index = ["alpha", "beta","theta"])
add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_ = pd.Series(add_)
df1 + add_

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

2.矩阵运算、通用函数

df.T

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

3.根本核算办法

检查数据的一些

df.describe()

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

四、Series, DataFrame 索引与切片

1.Series 索引与切片 Index索引/数字索引/布尔值索引

add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_ = pd.Series(add_)
add_['Maths']

机器学习——Pandas库

机器学习——Pandas库

机器学习——Pandas库修正

2.DataFrame 索引与切片

Index索引	列:df['Maths']	行:df.loc[‘alpha’]
数字索引	df.iloc[]	特别的行可以直接用数字切片索引
布尔值索引

五、Series, DataFrame 删去操作

1.Series删去操作 pop/drop/del

① del办法:就地删去

x = pd.Series([10,23,31,16],index=list("abcd"))
display(x)
# 删去了某个索引后,对应的值也就删去了
del x["b"]
display(x)

机器学习——Pandas库

机器学习——Pandas库
机器学习——Pandas库​修正

② drop办法:当指定了inplace=True后,才归于就地删去

x = pd.Series([10,23,31,16],index=list("abcd"))
display(x)
y = x.drop("a")
display(y)
dispaly(x)
# 当指定了inplace=True后,归于就地删去
x.drop("a",inplace=True)
display(x)

机器学习——Pandas库

机器学习——Pandas库
机器学习——Pandas库​修正

2.DataFrame删去操作 pop/drop/del

和 Series删去操作 pop/drop/del 类同的,聪明的你可以想想

六、Series, DataFrame 兼并操作

一般我们用到什么办法就去检查该办法的参数

1.Series兼并操作

pd.concat()	combine_first()

2.DataFrame兼并操作

pd.concat()	combine_first()
pd.merge()	join()

七、Pandas库其他常用函数或办法

head()	info()	describe()
sort_index()	sort_values()
is_unique	value_counts()
rank()

具体可见pandas中Series,DataFrame的衔接(拼接)_晓东邪的博客-CSDN博客_pandas series 拼接