前言
Python是一門(mén)實(shí)現(xiàn)數(shù)據(jù)可視化很好的語(yǔ)言,他們里面的很多庫(kù)可以很好的畫(huà)出圖形,形象明了。
今天我們就來(lái)說(shuō)說(shuō):Pandas數(shù)據(jù)分析核心支持庫(kù)
初識(shí)Pandas:
Pandas 是 Python 語(yǔ)言的一個(gè)擴(kuò)展程序庫(kù),用于數(shù)據(jù)分析。
Pandas 是一個(gè)開(kāi)放源碼、BSD 許可的庫(kù),提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。
Pandas 名字衍生自術(shù)語(yǔ) “panel data”(面板數(shù)據(jù))和 “Python data analysis”(Python 數(shù)據(jù)分析)。
Pandas 一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基礎(chǔ)是 Numpy(提供高性能的矩陣運(yùn)算),其次數(shù)series,還有一個(gè)DataFrame,這三個(gè)比較常用。
Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導(dǎo)入數(shù)據(jù)。
Pandas 可以對(duì)各種數(shù)據(jù)進(jìn)行運(yùn)算操作,比如歸并、再成形、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征。
Pandas 廣泛應(yīng)用在學(xué)術(shù)、金融、統(tǒng)計(jì)學(xué)等各個(gè)數(shù)據(jù)分析領(lǐng)域。
Pandas的主體:
Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì)、社會(huì)科學(xué)、工程等領(lǐng)域里的大多數(shù)典型用例。
Series:帶標(biāo)簽的一維同構(gòu)數(shù)組,一種類(lèi)似于一維數(shù)組的對(duì)象,它由一組數(shù)據(jù)(各種Numpy數(shù)據(jù)類(lèi)型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。
DataFrame:帶標(biāo)簽,大小可變,二維異構(gòu)表格。一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類(lèi)型(數(shù)值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。
Pandas的安裝:
終端輸入,如果你跟我一樣使用Anaconda中的Jupyter進(jìn)行代表編寫(xiě)的話,也可以在Anaconda的終端里輸入,之后就可以直接用了,他是Python中的一個(gè)庫(kù),使用不需要安裝什么其他軟件,擁有Python編譯器即可。
Pandas的應(yīng)用:
1:導(dǎo)入pandas庫(kù)
2:pandas之series
Pandas Series 類(lèi)似表格中等一個(gè)列(column),類(lèi)似于一維數(shù)組,可以保存任何數(shù)據(jù)類(lèi)型 Series 由索引(index)和列組成,函數(shù)如下:
pandas.Series( data, index, dtype, name, copy)
參數(shù)說(shuō)明:
data:一組數(shù)據(jù)(ndarray 類(lèi)型)。
index:數(shù)據(jù)索引標(biāo)簽,如果不指定,默認(rèn)從 0 開(kāi)始。
dtype:數(shù)據(jù)類(lèi)型,默認(rèn)會(huì)自己判斷。
name:設(shè)置名稱(chēng)。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
FIrst:
import pandas as pd
a = ["shimmer", "zhuzhu", "recently祝祝"]
myvar = pd.Series(a)
print(myvar)
代碼結(jié)果:

Second:可修改索引值、

Third:使用字典創(chuàng)建, key/value 對(duì)象,類(lèi)似字典來(lái)創(chuàng)建 Series

Fourth:可以通過(guò)索引值的指定來(lái)取值

3:pandas之Dataframe
DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類(lèi)型(數(shù)值、字符串、布爾型值)。DataFrame既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。

DataFrame 構(gòu)造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
參數(shù)說(shuō)明:
data:一組數(shù)據(jù)(ndarray、series, map, lists, dict 等類(lèi)型)。
index:索引值,或者可以稱(chēng)為行標(biāo)簽。
columns:列標(biāo)簽,默認(rèn)為 RangeIndex (0, 1, 2, …, n) 。
dtype:數(shù)據(jù)類(lèi)型。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
First:指定列標(biāo)

Second:列分開(kāi)插入,通過(guò)字典的形式創(chuàng)建

Third:使用字典(key/value),其中字典的 key 為列名:

fourth:通過(guò)loc取值,類(lèi)似于列表里x,index【number】取值

Fifth:可以返回多行數(shù)據(jù),使用 [[ … ]] 格式,… 為各行的索引,以逗號(hào)隔開(kāi):

Sixth:指定索引值

Seventh:取指定索引值

本篇就到這吧,希望看完這篇文章對(duì)你有用。
總結(jié)
到此這篇關(guān)于python學(xué)習(xí)之panda數(shù)據(jù)分析核心支持庫(kù)的文章就介紹到這了,更多相關(guān)python之panda模塊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python數(shù)據(jù)分析之繪圖和可視化詳解
- Python數(shù)據(jù)分析之pandas比較操作
- Python數(shù)據(jù)分析入門(mén)之?dāng)?shù)據(jù)讀取與存儲(chǔ)
- Python數(shù)據(jù)分析入門(mén)之教你怎么搭建環(huán)境
- python數(shù)據(jù)分析之公交IC卡刷卡分析
- Python數(shù)據(jù)分析庫(kù)pandas高級(jí)接口dt的使用詳解
- 用Python 爬取貓眼電影數(shù)據(jù)分析《無(wú)名之輩》
- 高考要來(lái)啦!用Python爬取歷年高考數(shù)據(jù)并分析