如下所示:
interval=stats.t.interval(a,b,mean,std)
t分布的置信區(qū) 間
a:置信水平
b:檢驗量的自由度
mean:樣本均值
std:樣本標準差
from scipy import stats
import numpy as np
x=[10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9]
x1=np.array(x)
mean=x1.mean()
std=x1.std()
interval=stats.t.interval(0.95,len(x)-1,mean,std)
interval
Out[9]: (9.531674678392644, 10.568325321607357)
補充:用Python學分析 - t分布
1. t分布形狀類似于標準正態(tài)分布
2. t分布是對稱分布,較正態(tài)分布離散度強,密度曲線較標準正態(tài)分布密度曲線更扁平
3. 對于大型樣本,t-值與z-值之間的差別很小
作用
- t分布糾正了未知的真實標準差的不確定性
- t分布明確解釋了估計總體方差時樣本容量的影響,是適合任何樣本容量都可以使用的合適分布
應用
- 根據(jù)小樣本來估計呈正態(tài)分布且方差未知的總體的均值
- 對于任何一種樣本容量,真正的平均值抽樣分布是t分布,因此,當存在疑問時,應使用t分布
樣本容量對分布的影響
- 當樣本容量在 30-35之間時,t分布與標準正態(tài)分布難以區(qū)分
- 當樣本容量達到120時,t分布與標準正態(tài)分布實際上完全相同了
自由度df對分布的影響
- 樣本方差使用一個估計的參數(shù)(平均值),所以計算置信區(qū)間時使用的t分布的自由度為 n - 1
- 由于引入額外的參數(shù)(自由度df),t分布比標準正態(tài)分布的方差更大(置信區(qū)間更寬)
- 與標準正態(tài)分布曲線相比,自由度df越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高
- 自由度df愈大,t分布曲線愈接近正態(tài)分布曲線,當自由度df= ∞ 時,t分布曲線為標準正態(tài)分布曲線
圖表顯示t分布
代碼:
# 不同自由度的學生t分布與標準正態(tài)分布
import numpy as np
from scipy.stats import norm
from scipy.stats import t
import matplotlib.pyplot as plt
print('比較t-分布與標準正態(tài)分布')
x = np.linspace( -3, 3, 100)
plt.plot(x, t.pdf(x,1), label='df=1')
plt.plot(x, t.pdf(x,2), label='df=20')
plt.plot(x, t.pdf(x,100), label = 'df=100')
plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal')
plt.legend()
plt.show()
運行結果:

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- 使用python 進行區(qū)間取值的方法
- Python求區(qū)間正整數(shù)內所有素數(shù)之和的方法實例
- python如何遍歷指定路徑下所有文件(按按照時間區(qū)間檢索)
- Python 判斷時間是否在時間區(qū)間內的實例
- Python求解正態(tài)分布置信區(qū)間教程
- Python 日期區(qū)間處理 (本周本月上周上月...)
- Python 數(shù)值區(qū)間處理_對interval 庫的快速入門詳解
- Python進行區(qū)間取值案例講解