濮阳杆衣贸易有限公司

主頁 > 知識庫 > PyTorch 如何設置隨機數(shù)種子使結果可復現(xiàn)

PyTorch 如何設置隨機數(shù)種子使結果可復現(xiàn)

熱門標簽:陜西金融外呼系統(tǒng) 哈爾濱ai外呼系統(tǒng)定制 海南400電話如何申請 公司電話機器人 騰訊外呼線路 唐山智能外呼系統(tǒng)一般多少錢 白銀外呼系統(tǒng) 激戰(zhàn)2地圖標注 廣告地圖標注app

由于在模型訓練的過程中存在大量的隨機操作,使得對于同一份代碼,重復運行后得到的結果不一致。

因此,為了得到可重復的實驗結果,我們需要對隨機數(shù)生成器設置一個固定的種子。

CUDNN

cudnn中對卷積操作進行了優(yōu)化,犧牲了精度來換取計算效率。如果需要保證可重復性,可以使用如下設置:

from torch.backends import cudnn
cudnn.benchmark = False            # if benchmark=True, deterministic will be False
cudnn.deterministic = True

不過實際上這個設置對精度影響不大,僅僅是小數(shù)點后幾位的差別。所以如果不是對精度要求極高,其實不太建議修改,因為會使計算效率降低。

Pytorch

torch.manual_seed(seed)            # 為CPU設置隨機種子
torch.cuda.manual_seed(seed)       # 為當前GPU設置隨機種子
torch.cuda.manual_seed_all(seed)   # 為所有GPU設置隨機種子

Python Numpy

如果讀取數(shù)據(jù)的過程采用了隨機預處理(如RandomCrop、RandomHorizontalFlip等),那么對python、numpy的隨機數(shù)生成器也需要設置種子。

import random
import numpy as np
random.seed(seed)
np.random.seed(seed)

Dataloader

如果dataloader采用了多線程(num_workers > 1), 那么由于讀取數(shù)據(jù)的順序不同,最終運行結果也會有差異。

也就是說,改變num_workers參數(shù),也會對實驗結果產(chǎn)生影響。

目前暫時沒有發(fā)現(xiàn)解決這個問題的方法,但是只要固定num_workers數(shù)目(線程數(shù))不變,基本上也能夠重復實驗結果。

補充:pytorch 固定隨機數(shù)種子踩過的坑

1.初步固定

 def setup_seed(seed):
     torch.manual_seed(seed)
     torch.cuda.manual_seed_all(seed)
     torch.cuda.manual_seed(seed)
     np.random.seed(seed)
     random.seed(seed)
     torch.backends.cudnn.deterministic = True
     torch.backends.cudnn.enabled = False
     torch.backends.cudnn.benchmark = False
     #torch.backends.cudnn.benchmark = True #for accelerating the running
 setup_seed(2019)

2.繼續(xù)添加如下代碼:

tensor_dataset = ImageList(opt.training_list,transform)
def _init_fn(worker_id): 
    random.seed(10 + worker_id)
    np.random.seed(10 + worker_id)
    torch.manual_seed(10 + worker_id)
    torch.cuda.manual_seed(10 + worker_id)
    torch.cuda.manual_seed_all(10 + worker_id)
dataloader = DataLoader(tensor_dataset,                        
                    batch_size=opt.batchSize,     
                    shuffle=True,     
                    num_workers=opt.workers,
                    worker_init_fn=_init_fn)

3.在上面的操作之后發(fā)現(xiàn)加載的數(shù)據(jù)多次試驗大部分一致了

但是仍然有些數(shù)據(jù)是不一致的,后來發(fā)現(xiàn)是pytorch版本的問題,將原先的0.3.1版本升級到1.1.0版本,問題解決

4.按照上面的操作后雖然解決了問題

但是由于將cudnn.benchmark設置為False,運行速度降低到原來的1/3,所以繼續(xù)探索,最終解決方案是把第1步變?yōu)槿缦?,同時將該部分代碼盡可能放在主程序最開始的部分,例如:

import torch
import torch.nn as nn
from torch.nn import init
import pdb
import torch.nn.parallel
import torch.nn.functional as F
import torch.backends.cudnn as cudnn
import torch.optim as optim
import torch.utils.data
from torch.utils.data import DataLoader, Dataset
import sys
gpu_id = "3,2"
os.environ["CUDA_VISIBLE_DEVICES"] = gpu_id
print('GPU: ',gpu_id)
def setup_seed(seed):
     torch.manual_seed(seed)
     torch.cuda.manual_seed_all(seed)
     torch.cuda.manual_seed(seed)
     np.random.seed(seed)
     random.seed(seed)
     cudnn.deterministic = True
     #cudnn.benchmark = False
     #cudnn.enabled = False

setup_seed(2019)

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 簡述python&pytorch 隨機種子的實現(xiàn)
  • Pytorch在dataloader類中設置shuffle的隨機數(shù)種子方式
  • pytorch通過訓練結果的復現(xiàn)設置隨機種子

標簽:益陽 惠州 鷹潭 四川 常德 黔西 黑龍江 上海

巨人網(wǎng)絡通訊聲明:本文標題《PyTorch 如何設置隨機數(shù)種子使結果可復現(xiàn)》,本文關鍵詞  PyTorch,如何,設置,隨機數(shù),;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《PyTorch 如何設置隨機數(shù)種子使結果可復現(xiàn)》相關的同類信息!
  • 本頁收集關于PyTorch 如何設置隨機數(shù)種子使結果可復現(xiàn)的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    栖霞市| 衢州市| 南皮县| 新蔡县| 色达县| 科技| 曲沃县| 大化| 元谋县| 崇仁县| 邯郸市| 昭苏县| 青川县| 河源市| 浠水县| 东乡| 长治市| 洪泽县| 宁强县| 灵武市| 襄汾县| 宁国市| 竹溪县| 双牌县| 基隆市| 肇东市| 大余县| 瑞金市| 通化县| 手游| 札达县| 隆昌县| 柳林县| 湾仔区| 盐边县| 密山市| 砚山县| 卓尼县| 前郭尔| 彩票| 西藏|