好看的玄幻小说,盗墓笔记txt全集下载,完美世界辰东

分布式爬蟲架構并不是一開始就出現(xiàn)的。而是一個逐步演化的過程。

最開始入手寫爬蟲的時候，我們一般在個人計算機上完成爬蟲的入門和開發(fā)，而在真實的生產環(huán)境，就不能用個人計算機來運行爬蟲程序了，而是將爬蟲程序部署在服務器上。利用服務器不關機的特性，爬蟲可以不間斷的24小時運行。單機爬蟲的結構如下圖。

然而，由于爬蟲在爬取數(shù)據(jù)時，爬取頻次并不能太快，即使是爬蟲在服務器上不間斷運行，效率可能也無法滿足實際需求。這時候，就需要在多機上部署爬蟲程序，用分布式爬蟲架構，進行數(shù)據(jù)爬取。分布式爬蟲的架構一般如下所示。

采用分布式爬蟲架構后，帶來了如下幾個好處。

1，爬蟲效率提高。這一點顯而易見，之前是單機運行，現(xiàn)在是多機分布式運行，效率顯著提高。
2，爬蟲可靠性可用性提高。之前部署在一臺服務器上，當服務器出現(xiàn)故障或爬蟲程序出現(xiàn)故障時，爬蟲便不可用了。采用分布式爬蟲架構后，爬蟲任務生產者，任務隊列，爬蟲任務消費者都采用分布式架構部署，其中的某些機器出現(xiàn)故障，不影響整體的可用性，系統(tǒng)可靠性大大增強。

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接

您可能感興趣的文章:

巨人網(wǎng)絡通訊聲明：本文標題《爬蟲技術之分布式爬蟲架構的講解》，本文關鍵詞爬蟲,技術,之,分布式,架構,；如發(fā)現(xiàn)本文內容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權與本站無關。

濮阳杆衣贸易有限公司