1.頻道和模板的配置錯誤
①輸入為空或不合法:頻道配置的采集地址為空或不合法。
解決方法:
A.檢查模板采集源地址和各層級模板示例地址填寫是否正確,重新填寫采集地址。
【采集源地址】
【各層級示例地址】
B. 檢查各層級模板關聯是否正確,保證每層模板關聯對應層級模板,一般為關聯下一層級模板。(關聯模板教程:http://www.bendalayoga.com/view/help/course/spider/30.html?cId=12&type=1)
【關聯模板】
②模板分類錯誤:分類器錯誤。
解決方法:
A. 查看分類器是否正確,分類器配置是否正確
咨詢技術支持(http://www.bendalayoga.com/view/about/contact.html)
③地址錯誤:采集地址不存在或已經失效。
解決方法:
將采集地址,用瀏覽器打開,查看是否失效,如果失效更換有效地址。
④模板錯誤:模板不存在或已經損壞。
解決方法:
檢查模板配置情況,修改配置模板。
⑤頻道入口配置錯誤:關鍵詞搜索配置錯誤。
解決方法:
檢查模板配置情況,修改配置關鍵詞搜索。
⑥文檔類型錯誤:采集對象是不能夠識別的文檔。
解決方法:
檢查頁面中采集對象的數據類型,配置時選擇對應類型進行配置。
⑦頻道配置不合法:頻道配置錯誤。
解決方法:
檢查頻道模板配置情況,修改配置。
⑧禁止訪問
解決方法:
A. 將采集源地址用瀏覽器打開,查看是否能夠正常瀏覽。
B. 如果不能正常瀏覽,更換IP,查看是否正常。
2.http下載錯誤
①服務器繁忙:采集對象的服務器繁忙。
②域名解析錯誤:域名解析出現錯誤。
③網頁重定向:采集對象重新定向了新的地址,這是一種常見的反爬手段。
解決方法:
A. 減慢采集速度
B. 更換代理IP
C. 使用代理IP
④網頁未找到:未找到請求資源。
⑤權限訪問錯誤:方法禁止操作或權限不夠。
⑥服務器錯誤:本機服務發生錯誤。
⑦網絡錯誤:網絡發生錯誤,可能是由網絡不穩定或者被封IP導致。
解決方法:
A. 更換一個穩定的網絡環境進行測試。
B. 更換IP。
C. 使用代理IP。
⑧https協議錯誤:ssl錯誤。
⑨代理服務器錯誤:代理錯誤。
⑩內容錯誤:下載的頁面內容發生錯誤。
?用戶取消下載:下載過程中用戶過濾或取消。
3.文檔類型無法識別:
文檔后綴與實際類型不符。
4.腳本執行出錯
腳本配置出錯。
5.數據錯誤:
數據庫插入、更新、刪除、查詢等發生錯誤。
6.未知錯誤:
發生其他各類錯誤。