一.網站內容
1.網站截圖說明
本教程采集“人上人”首頁“最新資訊”欄目列表中的數據,鏈接入口為:http://www.gzrsr.com/news/,如下圖。
2.采集結果截圖
二.操作方法
1.新建任務
①點擊“采集配置”。
②點擊【任務列表】中的“+”,新建采集任務。
③在圖示紅框中輸入采集地址和任務名稱,完成后點擊“下一步”。
④采集鏈接數據,需要采集【數據抽取】和【普通翻頁】,點擊“完成”。
2.翻頁配置
①:點擊左側“鏈接抽取-普通翻頁”。
②:這時我們將網頁拉到最底部,Ctrl+左鍵 選擇“下一頁”確認選區。
注意:記得隨時點擊右上角的“保存”,養成良好的操作習慣。
4.翻頁采集預覽
完成第3步驟后,點擊右上方“采集預覽”,最終呈現應如下圖:
5.數據抽取
配置翻頁后,抽取網頁中的列表數據,如下圖:
6.新建表結構
①選擇“采集配置”-“數據建表”。
②點擊“+”,新建表并自定義名稱,這里取“人上人數據”。
③配置采集字段,表結構建立如下:
字段名稱:id
A.采集內容:選擇“主鍵”,此處務必選“自增ID主鍵”。
B.字段屬性:選擇 “索引字段”、“鍵值唯一”、“主鍵字段”。
字段名稱:title
A.采集內容:選擇“選區內可見文本”。
B.數據類型:選擇“字符串”。
C.數據長度:一個漢字占用兩個字符,可根據需求填寫范圍。
字段名稱:zhaiyao
A.采集內容: 選擇“選區內可見文本”。
B.數據類型:選擇“字符串”。
C.數據長度:一個漢字占用兩個字符,可根據需求填寫范圍。
7.新建數據表
表結構建立完成后,需要新建數據表。
選擇“人上人數據”,點擊【創建】按鈕。創建表名稱可隨意填寫,需注意開頭僅可使用英文字母,可加數字。中文名稱不能作為表名稱。
8.確認選區
①title字段
A.點擊左側“title”。
B.Ctrl+左鍵選擇圖示2位置的標題。
C.點擊圖示3位置的“確認選區”即可完成。
②Zhaiyao字段:
A.點擊左側“zhaiyao”
B.Ctrl+左鍵選擇圖示2位置的文字部分
C.點擊圖示3位置的“確認選區”即可完成
9.數據采集
采集預覽確認無誤后,選擇“數據采集”,勾選“人上人教育”,點擊開始采集。