評論信息大多是表格形式的,一行是一條數據。采集表格數據時,由于各行都在同一個頁面上,所以主鍵字段不能選擇“網頁主鍵”。一般有兩種情況:
①字段采集內容為“空”,字段屬性選擇“主鍵字段”、“自增字段”。
②表格有獨特的序列特征時,以該特征作為主鍵,采集內容選擇“選區內全部文本”,字段屬性選擇“主鍵字段”。
字段名稱 | 采集內容 | 數據類型 | 長度 | 字段屬性 | 高級類型 | 字段說明 |
comm_id | (空) | 長數字 | 0 | 索引字段; 鍵值唯一; 主鍵字段; 自動字段; | NONE | 評論ID |
pro_name | 選區內全部文本 | 字符串 | 64 | 無 | NONE | 產品名稱 |
score | 選區內全部文本 | 浮點數 | 0 | 無 | NONE | 評分 |
author | 選區內全部文本 | 字符串 | 64 | 無 | NONE | 評論人 |
context | 選區內全部文本 | 字符串 | 0 | 無 | 長文本(<64k) | 評論正文 |
commTime | 選區內全部文本 | 字符串 | 32 | 無 | NONE | 評論時間 |
get_time | 網頁獲取時間 | 長數字 | 0 | 無 | 日期時間 | 采集時間 |