1.特征定位含義
當所需數據在不同網頁的位置不固定,且數據前后具有特征性文字時,用標準定位容易錯位,需要使用特征定位。
舉例:對于字符串“作者:***”,采集作者名稱時,可用“作者:”作為特征來定位。
2.操作方法
①選擇:按Ctrl+鼠標左鍵點擊頁面上所需數據的區域。
②識別特征:點擊“識別特征”,出現紅框,再次點擊,紅框移動到特征字符串時確認。
③點擊“確認選區”按鈕,選區生效。
【特征定位】
3.特征定位的類型
特征定位分為四種方式:
(1)局部關鍵詞
當頁面的數據前有特定的關鍵詞,而各個頁面的表格內容、各行次序、行數又各不相同時,采用標準定位的方式就會錯亂??梢愿鶕眍^特征,采集表格后的數據。與全文關鍵詞的區別是,局部關鍵詞只在選定區域的附近采集。
(2)全文關鍵詞
根據選定的特征關鍵詞,在全頁面采集該特征關鍵詞前后對應的數據,如果出現多個特征關鍵詞,以第一個為主。如果想采集多個的話,可以設定多值。
(3)大文本
選定大文本區域后,自動識別各頁面的大文本,相比標準定位更加精確。
(4)特殊標簽
采集頁面中只出現一次的特殊標簽,如標題的<h1>標簽等。