代码拉取完成,页面将自动刷新
比如model下的某个field,我想保存这个field的所有内容包括html标签,怎么做?
设置field的属性[isSerialize=true]即可
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
不过有一点要注意,field的xpath写到节点即可,不要用/text() ,也不要设置attr。我举个栗子给你:
1. 若使用代码来设置采集规则:
model.addField("xml")
.set("isSerialize", true)
.set("xpath", "//div[@class='head-info-list']");
2. 若使用配置文件来设置采集规则:
<field name="xml" isSerialize="true" xpath="//div[@class='head-info-list']" />
我这里跑了一个QFang网的例子,输出结果如下:
<ul>
<li class="head-info-item clearfix">
<span class="field fl">建筑年代</span>
<p class="place-area clearfix">
<span class="link">2010年</span>
</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">
<em>停</em>
<em>车</em>
<em>位</em>
</span>
<p class="counterpart-schools clearfix">2700个</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">停车费用</span>
<p class="fl">210.0</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">
<em>容</em>
<em>积</em>
<em>率</em>
</span>
<p class="fl">2.55</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">
<em>绿</em>
<em>化</em>
<em>率</em>
</span>
<p class="fl">32%</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">
<em>物</em>
<em>业</em>
<em>费</em>
</span>
<p class="fl">1.44元/平米・月</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">物业公司</span>
<p class="fl">保利广州物业管理有限公司</p>
</li>
<li class="head-info-item clearfix">
<span class="field fl">开 发 商</span>
<p class="fl">浙江保利房地产开发有限公司</p>
</li>
</ul>
感谢,很好用!加上UI和文档就更完美
登录 后才可以发表评论