王剑编程网

分享专业编程知识与实战技巧

织梦CMS网站:采集功能的使用介绍_织梦自动采集教程

Dedecms采集功能的使用
啥是采集
收集其他网站的大量信息

  1. 点击采集--采集节点管理
  2. 点击添加节点
  3. 根据模型选择对应的模型并点击确认

查看网站编码的方法 ctr+u打开源码 找到网站的 代码 中
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />其中标黄的地方指的是网站的编码格式。
不需要设置

  1. 列表网址获取规则

5.1批量生成地址设置
批量生成网址指的是 有规则的列表页 一次可以通过网址规则批量生成
(*) 指的是递增序列
5.2 手工指定网址:
手动填写列表页地址


Figure 1指定网站时,一定要插入引用的子网站(如上图第一个所示)

  1. 文章网址的匹配

目标网页HTML代码


区域开始的HTML:
找到要采集的目标链接地址的开始的HtmL(离链接最近的一个html代码,只要不重复就可以)
区域结束的HTML:


如果要采集缩略图就勾选否则不勾选

  1. 保存下一步如下


点击保存下一步

  1. 采集内容

内容区代码


匹配规则
[内容] 代表的是要添加进织梦后台的内容


保存并开始采集

  1. 采集完成后导出数据
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言