您的位置:首页 > 软件 > 水淼关键词网址采集器

水淼关键词网址采集器
水淼关键词网址采集器

水淼关键词网址采集器

水淼关键词网址采集器是一款网址信息采集软件,软件通过输入关键

立即下载
7

已有5644人下载

简单介绍

文章导读:水淼关键词网址采集器是一款网址信息采集软件,软件通过输入关键字采集各搜索引擎的网址、域名、标题、描述等信息,采集速度快且质量高。使用方法【搜索引擎】百度、搜狗、谷歌支持一页100个结果,打勾“一页10个结果”时则为10个结果【仅采集指定排名。

水淼关键词网址采集器是一款网址信息采集软件,软件通过输入关键字采集各搜索引擎的网址、域名、标题、描述等信息,采集速度快且质量高。


使用方法

【搜索引擎】百度、搜狗、谷歌支持一页100个结果,打勾“一页10个结果”时则为10个结果

【仅采集指定排名】比如想要采集第2、3和5排名的网址,那就输入“2|3|5”(不包括引号),没有启用本选项则全部采集。

【输入关键词列表】一行一个关键词

【采集页数】设置为0则采集全部搜索页

【每页数量】不同搜索引擎的每页数量限制不同。百度最多50,谷歌和搜狗100,其他基本是10或20

【谷歌必应英文站】打勾则使用谷歌必应的全球英文站搜索,否则是中文站搜索。

【谷歌必应无等待】打勾可以让这3个引擎无等待采集,也就是高速采集,否则每次采集一页都自动等待一定时间。之所以加这个选项,是最近(2015年8月8日)测试这3个引擎设置搜索间隔时间貌似无用,必应测试了十几个关键词无等待搜索没有出现验证码,所以无法做验证码处理。而谷歌只开头出现几次验证码,后面无等待大量搜索也无验证码出现,不过谷歌已经可以自动判断验证码出现并交由用户自己解除。

【保存目录】将在该目录下保存采集结果,保存的文件名为:搜索引擎_关键词

【重要提示】鼠标右击保存目录的选择按钮“..”可定位该目录


常见问题

1.为什么采集一段时间之后,无法采集?

这可能采集多了被搜索引擎限制。一般换个IP即可继续采集,如果不换,只能等待搜索引擎取消屏蔽之后才能继续采集。百度的屏蔽时间通常半小时到数小时。

不过,现在即使出现验证码屏蔽,软件也会弹出验证码手动输入的(百度、谷歌)

2.不同批次关键词采集的结果为什么会存在部分网址重复?

尤其是只引用了 #域名# 或 #顶级域名# 之后,这种部分网址重复的情况比较多。这也是正常的,因为每个网站的内页可能包含很多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。

另外,软件里的自动去重,是针对本次采集的结果内部进行去重,以前采集的结果是不在本次去重范围的。如果两次采集的结果存在部分网址重复,可以把他们合并一起,使用软件去重。

3.为什么采集回来的网址的主题与关键词不符?

是因为引用了 #域名# 或 #顶级域名# 后,取的是域名部分,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件才能采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。

为了比对采集是否正确,可以在保存模板里输入:#标题#,保存为htm文件,采集完后可以自己打开该文件查看比对。

最新文章

更多+
加载更多

标签

  • 分类 软件
  • 大小 10.4 MB
  • 版本 v2.3.6.0
  • 系统 Win7