首页 > 问答 > 关于页面采集内容实现问题

关于页面采集内容实现问题

[导读]:采集核心在于对于内容的把握,花了2天时间研究,这种页面的采集技术,但终究一无所获。 一个非常模糊的研究是,根据关键词定位网站相关图片,采集组合在一个页面。 比如...

采集核心在于对于内容的把握,花了2天时间研究,这种页面的采集技术,但终究一无所获。
一个非常模糊的研究是,根据关键词定位网站相关图片,采集组合在一个页面。

比如页面关键词是刘德华,那么从不同站点采集刘德华的相关图片,重组在一个页面。
http://www。zzxu.cn/tuti/69151/mahuatengnver/
view-source:http://www.zzxu.cn/tuti/69151/mahuatengnver/
一个非常有意思的是,源代码里面的图片都是带原网址链接的图片,应该是调用远程图片。

程序部署:织梦。

问题一:选用什么采集器?火车头,狂人,还是专业信息挖掘工具(已知织梦采集侠这类实现不了)
问题二:是否需要写插件?
有知道这类采集实现方法的大侠,可私信付费解决,也可无偿踊跃发言。谢过!

新一代的站群啊!老域名轮链

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/31567.html