关于页面采集内容实现问题-问答-微盟圈

关于页面采集内容实现问题

作者：51la • 时间：2020-03-08 • 问答 • 来源：夫唯 • 阅读

采集核心在于对于内容的把握，花了2天时间研究，这种页面的采集技术，但终究一无所获。
一个非常模糊的研究是，根据关键词定位网站相关图片，采集组合在一个页面。

比如页面关键词是刘德华，那么从不同站点采集刘德华的相关图片，重组在一个页面。
http://www。zzxu.cn/tuti/69151/mahuatengnver/
view-source:http://www.zzxu.cn/tuti/69151/mahuatengnver/
一个非常有意思的是，源代码里面的图片都是带原网址链接的图片，应该是调用远程图片。

程序部署:织梦。

问题一:选用什么采集器？火车头，狂人，还是专业信息挖掘工具（已知织梦采集侠这类实现不了）
问题二:是否需要写插件？
有知道这类采集实现方法的大侠，可私信付费解决，也可无偿踊跃发言。谢过！

新一代的站群啊！老域名轮链

本文来自投稿，不代表微盟圈立场，如若转载，请注明出处：https://www.vm7.com/a/ask/31567.html

关于页面采集内容实现问题

相关推荐