网络爬虫定义
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。
本文详细介绍了网络爬虫的概念、原理,并探讨了包括深度优先、广度优先在内的多种爬取策略,旨在利用Java实现抓取RSS新闻的目标。
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。
2210

被折叠的 条评论
为什么被折叠?