网页抓取工具,给推荐几款抓网站的工具

1 , 给推荐几款抓网站的工具扒站工具 Teleport.pro 世上最好用的扒站工具个人认为那个最实用 。还有么迅雷看看、土豆、优酷、不错 。
2 , 求抓取网页的工具使用htmlparser2.0这个软件吧 。这个是HTML页面的抓取和分析工具 可以配合HTMLConnector也就是网页连接器一起使用,可以做到你所要求的(抓取双层连接并保存页面内容)你的意思就是说你浏览的当前页面,整张页面截成图片下来是吗?直接用浏览器就行了,360 , 世界之窗,遨游浏览器都可以的 。【网页抓取工具,给推荐几款抓网站的工具】
3,网页抓取工具促进谷歌收录的两种方法是: 1, 提交sitemap , 使一个XML文件;2,提交你的网站的RSS feeds 。我有个网站的内容增加很快,就是提交RSS feed,每天增加的网页太多 , 用sitemap好像不太合适 。如果想抓取网页 , 可以用GooSeeker公司发布的MetaSeeker软件工具包,功能很强大,免费使用,到gooseeker网站上下载即可,抓取的结果存成XML文件 , 但是不是sitemap,结果文件主要用来做垂直搜索、商品比价、商业情报采集等使用htmlparser2.0这个软件吧 。这个是html页面的抓取和分析工具 可以配合htmlconnector也就是网页连接器一起使用 , 可以做到你所要求的(抓取双层连接并保存页面内容)
4,求一个网页采集工具火车采集器简介:火车采集器(LocoySpider)是一个功能强大的数据采集软件.使用它,您可以很容易的从网页上抓取文字 , 图片,文件等资源.程序支持远程下载图片文件,支持网站登陆后信息采集 , 支持探测文件真实地址,支持代理 , 支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等.同时,软件具有极高的稳定性,可以多线程,多任务的工作,您可以用它进行大批量数据的更新.程序还支持多页和分页的采集,再难的数据格式也可以找到解决方案.软件应用范围:1.网站采编人员:打破传统的采编人员必须手工转载文章的现状,使他们更有时间去做数据的编辑加工,工作更有成效.程序可以完美结合TRS等采编系统,大型网站的信息采集将更加容易有效.2.内部网络:打破内网信息单一,获取困难的神话 , 内部网络也可以体验丰富多彩的互联网信息.可以解决形如军队等与因特网隔离的重要部门对于因特网的信息需求问题 .3.政府机关:实时跟踪、采集与政府工作相关的国内外及地方新闻,政策法规 , 经济,产业等信息,解决政府主网站对各地级子网站的信息采集与整合问题.4.企业应用:实时而准确地采集国内外新闻,行业新闻,技术文章.可以很容易的进行数据整合,情报处理更快捷高效,大大减少业务成本.5.SEO人员或站长:数据的获得更加容易,可迅速增加网站信息量 , 可以将更多精力放在优化和推广上.火车采集器特有的功能:1.支持所有编码格式的数据采集,您可以用它采集全世界的文章.程序还可以进行编辑间的完美转换.2.多接口;支持所有主流或非主流的CMS,BBS,下载站等,您可以通过系统的接口实现采集器和网站的完美结合.3.无人值守工作:您配置好程序以后 , 程序就可以按照您的设置自动运行,完全不需要人工干预.4.本地编辑采集数据:您可以在本地可视化编辑已采集的数据.5.采集内容测试功能:这是其它任何采集软件所不能比的 , 可直接查看结果并测试发布.6.管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松.http://www.locoy.com/5 , web抓包工具有哪些HTTP Analyzer界面非常直观,无需选择要抓包的浏览器或者软件 , 直接全局抓?。?很傻瓜化,但是功能决定不简单 。其他抓包工具有的功能它有,其他没有的功能它也有 。点击start即可进行抓包,红色按钮停止抓包,停止按钮右边的就是暂停抓包按钮 。HttpWatch界面和HTTP Analyzer有点像,但是功能少了几个 。而且只能附加到浏览器进行抓包 。附加的办法:打开浏览器-》查看-》浏览器栏-》HttpWatch,然后点record即可抓包 。特点:抓包功能强大,但是只能依附在IE上 。Post提交的数据只有参数和参数的值 , 没有显示提交的url编码数据 。HTTPDebugger同样是全局抓包,抓包和停止抓包同个按钮 。软件界面感觉没有那么友好,POST的数据只能在requestcontent内查看,只显示提交的url编码数据1.WiresharkWireshark在windows、mac、linux都有自己的版本,是图形化抓包软件的最为流行的一种,针对黑客,网络管理员和安全工作这都是必备之物 。网络管理员使用Wireshark来检测网络问题;网络安全工程师使用Wireshark来检测资讯安全相关问题;开发者使用Wireshark来为新的通讯协定出错;普通使用者使用Wireshark来学习网络协定的相关知识 。2.tcpdumptcpdump可以抓所有层的数据,功能十分强大,Linux作为网络服务器,特别是作为路由器和网关时,数据的采集和分析是不可少的 。tcpdump以其强大的功能 , 灵活的截取策略,成为每个高级的系统管理员分析网络,排查问题等所必备的工具之一 。3.httpwatchHttpWatch是强大的网页数据分析工具,集成在InternetExplorer工具栏,包括网页摘要 。Coakies管理,缓存管理,消息头发送/接受,字符查询,POST数据和目录管理功能,报告输出 。HttpWatch是一款能够收集并显示深层信息的软件 。它下用代理服务期或一些复杂的网络监控工具,就能够在显示网页同时号示网页请求和回应的日志信息 。甚至可以显示浏览器缓存和IE之间的交接信息 。集成在Intemet Explorer工具栏.4、Burpsuite目前Web安全渗透,是必须的工具,没有之一 , 功能十分强大,BurpSu是用于攻击web应用程序的集成平台它包含了许多工具,并为这些工具设计了许多接口,以促进加快攻击应用程序的过程 。所有的工具都共亨一个能处理并显示HTTP消息、持久性、认证、代理, 日志、警报的一个强大的可扩展的框架5.Fiddler目前最常用的Web报文渗透工具,功能十分强大,可以最为本地代理,报文重放等等 。Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的Http通讯 , 设秆断点,查看所有的"进出"Fiddler的数据(指cookie,html,js,css等文件,这些都可以让你胡乱修改的意思) 。Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http 通讯还提供了一个用户友好的格式 。6、CharlesCharles支持抓取http、https协议的请求,不支持socket 。使用情况和fiddler基本大同小异,也是很常用的抓包工具 。如果回答还可以,请采纳没看懂什么意思?

    推荐阅读