博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
teleport使用说明
阅读量:5166 次
发布时间:2019-06-13

本文共 794 字,大约阅读时间需要 2 分钟。

 

 
 
teleport使用说明

 

浏览器下载网页:

只能浏览主页和少数网页,其它不能浏览,容量几百kb
teleport下载项目一
能完全离线看网页,7328多文件 9个JPG文件,大小134M
teleport下载项目二
部分网页采集内容和项目一基本一致,但大几兆
部分网页需要项目二(复制站点)才能浏览,项目一看不到图片
项目二比项目一耗时多,但要全面

视频教程
YouTube

How to use Teleport Pro (Footprinting and Reconnaissance)

图片
离线浏览,网站镜像,文件提取工具
遍历网站的所有链接网址,网站关键字搜索
1. 复制一个可浏览的网站,文件存放在硬盘
2.复制一个网址,包括文件结构
3.在网址搜索指定文件
包括声音,食品,背景图片,zip等等。这种方式速度快。
4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
5.指定网址下载文件,爬虫不会去其它链接
6.搜索网站关键词
图片
图片
(算法)工作原理:
1.把开始网址作为起点
2.遍历所有链接
3.对每个链接下载文件
4.重复判断
爬虫很灵活,很多参数可以自己设定。
爬虫有记忆功能,不会采集重复链接或文件
图片
项目测试
1.抓取一个网址的所有链接
选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
详细资料可以看到链接信息:
图片
可以看到网站的树状结构
图片
项目:选择第一项,创建一个可浏览的网站副本
打开所在文件夹,搜索index,就是主页,双击就可浏览
图片
终止测试:
终止后,项目被放弃,如果再次启动项目,会重新开始
暂停测试
暂停后,
项目被放弃,如果再次启动项目,会重新开始
脚本之家项目2测试,
下载的网页不全,有点打不开
工标网不能每页采集,此软件功能有限,寻找新的软件

转载于:https://www.cnblogs.com/webRobot/p/5219337.html

你可能感兴趣的文章
msp430项目编程13
查看>>
【IIS】IIS 7.0/7.5 绑定
查看>>
[SQL] 命令远程恢复数据库
查看>>
用Python3实现的Mycin专家系统简单实例
查看>>
TortoiseSVN tutorial
查看>>
poj-2376 Cleaning Shifts (排序+贪心)
查看>>
mssql 创建触发器
查看>>
2.python数据结构的性能分析
查看>>
jquery操作select(取值,设置选中)
查看>>
在Android中自定义捕获Application全局异常,可以替换掉系统的强制退出对话框(很有参考价值与实用价值)...
查看>>
1.开发准备
查看>>
centos su命令
查看>>
CLR:基元类型、引用类型和值类型
查看>>
dubbo序列化hibernate.LazyInitializationException could not initialize proxy - no Session懒加载异常的解决...
查看>>
学会分享和交流
查看>>
jQuery中的事件绑定的几种方式
查看>>
泥塑课
查看>>
iOS 自定义的对象类型的解档和归档
查看>>
setImageBitmap和setImageResource
查看>>
AndroidStudio3.0 修改项目包名
查看>>