什么是wget

    wget用原来帮衬其中的英文来讲就是:The non-interactive network
downloader,非交互式网络下载器。它扶助HTTP、HTTPS、FTP等协议,同时也接济基于HTTP代理的下载。其余重大特点如下所示:

  • 能够干活于后台,而不须要登录到系统
  • 可以跟踪HTML、XHTML、CSS等文件,从而将服务器上的页面下载到本地开展离线浏览。
  • 支撑慢速和不平稳网络下的下载和连接。

wget命令详解
wget是在Linux下支付的怒放源代码的软件,作者是Hrvoje
Niksic,后来被移植到概括Windows在内的逐一平台上。它有以下职能和特点:
  (1)协助断点下传功用;那或多或少,也是互连网蚂蚁和FlashGet当年最大的卖点,现在,Wget也可以利用此效能,那么些互连网不是太好的用户可以放心了;
  (2)同时扶助FTP和HTTP下载格局;即使现近年来多数软件能够使用HTTP格局下载,不过,有些时候,如故须要利用FTP方式下载软件;
  (3)支持代理服务器;对安全强度很高的系统而言,一般不会将团结的连串一贯暴光在网络上,所以,援救代理是下载软件必须有的效益;
  (4)设置便民不难;只怕,习惯图形界面的用户已经不是太习惯命令行了,可是,命令行在安装上其实有越多的独到之处,最少,鼠标可以少点很频仍,也决不顾虑是或不是错点鼠标;
  (5)程序小,完全免费;程序小可以设想不计,因为昨日的硬盘实在太大了;完全免费就不得不考虑了,就算互连网上有很多所谓的免费软件,不过,那一个软件的广告却不是我们欣赏的;

wget 使用全称

常用语法

wget [选项] [URL]

常用选项参数如下所示:

选项 说明
-V,–version 显示版本信息
-h,–help 显示帮助信息
-b,–backgroup 以后台形式进行运行
-e command,–execute command 如果命令属于.wgetrc,则执行命令
-o logfile,–output-file=logfile 将日志打印到文件中
-a logfile,–append-output=logfile 追加日志到文件中
-q,–quiet 静默模式,关闭wget的输出信息
-v,–verbose 显示详细的信息,wget默认模式
-i file,–inpu-file=file 从文件中读取URL下载地址
-B URL,–base=URL 设置连接的相对URL地址
–bind-address=ADDRESS 设置连接的IP地址或主机名
-t number,–tries=number 设置重试次数,0和inf则代表一直重试,默认值为20
-O file,–output-document=file 将下载文件中的内容保存到本地文件中
-nc,–no-clobber 如果下载文件已经存在,则不下载
-c,–continue 继续执行上次的下载任务
-N,–timestamping 增加时间戳
-S,–server-response 打印HTTP、FTP头部信息
-T seconds,–timeout=seconds 设置超时时间
–limit-rate=amount 限制下载速度
-X 设置下载排除项
-r,–recursive 递归下载文件
-nH, –no-host-directories 禁止创建以域名命令的文件夹
–cut-dirs=number 忽略下载地址中的层次目录

下载wget(1.11.4) for win

     wget即使功效强大,不过使用起来仍旧相比较简单的,基本的语法是:wget
[参数列表] URL。下边就重组具体的例证来验证一下wget的用法。
     1、下载整个http大概ftp站点。
     wget
     那几个命令可以将
首页下载下来。使用-x会强制建立服务器上一模一样的目录,如若接纳-nd参数,那么服务器上下载的拥有内容都会加到本地当前目录。

1)帮忙断点下传成效(2)同时襄助FTP和HTTP下载形式(3)援救代理服务器(4)设置便民简单;5)程序小,完全免费;

安插文件

    要想要得利用wget命令,如故先了然一下wget隐藏的局地潜规则,地点在:

  • /etc/wgetrc
  • 家目录中的.wgetrc

1、wget命令有局地精选可以应用逗号举行隔开,如-X可以安装排除项,假如单纯是四遍,则无所谓,但如果长时间均不必要下载那些目录,则足以将这几个免除项添加.wgetrc配置文件中

exclude_directories=test,tmp,temp

2、在率先种情景下,突然又想下载这几个文件时,可以去掉配置文件中设置,也可以采取以下的措施:

wget -r -X '' ftp://192.168.8.8

安装 

     wget -r
    
这几个命令会依照递归的办法,下载服务器上装有的目录和文件,实质就是下载整个网站。那个命令一定要小心使用,因为在下载的时候,被下载网站指向的保有地点一样会被下载,由此,要是这么些网站援引了其他网站,那么被引述的网站也会被下载下来!基于这么些原因,那些参数不常用。可以用-l
number参数来指定下载的层系。例如只下载两层,那么使用-l 2。

一声令下格式:

常用示例

1、下载文件:

[root@localhost ]# wget https://ss0.bdstatic.com/5aV1bjqh_Q23odCf/static/superman/img/logo/logo_redBlue_32fe2c69.png
--2018-07-28 19:55:17--  https://ss0.bdstatic.com/5aV1bjqh_Q23odCf/static/superman/img/logo/logo_redBlue_32fe2c69.png
正在解析主机 ss0.bdstatic.com (ss0.bdstatic.com)... 180.163.198.32
正在连接 ss0.bdstatic.com (ss0.bdstatic.com)|180.163.198.32|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:8618 (8.4K) [image/png]
正在保存至: “logo_redBlue_32fe2c69.png”

100%[=============================================================================================================================>] 8,618       --.-K/s 用时 0.002s

2018-07-28 19:55:17 (3.80 MB/s) - 已保存 “logo_redBlue_32fe2c69.png” [8618/8618])

2、下载目录和后台执行

[root@localhost test]# wget -r -b https://mirrors.aliyun.com/centos/7.5.1804/atomic/x86_64/adb/
继续在后台运行,pid 为 26252。
将把输出写入至 “wget-log”。
[root@localhost test]# ll
总用量 4
drwxr-xr-x 3 root root   38 7月  28 20:14 mirrors.aliyun.com
-rw-r--r-- 1 root root 1257 7月  28 20:14 wget-log
[root@localhost test]# cat wget-log 
--2018-07-28 20:14:11--  https://mirrors.aliyun.com/centos/7.5.1804/atomic/x86_64/adb/
正在解析主机 mirrors.aliyun.com (mirrors.aliyun.com)... 180.163.155.11, 180.163.155.8, 180.163.155.9, ...
正在连接 mirrors.aliyun.com (mirrors.aliyun.com)|180.163.155.11|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:3518 (3.4K) [text/html]
正在保存至: “mirrors.aliyun.com/centos/7.5.1804/atomic/x86_64/adb/index.html”

3、禁止生成下载地址中的多级目录

[root@localhost test]# wget -b -r -nH --cut-dir=6 https://mirrors.aliyun.com/centos/7.5.1804/atomic/x86_64/adb/
继续在后台运行,pid 为 34849。
将把输出写入至 “wget-log”。
[root@localhost test]# ll
总用量 12
-rw-r--r-- 1 root root 3518 7月  28 20:25 index.html
-rw-r--r-- 1 root root  295 10月 31 2017 robots.txt
-rw-r--r-- 1 root root 1113 7月  28 20:25 wget-log

下载目录路径如下所示:

情况 结果
-r mirrors.aliyun.com/centos/7.5.1804/atomic/x86_64/adb/
-nH centos/7.5.1804/atomic/x86_64/adb/
-nH –cut-dir=1 centos/7.5.1804/atomic/x86_64/adb/
-nH –cut-dir=4 adb/
-nH –cut-dir=6 .

4、将下载的文本保留到地头文件中

[root@localhost test]# wget -t 2 -o log.txt https://mirrors.aliyun.com/centos/7.5.1804/isos/x86_64/sha256sum.txt  -O test.txt
[root@localhost test]# ll
总用量 8
-rw-r--r-- 1 root root 554 7月  28 20:37 log.txt
-rw-r--r-- 1 root root 598 5月  10 03:59 test.txt
[root@localhost test]# cat log.txt
--2018-07-28 20:37:28--  https://mirrors.aliyun.com/centos/7.5.1804/isos/x86_64/sha256sum.txt
正在解析主机 mirrors.aliyun.com (mirrors.aliyun.com)... 180.163.155.9, 180.163.155.10, 180.163.155.11, ...
正在连接 mirrors.aliyun.com (mirrors.aliyun.com)|180.163.155.9|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:598 [text/plain]
正在保存至: “test.txt”
     0K                    100%  175M=0s
2018-07-28 20:37:28 (175 MB/s) - 已保存 “test.txt” [598/598])

[root@localhost test]# cat test.txt
506e4e06abf778c3435b4e5745df13e79ebfc86565d7ea1e128067ef6b5a6345  CentOS-7-x86_64-DVD-1804.iso
b346daae2a93caed88e822e722e7284c648f9919d475ff98489b424350f99a45  CentOS-7-x86_64-LiveGNOME-1804.iso
040ddfb27d30e48efad8709c9df946202cec169077c843fd2cbe8d802187ff8e  CentOS-7-x86_64-LiveKDE-1804.iso
714acc0aefb32b7d51b515e25546835e55a90da9fb00417fbee2d03a62801efd  CentOS-7-x86_64-Minimal-1804.iso
99723c8b87dcec21df8aed23de1eb810346d42cfd2a3fafafe70a68296053417  CentOS-7-x86_64-Everything-1804.iso
937bf0a7b0932817f84f7230f15ed88911bbbd85c0c958680792b7f8d8f9c1a9  CentOS-7-x86_64-NetInstall-1804.iso

正文同步在微信订阅号上揭橥,如各位小伙伴们欣赏我的稿子,也足以关怀我的微信订阅号:woaitest,或扫描下边的二维码添加关切:
澳门金沙国际 1

添加wget环境变量,那样使用就更有益于了,右键计算机->属性->高级系统安装->高级->环境变量->选中PATH->编辑,在终极添加 

     若是你想制作镜像站点,那么可以采纳-m参数,例如:wget -m

    
那时wget会自行判断合适的参数来制作镜像站点。此时,wget会报到到服务器上,读入robots.txt并按robots.txt的规定来举行。

wget [参数列表] [目的软件、网页的网址]

;C:\Program Files (x86)\GnuWin32\bin

     2、断点续传。
    
当文件尤其大照旧互联网越发慢的时候,往往一个文书还并未下载完,连接就早已被隔离,此时就要求断点续传。wget的断点续传是全自动的,只须求动用-c参数,例如:
     wget -c
    
使用断点续传须要服务器援救断点续传。-t参数表示重试次数,例如须求重试100次,那么就写-t
100,假设设成-t
0,那么表示无穷次重试,直到连接成功。-T参数表示超时等待时间,例如-T
120,表示等待120秒连接不上就是过期。

1、启动类参数

 

     3、批量下载。
    
即便有多个文本须要下载,那么可以生成一个文本,把每一个文件的URL写一行,例如生成文书download.txt,然后用命令:wget
-i download.txt
诸如此类就会把download.txt里面列出的各种URL都下载下来。(如果列的是文件就下载文件,假若列的是网站,那么下载首页)

这一类参数主要提供软件的一对主导音信;

  1. 下载文件
    澳门金沙国际 2

    wget 网址
    

    澳门金沙国际 3
     

    澳门金沙国际 4

  2. 而要让档案自行储存到指令的目录下,则须求借用-P这么些参数,能够运用以下的吩咐

    澳门金沙国际 5

    wget -P 目录 网址
    举例来说,如果你要放到/root底下,你可以打下列的指令:
    
    wget -P /root 网址
    
    wget -P D:\xxx.zip http://www.xdown.com/xxx.zip
    
    wget -O "D:\xxx.zip" http://www.xdown.com/xxx.zip
    

    澳门金沙国际 6

  3. 用wget下载东西,的确很有益,它会活动重连并断点续传。令人很放心。

    每每要下载一个网站或网站的某个目录。

    下载一个索引,例如下载网站www.example.com/目录mydir下的保有内容
    澳门金沙国际 7

    命令如下:
    wget -r -p -k -np -nc -e robots=off http://www.example.com/mydir/
    如果要想下载整个网站,最好去除-np参数。   
    wget -r -p -k -nc -e robots=off http://www.example.com/mydir/
    
    -r 递归;对于HTTP主机,wget首先下载URL指定的文件,然后(如果该文件是一个HTML文档的话)递归下载该文件所引用(超级连接)的所有文件(递 归深度由参数-l指定)。对FTP主机,该参数意味着要下载URL指定的目录中的所有文件,递归方法与HTTP主机类似。   
    -c 指定断点续传功能。实际上,wget默认具有断点续传功能,只有当你使用别的ftp工具下载了某一文件的一部分,并希望wget接着完成此工作的时候,才 需要指定此参数。
    
    -nc 不下载已经存在的文件
    -np 表示不追溯至父目录,不跟随链接,只下载指定目录及子目录里的东西;
    -p 下载页面显示所需的所有文件。比如页面中包含了图片,但是图片并不在/yourdir目录中,而在/images目录下,有此参数,图片依然会被正常下 载。
    
    -k 修复下载文件中的绝对连接为相对连接,这样方便本地阅读。
    -o down.log 记录日记到down.log
    -e robots=off 忽略robots.txt
    

     4、选拔性的下载。
     可以指定让wget只下载一类公事,或然不下载什么文件。例如:
     wget -m –reject=gif
    
表示下载
可以承受的文件类型,–reject=LIST拒绝接受的文件类型。

-V,–version 突显软件版本号然后脱离;
-h,–help突显软件协理音讯;
-e,–execute=COMMAND 执行一个 “.wgetrc”命令

 

     5、密码和评释。
     wget只可以处理利用用户名/密码方式界定访问的网站,可以运用多个参数:
     –http-user=USER设置HTTP用户
     –http-passwd=PASS设置HTTP密码
     对于须求表明做表达的网站,就只可以动用其余下载工具了,例如curl。

如上每个功用有长短七个参数,长短功效雷同,都足以运用。须要留意的是,这里的-e参数是实施一个.wgettrc的吩咐,.wgettrc命令其实是一个参数列表,直接将软件必要的参数写在一道就可以了。

 

     6、利用代理服务器举办下载。
    
若是用户的网络必要经过代理服务器,那么可以让wget通过代理服务器举行文件的下载。此时要求在方今用户的目录下开创一个.wgetrc文件。文件中得以安装代理服务器:
     http-proxy = 111.111.111.111:8080
     ftp-proxy = 111.111.111.111:8080
    
分别代表http的代理服务器和ftp的代理服务器。若是代理服务器要求密码则使用:
     –proxy-user=USER设置代理用户
     –proxy-passwd=PASS设置代理密码
     那七个参数。
     使用参数–proxy=on/off 使用照旧关闭代理。
     wget还有为数不少卓有成效的效劳,需求用户去挖掘。

2、文件处理参数

 Wget 的使用**
**  

附录:

那类参数定义软件log文件的输出情势等;

1)协助断点下传功用

指令格式:
  wget [参数列表] [目的软件、网页的网址]

-o,–output-file=FILE 将软件出口音信保存到文件;
-a,–append-output=FILE将软件出口音信追加到文件;
-d,–debug呈现输出新闻;
-q,–quiet 不显得输出音讯;
-i,–input-file=FILE 从文件中赢得URL;

2)同时支持FTP和HTTP下载形式

  -V,–version 呈现软件版本号然后退出;
  -h,–help突显软件援救音讯;
  -e,–execute=COMMAND 执行一个 “.wgetrc”命令

上述参数对于攻击者相比较有用,大家来看望实际行使;

3)辅助代理服务器

  -o,–output-file=FILE 将软件出口消息保存到文件;
  -a,–append-output=FILE将软件出口消息追加到文件;
  -d,–debug展现输出音讯;
  -q,–quiet 不显得输出音信;
  -i,–input-file=FILE 从文件中拿走URL;

例1:下载192.168.1.168首页并且出示下载新闻
wget -d

4)设置便民简单

  -t,–tries=NUMBER 是或不是下载次数(0代表无穷次)
  -O –output-document=FILE下载文件保留为其余文件名
  -nc, –no-clobber 不要覆盖已经存在的文书
  -N,–timestamping只下载比地方新的公文
  -T,–timeout=SECONDS 设置超时时间
  -Y,–proxy=on/off 关闭代理

例2:下载192.168.1.168首页并且不出示任何音讯
wget -q

5)程序小,完全免费;  

     -nd,–no-directories 不树立目录
  -x,–force-directories 强制建立目录

例3:下载filelist.txt中所包罗的链接的保有文件
wget -i filelist.txt

一声令下格式:  
  wget [参数列表] [目的软件、网页的网址]
  
  1、启动类参数
  
  这一类参数主要提供软件的有些中坚信息;
  
  -V,–version 突显软件版本号然后脱离;
  -h,–help突显软件支持音讯;
  -e,–execute=COMMAND 执行一个 “.wgetrc”命令
  
  以上每种作用有长短七个参数,长短功用雷同,都得以动用。要求小心的是,那里的-e参数是实践一个.wgettrc的命令,.wgettrc命令其实是一个参数列表,直接将软件需求的参数写在一起就足以了。
  
  2、文件处理参数
  
  那类参数定义软件log文件的输出形式等;
  
  -o,–output-file=FILE 将软件出口音讯保存到文件;
  -a,–append-output=FILE将软件出口音信追加到文件;
  -d,–debug突显输出音信;
  -q,–quiet 不显得输出音信;
  -i,–input-file=FILE 从文件中收获URL;
  
  以上参数对于攻击者相比较有用,大家来看望实际运用;
  
  例1:下载192.168.1.168首页并且出示下载新闻
  wget -dhttp://192.168.1.168
  
  例2:下载192.168.1.168首页并且不出示任何新闻
  wget -qhttp://192.168.1.168
  
  例3:下载filelist.txt中所蕴涵的链接的享有文件
  wget -i filelist.txt
  
  
  wget -np -m -l5 http://jpstone.bokee.com //不下载本站所链接的其余站点内容,5级目录结构
  3、下载参数
  
  下载参数定义下载重复次数、保存文件名等;
  
  -t,–tries=NUMBER 是不是下载次数(0表示无穷次)
  -O –output-document=FILE下载文件保留为其余文件名
  -nc, –no-clobber 不要覆盖已经存在的文书
  -N,–timestamping只下载比地方新的公文
  -T,–timeout=SECONDS 设置超时时间
  -Y,–proxy=on/off 关闭代理
  
  例:下载192.168.1.168的首页并将下载进度中的的输入音讯保存到test.htm文件中
  wget -o test.htmhttp://192.168.1.168
  
  4、目录参数
  
  目录参数主要安装下载文件保留目录与原先文件(服务器文件)的目录对应涉及;
  
  -nd –no-directories 不创造目录
  -x,–force-directories 强制建立目录
  大概现在大家对此处的目录还不是很精晓,大家来看一个举例
  
  例:下载192.168.1.168的首页,并且保持网站协会
  wget -xhttp://192.168.1.168
  
  
  5、HTTP参数
  
  HTTP参数设置一些与HTTP下载有关的性质;
  
  –http-user=USER设置HTTP用户
  –http-passwd=PASS设置HTTP密码
  –proxy-user=USER设置代理用户
  –proxy-passwd=PASS设置代理密码
  
  以上参数主要安装HTTP和代办的用户、密码;
  
  6、递归参数设置
  
  在下载一个网站依旧网站的一个索引的时候,大家须求领会的下载的层次,那一个参数就足以设置;
  -r,–recursive 下载整个网站、目录(小心使用)
  -l,–level=NUMBER 下载层次
  
  例:下载整个网站
  wget -rhttp://192.168.1.168
  
  7、递归允许与拒绝选项参数
  
  下载一个网站的时候,为了尽大概快,有些公文可以选择下载,比如图片和声音,在那边可以设置;
  
  -A,–accept=LIST 可以承受的文件类型
  -R,–reject=LIST拒绝接受的文件类型
  -D,–domains=LIST可以承受的域名
  –exclude-domains=LIST拒绝的域名
  -L,–relative 下载关联链接
  –follow-ftp 只下载FTP链接
  -H,–span-hosts 可以下载外面的主机
  -I,–include-directories=LIST允许的目录
  -X,–exclude-directories=LIST 拒绝的目录
  
  
  如何设定wget所选用的代理服务器
  wget可以动用用户安装文件”.wgetrc”来读取很多设置,大家那边最紧要使用那么些文件来是
  设置代理服务器。使用者用什么样用户登录,那么什么样用户主目录下的”.wgetrc”文件就起
  功用。例如,”root”用户一旦想选取”.wgetrc”来设置代理服务器,”/root/.wgetrc”就起
  功用,上边给出一个”.wgetrc”文件的始末,读者可以参见这么些事例来编排本身的”wgetrc”文件:
  http-proxy = 111.111.111.111:8080
  ftp-proxy = 111.111.111.111:8080
  那两行的意义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
  HTTP磋商所利用的代理服务器,第二行指定FTP协议所选用的代理服务器。
  
  
  
  WGet使用指南
  wget是一个从网络上电动下载文件的轻易工具。它协助HTTP,HTTPS和FTP协议,可以应用HTTP代理.
  
  所谓的全自动下载是指,wget能够在用户退出系统的之后在后台执行。那意味着那你可以登录种类,启动一个wget下载职分,然后退出系统,wget将在后台执行直到任务到位,相对于任殷亚吉过半数浏览器在下载大批量数量时须求用户间接的涉企,那省去了极大的难为。
  
  wget 可以跟踪HTML页面上的链接依次下载来创建远程服务器的本土版本,完全重建原始站点的目录结构。那又常被称作”递归下载”。在递归下载的时候,wget 遵从罗布ot Exclusion标准(/robots.txt). wget可以在下载的同时,将链接转换成指向本地文件,以利于离线浏览。
  
  wget 极度安静,它在带宽很窄的意况下和不稳定互联网中有很强的适应性.如若是由于互联网的原由下载失利,wget会没完没了的品味,直到所有文件下载落成。若是是劳务 器打断下载进程,它会另行联到服务器上从截至的地方继续下载。那对从这些限定了链接时间的服务器上下载大文件充足实惠。
  
  wget的宽广用法
  wget的利用格式
  
  Usage: wget [OPTION]… [URL]…用wget做站点镜像:
  wget -r -p -np -khttp://dsec.pku.edu.cn/~us..
  #wget命令详解,基础教程。 或者
  wget -mhttp://www.tldp.org/LDP/ab…在不安宁的互联网上下载一个有的下载的公文,以及在闲暇时段下载
  wget -t 0 -w 31 -chttp://dsec.pku.edu.cn/BBC.. -o down.log &
  # 大概从filelist读入要下载的文本列表
  wget -t 0 -w 31 -c -Bftp://dsec.pku.edu.cn/linu.. -i filelist.txt -o down.log &上边的代码还足以用来在网络相比较空闲的时节举办下载。我的用法是:在mozilla旅长不便宜当时下载的URL链接拷贝到内存中然后粘贴到文件 filelist.txt中,在夜幕要出来系统前实施上边代码的第二条。
  
  使用代理下载
  wget -Y on -p -khttps://sourceforge.net/pr…代理可以在环境变量或wgetrc文件中设定
  
  # 在环境变量中设定代理
  export PROXY=
  # 在~/.wgetrc中设定代理
  http_proxy =http://proxy.yoyodyne.com:..
  ftp_proxy =http://proxy.yoyodyne.com:…各样选项分类列表
  启动
  -V, –version 展现wget的版本后退出
  -h, –help 打印语法帮忙
  -b, –background 启动后转入后台执行
  -e, –execute=COMMAND 执行`.wgetrc”格式的授命,wgetrc格式参见/etc/wgetrc或~/.wgetrc记录和输入文件
  -o, –output-file=FILE 把记录写到FILE文件中
  -a, –append-output=FILE 把记录追加到FILE文件中
  -d, –debug 打印调试输出
  -q, –quiet 安静格局(没有出口)
  -v, –verbose 冗长格局(那是缺省设置)
  -nv, –non-verbose 关掉冗长形式,但不是虚气平心形式
  -i, –input-file=FILE 下载在FILE文件中出现的URLs
  -F, –force-html 把输入文件作为HTML格式文件相比较
  -B, –base=URL 将URL作为在-F -i参数指定的文件中出现的相对链接的前缀
  –sslcertfile=FILE 可选客户端证书
  –sslcertkey=KEYFILE 可选客户端证书的KEYFILE
  –egd-file=FILE 指定EGD socket的文本名下载
  –bind-address=ADDRESS 指定地点使用地方(主机名或IP,当本地有两个IP或名字时利用)
  -t, –tries=NUMBER 设定最大尝试链接次数(0 代表无界定).
  -O –output-document=FILE 把文档写到FILE文件中
  -nc, –no-clobber 不要覆盖存在的文书或使用.#前缀
  -c, –continue 接着下载没下载完的公文
  –progress=TYPE 设定进程条标记
  -N, –timestamping 不要再一次下载文件除非比当地文件新
  -S, –server-response 打印服务器的对答
  –spider 不下载任何事物
  -T, –timeout=SECONDS 设定响应超时的秒数
  -w, –wait=SECONDS 一遍尝试之间间隔SECONDS秒
  –waitretry=SECONDS 在重新链接之间等待1…SECONDS秒
  –random-wait 在下载之间等待0…2*WAIT秒
  -Y, –proxy=on/off 打开或关闭代理
  -Q, –quota=NUMBER 设置下载的容量限制
  –limit-rate=RATE 限定下载输率目录
  -nd –no-directories 不创设目录
  -x, –force-directories 强制成立目录
  -nH, –no-host-directories 不创立主机目录
  -P, –directory-prefix=PREFIX 将文件保留到目录 PREFIX/…
  –cut-dirs=NUMBER 忽略 NUMBER层远程目录HTTP 选项
  –http-user=USER 设定HTTP用户名为 USER.
  –http-passwd=PASS 设定http密码为 PASS.
  -C, –cache=on/off 允许/不允许服务器端的数量缓存 (一般意况下同意).
  -E, –html-extension 将拥有text/html文档以.html扩充名保存
  –ignore-length 忽略 `Content-Length”头域
  –header=STRING 在headers中插入字符串 STRING
  –proxy-user=USER 设定代理的用户名为 USER
  –proxy-passwd=PASS 设定代理的密码为 PASS
  –referer=URL 在HTTP请求中包涵 `Referer: URL”头
  -s, –save-headers 保存HTTP头到文件
  -U, –user-agent=AGENT 设定代理的称谓为 AGENT而不是 Wget/VERSION.
  –no-http-keep-alive 关闭 HTTP活动链接 (永远链接).
  –cookies=off 不使用 cookies.
  –load-cookies=FILE 在起来会话前从文件 FILE中加载cookie
  –save-cookies=FILE 在对话截至后将 cookies保存到 FILE文件中FTP 选项
  -nr, –dont-remove-listing 不移走 `.listing”文件
  -g, –glob=on/off 打开或关闭文件名的 globbing机制
  –passive-ftp 使用被动传输格局 (缺省值).
  –active-ftp 使用主动传输格局
  –retr-symlinks 在递归的时候,将链接指向文件(而不是目录)递归下载
  -r, –recursive 递归下载--慎用!
  -l, –level=NUMBER 最大递归深度 (inf 或 0 代表无穷).
  –delete-after 在现行竣事后有些删除文件
  -k, –convert-links 转换非相对链接为相对链接
  -K, –backup-converted 在转换文件X此前,将之备份为 X.orig
  -m, –mirror 等价于 -r -N -l inf -nr.
  -p, –page-requisites 下载显示HTML文件的所有图片递归下载中的包蕴和不分包(accept/reject)
  -A, –accept=LIST 分号分隔的被接受扩张名的列表
  -R, –reject=LIST 分号分隔的不被接受的扩充名的列表
  -D, –domains=LIST 分号分隔的被接受域的列表
  –exclude-domains=LIST 分号分隔的不被接受的域的列表
  –follow-ftp 跟踪HTML文档中的FTP链接
  –follow-tags=LIST 分号分隔的被盯梢的HTML标签的列表
  -G, –ignore-tags=LIST 分号分隔的被忽略的HTML标签的列表
  -H, –span-hosts 当递归时转到外部主机
  -L, –relative 仅仅跟踪相对链接
  -I, –include-directories=LIST 允许目录的列表
  -X, –exclude-directories=LIST 不被含有目录的列表
  -np, –no-parent 不要追溯到父目录
  
  
  Wget使用技巧 
  wget的施用方式是:
  wget [参数列表] URL
  首先来介绍一下wget的主要参数:
  ・ -b:让wget在后台运行,记录文件写在当前目录下”wget-log”文件中;
  ・ -t [nuber of times]:尝试次数,当wget不可以与服务器建立连接时,尝试连接多少次
  。比如”-t
  120″表示尝试120次。当这一项为”0″的时候,指定尝试无穷很多次截至连接成功截至,那么些
  设置卓殊有用,当对方服务器突然关机大概网络突然中止的时候,可以在復苏正常后两次三番
  下载没有传完的公文;
  ・ -c:断点续传,这也是个极度实惠的装置,更加当下载相比较大的公文的时候,如果中
  途意外中断,那么连接复苏的时候会从上次没传完的地点接着传,而不是又从头开首,使
  用这一项须求中远距离服务器也支撑断点续传,一般来讲,基于UNIX/Linux的Web/FTP服务器
  都协理断点续传;
  ・ -T [number of seconds]:超时时间,指定多久远程服务器没有响应就半涂而废连接
  ,开始下一回尝试。比如”-T
  120″表示借使120秒将来远程服务器并未发过来数据,就再也尝试连接。倘若互连网速度比
  较快,这几个小时足以设置的短些,相反,可以安装的长一些,一般最多不当先900,平日
  也不少于60,一般安装在120左右比较确切;
  ・ -w [number of seconds]:在两次尝试之间等待多少秒,比如”-w 100″表示五遍尝试
  之间等待100秒;
  ・ -Y on/off:通过/不经过代理服务器举行一而再;
  ・ -Q [byetes]:限制下载文件的总大小最多不大概跨愈多少,比如”-Q2k”表示不可以超越2K
  字节,”-Q3m”表示最多无法领先3M字节,若是数字前面什么都不加,就代表是以字节为单
  位,比如”-Q200″表示最多不恐怕当先200字节;
  ・ -nd:不下载目录结构,把从服务器所有指定目录下载的文书都堆到当前目录里;
  ・ -x:与”-nd”设置刚好相反,创设完整的目录结构,例如”wget -ndhttp://www.gnu.org”将创立在当前目录下创建”w…,然后依据服务器
  实际的目录结构一级顶尖建下去,直到所有的公文都传完截至;
  ・ -nH:不创设以目标主机域名为目录名的目录,将对象主机的目录结构平素下到当前目
  录下;
  ・ –http-user=username
  ・ –http-passwd=password:假诺Web服务器须求指定用户名和口令,用那两项来设定;
  ・ –proxy-user=username
  ・ –proxy-passwd=password:如若代理服务器必要输入用户名和口令,使用那多个挑选
  ;
澳门金沙国际 ,  ・ -r:在本机建立服务器端目录结构;
  ・ -l [depth]:下载远程服务器目录结构的深度,例如”-l 5″下载目录深度小于可能等
  于5以内的目录结构依然文件;
  ・ -m:做站点镜像时的选项,倘诺你想做一个站点的镜像,使用这一个选项,它将自行设
  定其余合适的选项以便于站点镜像;
  ・ -np:只下载目的站点指定目录及其子目录的始末。那也是一个分外管用的选项,我们
  借使某个人的个人主页里面有一个针对那么些站点其外人个人主页的连年,而大家只想下载
  此人的个人主页,倘若不设置那么些选项,甚至–有大概把全路站点给抓下来,那明显是
  大家司空眼惯不指望的;
  ü 怎么样设定wget所选择的代理服务器
  wget可以接纳用户安装文件”.wgetrc”来读取很多装置,大家那边根本选择那么些文件来是
  设置代理服务器。使用者用怎么样用户登录,那么如何用户主目录下的”.wgetrc”文件就起
  成效。例如,”root”用户一旦想利用”.wgetrc”来设置代理服务器,”/root/.wgert”就起
  功用,上面给出一个”.wge
  trc”文件的内容,读者可以参照这么些例子来编排自身的”wgetrc”文件:
  http-proxy = 111.111.111.111:8080
  ftp-proxy = 111.111.111.111:8080
  那两行的意思是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
  HTTP琢磨所选取的代理服务器,第二行指定FTP协议所使用的代理服务器。
  wget 使用实例:
  wget是一个命令行工具,用于批量下载文件,接济HTTP和FTP。终归比其余的工具好在何地?看看内容吧 
  
  wget基本上所有的Linux版本都要好带了,不过有些许人在用呢?呵呵,若是您没有用过,不妨尝试。Windows上面的用户可以行使GNUwin32的档次,wget,基本功效完全一致。好吧,大家来以多少个简单的例子看看wget的威力。
  
  假诺大家想下载ftp里面某个目录里面的保有文件,大家也得以不用ftp这几个笨蛋,呵呵,可以大快朵颐cute ftp等图形化工具的拖一个索引的落拓不羁了。如
  
  
  wget -rftp://10.8.8.8/movie/
  
  呵呵,等呢!下完了,发觉有些窘迫,怎么出去个10.8.8.8的目录,进去看看,又是一个movie,哦,wget将引得结构和网站题目都给记录下来了,不要??小意思!比如说依旧那一个例子
  
  wget -r -ndftp://10.8.8.8/movie/
  
  结果什么目录都不曾了,faint!怎么会如此?呵呵,你一旦想要那样就让它那样吧,否则使用
  
  wget -r -nHftp://10.8.8.8/movie/
  
  恩?movie也不用?OK,那就那样
  
  wget -r -nH –cut-dirs=1ftp://10.8.8.8/movie/
  
  这有怎样用啊?cuteftp比她好用多了,而且,你那断了线能连吗?呵呵,不好意思,可以连
  
  wget -c -r -nH –cut-dirs=1ftp://10.8.8.8/movie/
  
  
  但 是cuteftp能做上面的事情呢?比如,现在广大网站选拔Apache建站,并不提供ftp服务,可是Apache有一个indexing功效,可以提 供一个像样于ftp的界面,好多文书我想下啊,咋做?由于是HTTP协议,CuteFTP无能为力了,倒是flash get等有如何get all那种效率,不亮堂她们对于目录处理怎么样。可是wget一点标题都不曾,不信?我们拿CTAN为例(例子并不适用,CTAN有FTP服务),大家下 载那中间有着的宏包,呵呵
  
  wget -r -khttp://www.txia.com/blog
  
  -k代表将一连转换为本地连接。可是现在一模一样有地点的题材呀,这就把你须要的拉长吧,别的或者你根本不须要向下走那么多层,比如,咱们即将到第二层,那么
  
  wget -r -l2 -khttp://www.txia.com/blog
  
  现在新的题材是,由于网页有一个排序效能,很厌恶,因为下载的时候把网页重复了如拾草芥次,那么大家可选择-A和-R开关控制下载类型,并且可以接纳通配符,呵呵,现在即兴了吗
  
  wget -r -R “*.htm*?*” -khttp://www.txia.com/blog
  
  本次没有那种网页了吗?-R的意义在于拒绝下载匹配类型的文本,-A表示只是接受的文件类型,如-A “*.gif”将仅下载gif图片,倘使有五个允许或然不允许,可以选用,分开。
  
  这 么,大家现在在运用代理服务器,如何做呢?呵呵,很心情舒畅你采取了wget,你可以动用它的配备文件,环境变量来选择代理。那里推荐应用环境变量,如在 bash里面大家可以把随时用的proxy加到.bash_profile里面,那是Linux标准写法(很多软件都用的,什么apt-get,yum等 等)
  
  export http_proxy=
  
  然后,proxy就默认打开了,假使急需暂时关张,能够应用
  
  wget –proxy=off -r -khttp://www.txia.com/blog
  
  当然,写一个.wgetrc文件也得以,该公文可以从/usr/local/etc里面找到,里面有很详细的表明,我就不多说了。
  
  下载网页的时候比较辛勤的事务是,有的网页被同时针对了过多遍,那么为了幸免频仍下载,大家选择
  
  wget -nc -r -khttp://www.txia.com/blog
  
  可防止止那件工作。为了不被部分延续指向非http://www.txia.com/blog内层目录,大家还应有加上
  
  wget -nc -np -r -khttp://www.txia.com/blog
  
  防止下载非该目录里面的公文,那也幸免了到分裂的host上边去。当然,假若你期望有其一作用,在五个host之间跳来跳去的下载,可以利用
  
  wget -nc -np -H -r -khttp://www.txia.com/blog
  
  使得可以在多少个host之间span,同时-I和-X可以使得我们只是跟踪某些目录只怕不跟踪某些目录。即使某些HTML里面你需求的事物不是由那种事物作出来的,你就得利用–follow-tags和–ignore-tags了。
  
  嘿,我有个公文之中都是一而再,怎么做?若是否html你只需要
  
  wget -i your.file
  
  假如是,那也不繁
  
  wget -F -i your.file
  
  
  
  wget 使用指南
  wget是一个从网络上自行下载文件的自由工具。它协助HTTP,HTTPS和FTP协议,可以应用HTTP代理.
  
  所谓的全自动下载是指,wget可以在用户退出系统的之后在后台执行。那意味着那你可以登录系列,启动一个wget下载任务,然后退出系统,wget将在后台执行直到义务成功,相对于任何一大半浏览器在下载大量数码时索要用户一向的涉企,这省去了大幅度的劳动。
  
  wget 能够跟踪HTML页面上的链接依次下载来成立远程服务器的地头版本,完全重建原始站点的目录结构。那又常被称作”递归下载”。在递归下载的时候,wget 听从Robot Exclusion标准(/robots.txt). wget可以在下载的同时,将链接转换成指向本地文件,以造福离线浏览。
  
  wget 相当稳定,它在带宽很窄的情况下和不平稳互联网中有很强的适应性.假诺是由于网络的缘由下载战败,wget会不停的尝尝,直到所有文件下载完结。假如是劳务 器打断下载进度,它会重复联到服务器上从截止的地点三番五次下载。这对从那一个限定了链接时间的服务器上下载大文件尤其管用。
  
  wget的广大用法
  wget的运用格式
  
  Usage: wget [OPTION]… [URL]…
  
  用wget做站点镜像:
  wget -r -p -np -khttp://dsec.pku.edu.cn/~us..
  -r 表示递归下载,会下载所有的链接,然而要专注的是,不要单独行使这些参数,因为一旦你要下载的网站也有其余网站的链接,wget也会把其余网站的事物下载 下来,所以要抬高 -np那么些参数,表示不下载其余站点的链接. -k表示将下载的网页里的链接修改为本地链接.-p得到所有呈现网页所需的元素,比如图片什么的.
  
  # 或者
  wget -mhttp://www.tldp.org/LDP/ab..
  
  
  在不安定的网络上下载一个有些下载的文书,以及在悠闲时段下载
  wget -t 0 -w 31 -chttp://dsec.pku.edu.cn/BBC.. -o down.log &
  # 可能从filelist读入要下载的文件列表
  wget -t 0 -w 31 -c -Bftp://dsec.pku.edu.cn/linu.. -i filelist.txt -o down.log &
  
  上边的代码还足以用来在网络相比较空闲的时光进行下载。我的用法是:在mozilla中将不便于当时下载的URL链接拷贝到内存中然后粘贴到文件filelist.txt中,在晚间要出来系统前履行上面代码的第二条。
  
  使用代理下载
  wget -Y on -p -khttps://sourceforge.net/pr..
  
  代理可以在环境变量或wgetrc文件中设定
  # 在环境变量中设定代理
  export PROXY=
  # 在~/.wgetrc中设定代理
  http_proxy =http://proxy.yoyodyne.com:..
  ftp_proxy =http://proxy.yoyodyne.com:..
  
  wget各个选项分类列表
  启动
  -V, –version 突显wget的版本后脱离
  -h, –help 打印语法扶助
  -b, –background 启动后转入后台执行
  -e, –execute=COMMAND 执行`.wgetrc”格式的通令,wgetrc格式参见/etc/wgetrc或~/.wgetrc
  
  记录和输入文件
  -o, –output-file=FILE 把记录写到FILE文件中
  -a, –append-output=FILE 把记录追加到FILE文件中
  -d, –debug 打印调试输出
  -q, –quiet 安静形式(没有出口)
  -v, –verbose 冗长方式(那是缺省设置)
  -nv, –non-verbose 关掉冗长情势,但不是平静形式
  -i, –input-file=FILE 下载在FILE文件中冒出的URLs
  -F, –force-html 把输入文件作为HTML格式文件相比较
  -B, –base=URL 将URL作为在-F -i参数指定的文书中冒出的争论链接的前缀
  –sslcertfile=FILE 可选客户端证书
  –sslcertkey=KEYFILE 可选客户端证书的KEYFILE
  –egd-file=FILE 指定EGD socket的公文名
  
  下载
  –bind-address=ADDRESS 指定地点利用地方(主机名或IP,当本地有多个IP或名字时采纳)
  -t, –tries=NUMBER 设定最大尝试链接次数(0 表示无界定).
  -O –output-document=FILE 把文档写到FILE文件中
  -nc, –no-clobber 不要覆盖存在的文本或使用.#前缀
  -c, –continue 接着下载没下载完的文书
  –progress=TYPE 设定进程条标记
  -N, –timestamping 不要再度下载文件除非比本地文件新
  -S, –server-response 打印服务器的答应
  –spider 不下载任陈峰西
  -T, –timeout=SECONDS 设定响应超时的秒数
  -w, –wait=SECONDS 两回尝试之间间隔SECONDS秒
  –waitretry=SECONDS 在再一次链接之间等待1…SECONDS秒
  –random-wait 在下载之间等待0…2*WAIT秒
  -Y, –proxy=on/off 打开或关闭代理
  -Q, –quota=NUMBER 设置下载的容量限制
  –limit-rate=RATE 限定下载输率
  
  目录
  -nd –no-directories 不成立目录
  -x, –force-directories 强制创设目录
  -nH, –no-host-directories 不创建主机目录
  -P, –directory-prefix=PREFIX 将文件保留到目录 PREFIX/…
  –cut-dirs=NUMBER 忽略 NUMBER层远程目录
  
  HTTP 选项
  –http-user=USER 设定HTTP用户名为 USER.
  –http-passwd=PASS 设定http密码为 PASS.
  -C, –cache=on/off 允许/不允许服务器端的数码缓存 (一般情状下同意).
  -E, –html-extension 将兼具text/html文档以.html扩大名保存
  –ignore-length 忽略 `Content-Length”头域
  –header=STRING 在headers中插入字符串 STRING
  –proxy-user=USER 设定代理的用户名为 USER
  –proxy-passwd=PASS 设定代理的密码为 PASS
  –referer=URL 在HTTP请求中富含 `Referer: URL”头
  -s, –save-headers 保存HTTP头到文件
  -U, –user-agent=AGENT 设定代理的称谓为 AGENT而不是 Wget/VERSION.
  –no-http-keep-alive 关闭 HTTP活动链接 (永远链接).
  –cookies=off 不使用 cookies.
  –load-cookies=FILE 在起首会话前从文件 FILE中加载cookie
  –save-cookies=FILE 在对话截至后将 cookies保存到 FILE文件中
  
  FTP 选项
  -nr, –dont-remove-listing 不移走 `.listing”文件
  -g, –glob=on/off 打开或关闭文件名的 globbing机制
  –passive-ftp 使用被动传输形式 (缺省值).
  –active-ftp 使用主动传输格局
  –retr-symlinks 在递归的时候,将链接指向文件(而不是目录)
  
  递归下载
  -r, –recursive 递归下载--慎用!
  -l, –level=NUMBER 最大递归深度 (inf 或 0 代表无穷).
  –delete-after 在当今甘休后有的删除文件
  -k, –convert-links 转换非相对链接为相对链接
  -K, –backup-converted 在更换文件X从前,将之备份为 X.orig
  -m, –mirror 等价于 -r -N -l inf -nr.
  -p, –page-requisites 下载突显HTML文件的有着图片
  
  递归下载中的包括和不分包(accept/reject)
  -A, –accept=LIST 分号分隔的被接受伸张名的列表
  -R, –reject=LIST 分号分隔的不被接受的伸张名的列表
  -D, –domains=LIST 分号分隔的被接受域的列表
  –exclude-domains=LIST 分号分隔的不被接受的域的列表
  –follow-ftp 跟踪HTML文档中的FTP链接
  –follow-tags=LIST 分号分隔的被盯梢的HTML标签的列表
  -G, –ignore-tags=LIST 分号分隔的被忽视的HTML标签的列表
  -H, –span-hosts 当递归时转到外部主机
  -L, –relative 仅仅跟踪相对链接
  -I, –include-directories=LIST 允许目录的列表
  -X, –exclude-directories=LIST 不被含有目录的列表
  -np, –no-parent 不要追溯到父目录
  
  问题
  在递归下载的时候,遇到目录中有普通话的时候,wget创造的本土目录名会用URL编码规则处理。如”天网防火墙”会被存为”%CC%EC%CD%F8%B7%C0%BB%F0%C7%BD”,那致使阅读上的宏大不便民。

     –http-user=USER设置HTTP用户
  –http-passwd=PASS设置HTTP密码
  –proxy-user=USER设置代理用户
  –proxy-passwd=PASS设置代理密码

wget -np -m -l5
//不下载本站所链接的任何站点内容,5级目录结构
3、下载参数

 

     -r,–recursive 下载整个网站、目录(小心使用)
  -l,–level=NUMBER 下载层次

下载参数定义下载重复次数、保存文件名等;

     -A,–accept=LIST 可以接受的文件类型
  -R,–reject=LIST拒绝接受的文件类型
  -D,–domains=LIST可以接受的域名
  –exclude-domains=LIST拒绝的域名
  -L,–relative 下载关联链接
  –follow-ftp 只下载FTP链接
  -H,–span-hosts 可以下载外面的主机
  -I,–include-directories=LIST允许的目录
  -X,–exclude-directories=LIST 拒绝的目录

-t,–tries=NUMBER 是不是下载次数(0意味无穷次)
-O –output-document=FILE下载文件保留为其余文件名
-nc, –no-clobber 不要覆盖已经存在的文件
-N,–timestamping只下载比地点新的公文
-T,–timeout=SECONDS 设置超时时间
-Y,–proxy=on/off 关闭代理

wget是Linux下的一个很有用的一个下载网上资源的通令。

例:下载192.168.1.168的首页并将下载进程中的的输入音讯保存到test.htm文件中
wget -o test.htm

wget的选取形式是:
wget [参数列表] URL
第一来介绍一下wget的首要参数:
· -b:让wget在后台运行,记录文件写在当前目录下”wget-log”文件中;
· -t [nuber of
times]:尝试次数,当wget无法与服务器建立连接时,尝试连接多少次
。比如”-t
120″表示尝试120次。当这一项为”0″的时候,指定尝试无穷多次截至连接成功甘休,这个设置尤其有用,当对方服务器突然关机或许互连网突然中止的时候,能够在復苏正常后持续
下载没有传完的文件;

4、目录参数

·
-c:断点续传,那也是个很是有效的装置,尤其当下载比较大的文件的时候,假诺中
途意外中断,那么连接复苏的时候会从上次没传完的地点接着传,而不是又从头开端,使
用这一项需求长途服务器也支撑断点续传,一般来讲,基于UNIX/Linux的Web/FTP服务器
都协理断点续传;
· -T [number of
seconds]:超时时间,指定多久远程服务器没有响应就暂停连接
,开始下两次尝试。比如”-T
120″表示只要120秒将来远程服务器并未发过来数据,就重新尝试连接。假如互连网速度相比较快,这些小时可以安装的短些,相反,可以安装的长一些,一般最多不当先900,常常也不少于60,一般设置在120左右比较适中;
· -w [number of seconds]:在三次尝试之间等待多少秒,比如”-w
100″表示两回尝试 之间等待100秒;
· -Y on/off:通过/不经过代理服务器举行延续;
· -Q
[byetes]:限制下载文件的总大小最多不可以超越多少,比如”-Q2k”表示不只怕领先2K
字节,”-Q3m”表示最多不能跨越3M字节,倘诺数字背后什么都不加,就代表是以字节为单
位,比如”-Q200″表示最多不可能跨越200字节;
·
-nd:不下载目录结构,把从服务器所有指定目录下载的文件都堆到当前目录里;
· -x:与”-nd”设置刚好相反,创造完整的目录结构,例如”wget -nd

实际的目录结构一级顶尖建下去,直到所有的文件都传完甘休;
·
-nH:不创立以目标主机域名为目录名的目录,将对象主机的目录结构向来下到当前目
录下;
· –http-user=username
·
–http-passwd=password:如果Web服务器必要指定用户名和口令,用那两项来设定;
· –proxy-user=username
·
–proxy-passwd=password:假如代理服务器需求输入用户名和口令,使用那多个选项

· -r:在本机建立服务器端目录结构;
· -l [depth]:下载远程服务器目录结构的深浅,例如”-l
5″下载目录深度小于或然等 于5以内的目录结构依旧文件;
·
-m:做站点镜像时的选项,倘若你想做一个站点的镜像,使用那么些选项,它将自动设
定其余适当的选项以便于站点镜像;
·
-np:只下载目的站点指定目录及其子目录的情节。那也是一个尤其实用的选项,大家假如某个人的个人主页里面有一个针对那一个站点其余人个人主页的接连,而我辈只想下载
这厮的个人主页,倘使不安装这几个选项,甚至–有大概把任何站点给抓下来,那明确是
我们司空见惯不愿意的;

目录参数主要安装下载文件保留目录与原本文件(服务器文件)的目录对应提到;

ü 怎样设定wget所利用的代理服务器
wget
可以利用用户安装文件”.wgetrc”来读取很多设置,我们那边最主要采纳这么些文件来是
安装代理服务器。使用者用哪些用户登录,那么什么样用户主目录下的”.wgetrc”文件就起
成效。例如,”root”用户一旦想采纳”.wgetrc”来安装代理服务器,”/root/.wgert”就起
成效,下面给出一个”.wge
trc”文件的内容,读者可以参照那个例子来编排自身的”wgetrc”文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
那两行的含义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
HTTP协议所采纳的代理服务器,第二行指定FTP协议所运用的代理服务器。

-nd –no-directories 不创设目录
-x,–force-directories 强制建立目录
或许现在大家对那里的目录还不是很了解,大家来看一个比方

澳门金沙国际 8

例:下载192.168.1.168的首页,并且保持网站协会
wget -x

5、HTTP参数

HTTP参数设置一些与HTTP下载有关的习性;

–http-user=USER设置HTTP用户
–http-passwd=PASS设置HTTP密码
–proxy-user=USER设置代理用户
–proxy-passwd=PASS设置代理密码

如上参数首要安装HTTP和代理的用户、密码;

6、递归参数设置

在下载一个网站仍然网站的一个索引的时候,大家须要领悟的下载的层系,这么些参数就可以设置;
-r,–recursive 下载整个网站、目录(小心使用)
-l,–level=NUMBER 下载层次

例:下载整个网站
wget -r

7、递归允许与拒绝选项参数

下载一个网站的时候,为了尽大概快,有些公文可以挑选下载,比如图片和声音,在那里可以设置;

-A,–accept=LIST 能够承受的文件类型
-R,–reject=LIST拒绝接受的文件类型
-D,–domains=LIST可以承受的域名
–exclude-domains=LIST拒绝的域名
-L,–relative 下载关联链接
–follow-ftp 只下载FTP链接
-H,–span-hosts 可以下载外面的主机
-I,–include-directories=LIST允许的目录
-X,–exclude-directories=LIST 拒绝的目录

怎样设定wget所使用的代理服务器
wget可以行使用户设置文件”.wgetrc”来读取很多设置,我们那里关键采纳那个文件来是
设置代理服务器。使用者用什么用户登录,那么哪些用户主目录下的”.wgetrc”文件就起
效率。例如,”root”用户一旦想行使”.wgetrc”来安装代理服务器,”/root/.wgetrc”就起
成效,下边给出一个”.wgetrc”文件的始末,读者可以参考这些例子来编排自身的”wgetrc”文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
这两行的意义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
HTTP协议所采纳的代理服务器,第二行指定FTP协议所使用的代理服务器。

 

WGet使用指南
wget是一个从互联网上自行下载文件的自由工具。它扶助HTTP,HTTPS和FTP协议,可以应用HTTP代理.

所谓的自行下载是指,wget可以在用户退出系统的之后在后台执行。那象征那你可以登录系统,启动一个wget下载义务,然后退出系统,wget将在后台执行直到任务成功,相对于任何大多数浏览器在下载大批量数额时索要用户平素的参预,那省去了极大的费力。

wget
可以跟踪HTML页面上的链接依次下载来成立远程服务器的地面版本,完全重建原始站点的目录结构。那又常被称作”递归下载”。在递归下载的时候,wget
遵守罗布ot Exclusion标准(/robots.txt).
wget可以在下载的还要,将链接转换成指向本地文件,以造福离线浏览。

wget
分外稳定,它在带宽很窄的场馆下和不安静互联网中有很强的适应性.如若是由于互联网的原故下载战败,wget会四处的尝尝,直到整个文件下载达成。尽管是服
务器打断下载进度,它会再度联到服务器上从停止的位置持续下载。那对从那一个限定了链接时间的服务器上下载大文件丰富有效。

wget的大面积用法
wget的使用格式

Usage: wget [OPTION]… [URL]…用wget做站点镜像:
wget -r -p -np -k
# 或者
wget -m

wget -t 0 -w 31 -c -o down.log &
# 大概从filelist读入要下载的文件列表
wget -t 0 -w 31 -c -B ftp://dsec.pku.edu.cn/linuxsoft – i filelist.txt
-o down.log
&上边的代码还足以用来在互连网相比空闲的时刻开展下载。我的用法是:在mozilla中将不便于当时下载的URL链接拷贝到内存中然后粘贴到文件filelist.txt中,在晚间要出来系统前履行上面代码的第二条。

使用代理下载
wget -Y on -p -k

# 在环境变量中设定代理
export PROXY=
# 在~/.wgetrc中设定代理
http_proxy =
ftp_proxy =
启动
-V, –version 展现wget的版本后脱离
-h, –help 打印语法辅助
-b, –background 启动后转入后台执行
-e, –execute=COMMAND
执行`.wgetrc’格式的一声令下,wgetrc格式参见/etc/wgetrc或~/.wgetrc记录和输入文件
-o, –output-file=FILE 把记录写到FILE文件中
-a, –append-output=FILE 把记录追加到FILE文件中
-d, –debug 打印调试输出
-q, –quiet 安静格局(没有出口)
-v, –verbose 冗长格局(那是缺省设置)
-nv, –non-verbose 关掉冗长情势,但不是心和气平格局
-i, –input-file=FILE 下载在FILE文件中冒出的URLs
-F, –force-html 把输入文件作为HTML格式文件比较
-B, –base=URL 将URL作为在-F -i参数指定的公文中冒出的周旋链接的前缀
–sslcertfile=FILE 可选客户端证书
–sslcertkey=KEYFILE 可选客户端证书的KEYFILE
–egd-file=FILE 指定EGD socket的文书名下载
–bind-address=ADDRESS
指定地方使用地方(主机名或IP,当本地有三个IP或名字时利用)
-t, –tries=NUMBER 设定最大尝试链接次数(0 表示无界定).
-O –output-document=FILE 把文档写到FILE文件中
-nc, –no-clobber 不要覆盖存在的文件或使用.#前缀
-c, –continue 接着下载没下载完的公文
–progress=TYPE 设定进度条标记
-N, –timestamping 不要再度下载文件除非比地点文件新
-S, –server-response 打印服务器的回应
–spider 不下载任何事物
-T, –timeout=SECONDS 设定响应超时的秒数
-w, –wait=SECONDS 三遍尝试之间间隔SECONDS秒
–waitretry=SECONDS 在再次链接之间等待1…SECONDS秒
–random-wait 在下载之间等待0…2*WAIT秒
-Y, –proxy=on/off 打开或关闭代理
-Q, –quota=NUMBER 设置下载的容量限制
–limit-rate=RATE 限定下载输率目录
-nd –no-directories 不成立目录
-x, –force-directories 强制创造目录
-nH, –no-host-directories 不创制主机目录
-P, –directory-prefix=PREFIX 将文件保留到目录 PREFIX/…
–cut-dirs=NUMBER 忽略 NUMBER层远程目录HTTP 选项
–http-user=USER 设定HTTP用户名为 USER.
–http-passwd=PASS 设定http密码为 PASS.
-C, –cache=on/off 允许/不容许服务器端的数目缓存 (一般景色下同意).
-E, –html-extension 将具有text/html文档以.html增添名保存
–ignore-length 忽略 `Content-Length’头域
–header=STRING 在headers中插入字符串 STRING
–proxy-user=USER 设定代理的用户名为 USER
–proxy-passwd=PASS 设定代理的密码为 PASS
–referer=URL 在HTTP请求中涵盖 `Referer: URL’头
-s, –save-headers 保存HTTP头到文件
-U, –user-agent=AGENT 设定代理的称谓为 AGENT而不是 Wget/VERSION.
–no-http-keep-alive 关闭 HTTP活动链接 (永远链接).
–cookies=off 不使用 cookies.
–load-cookies=FILE 在始发会话前从文件 FILE中加载cookie
–save-cookies=FILE 在对话截止后将 cookies保存到 FILE文件中FTP 选项
-nr, –dont-remove-listing 不移走 `.listing’文件
-g, –glob=on/off 打开或关闭文件名的 globbing机制
–passive-ftp 使用被动传输格局 (缺省值).
–active-ftp 使用主动传输格局
–retr-symlinks 在递归的时候,将链接指向文件(而不是目录)递归下载
-r, –recursive 递归下载--慎用!
-l, –level=NUMBER 最大递归深度 (inf 或 0 代表无穷).
–delete-after 在现行截至后有些删除文件
-k, –convert-links 转换非绝对链接为相对链接
-K, –backup-converted 在转换文件X此前,将之备份为 X.orig
-m, –mirror 等价于 -r -N -l inf -nr.
-p, –page-requisites
下载突显HTML文件的有所图片递归下载中的包括和不带有(accept/reject)
-A, –accept=LIST 分号分隔的被接受增加名的列表
-R, –reject=LIST 分号分隔的不被接受的扩充名的列表
-D, –domains=LIST 分号分隔的被接受域的列表
–exclude-domains=LIST 分号分隔的不被接受的域的列表
–follow-ftp 跟踪HTML文档中的FTP链接
–follow-tags=LIST 分号分隔的被盯梢的HTML标签的列表
-G, –ignore-tags=LIST 分号分隔的被忽视的HTML标签的列表
-H, –span-hosts 当递归时转到外部主机
-L, –relative 仅仅跟踪相对链接
-I, –include-directories=LIST 允许目录的列表
-X, –exclude-directories=LIST 不被含有目录的列表
-np, –no-parent 不要追溯到父目录

Wget使用技巧

wget的采取形式是:
wget [参数列表] URL
率先来介绍一下wget的主要参数:
· -b:让wget在后台运行,记录文件写在当前目录下”wget-log”文件中;
· -t [nuber of
times]:尝试次数,当wget无法与服务器建立连接时,尝试连接多少次
。比如”-t
120″表示尝试120次。当这一项为”0″的时候,指定尝试无穷很多次直至连接成功截至,那一个
设置尤其有用,当对方服务器突然关机只怕互联网突然暂停的时候,可以在恢复生机正常后持续
下载没有传完的文本;
·
-c:断点续传,这也是个要命实用的设置,尤其当下载比较大的文本的时候,倘诺中
途意外中断,那么连接复苏的时候会从上次没传完的地点接着传,而不是又从头早先,使
用这一项须求长途服务器也协理断点续传,一般来讲,基于UNIX/Linux的Web/FTP服务器
都协理断点续传;
· -T [number of
seconds]:超时时间,指定多久远程服务器没有响应就因噎废食连接
,初阶下五遍尝试。比如”-T
120″表示要是120秒未来远程服务器并未发过来数据,就重新尝试连接。借使互联网速度比
较快,那些时刻可以安装的短些,相反,可以设置的长一些,一般最多不超越900,寻常
也不少于60,一般设置在120左右相比较确切;
· -w [number of seconds]:在两遍尝试之间等待多少秒,比如”-w
100″表示两遍尝试
以内等待100秒;
· -Y on/off:通过/不经过代理服务器举办连接;
· -Q
[byetes]:限制下载文件的总大小最多不只怕超越多少,比如”-Q2k”表示无法领先2K
字节,”-Q3m”表示最多不或许跨越3M字节,借使数字背后什么都不加,就象征是以字节为单
位,比如”-Q200″表示最多不大概领先200字节;
·
-nd:不下载目录结构,把从服务器所有指定目录下载的文书都堆到当前目录里;
· -x:与”-nd”设置刚好相反,成立完整的目录结构,例如”wget -nd

实际上的目录结构超级一流建下去,直到所有的文书都传完截至;
·
-nH:不创建以目标主机域名为目录名的目录,将对象主机的目录结构一贯下到当前目
录下;
· –http-user=username
·
–http-passwd=password:如若Web服务器须求指定用户名和口令,用那两项来设定;
· –proxy-user=username
·
–proxy-passwd=password:如果代理服务器须要输入用户名和口令,使用那八个挑选

· -r:在本机建立劳动器端目录结构;
· -l [depth]:下载远程服务器目录结构的吃水,例如”-l
5″下载目录深度小于大概等
于5以内的目录结构如故文件;
·
-m:做站点镜像时的选项,如若您想做一个站点的镜像,使用这些选项,它将机关设
定其余适当的选项以便于站点镜像;
·
-np:只下载目标站点指定目录及其子目录的情节。那也是一个至极实惠的选项,大家
假定某个人的个人主页里面有一个针对性这一个站点其余人个人主页的延续,而大家只想下载
其一人的个人主页,假诺不安装那些选项,甚至–有或然把整个站点给抓下来,那明明是
我们平日不希望的;
ü 怎么样设定wget所采纳的代理服务器
wget可以利用用户安装文件”.wgetrc”来读取很多安装,我们那边最主要运用那一个文件来是
安装代理服务器。使用者用什么样用户登录,那么什么样用户主目录下的”.wgetrc”文件就起
效益。例如,”root”用户只要想采纳”.wgetrc”来设置代理服务器,”/root/.wgert”就起
成效,上面给出一个”.wge
trc”文件的剧情,读者可以参考这么些例子来编排本身的”wgetrc”文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
那两行的含义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
HTTP协议所接纳的代理服务器,第二行指定FTP协议所采取的代理服务器。

 

wget 使用实例:
wget是一个命令行工具,用于批量下载文件,帮衬HTTP和FTP。毕竟比此外的工具好在哪儿?看看内容吧
🙂

wget基本上所有的Linux版本都自个儿带了,可是有稍许人在用呢?呵呵,即使您未曾用过,不妨试试。Windows上边的用户可以动用GNUwin32的品类,wget,基本成效完全一致。好啊,大家来以多少个简易的例子看看wget的威力。

比方大家想下载ftp里面某个目录里面的有着文件,大家也可以不用ftp这么些笨蛋,呵呵,可以分享cute
ftp等图形化工具的拖一个索引的落拓不羁了。如

wget -r ftp://10.8.8.8/movie/

呵呵,等啊!下完了,发觉有些有有失水准态,怎么出来个10.8.8.8的目录,进去看看,又是一个movie,哦,wget将引得结构和网站标题都给记录下来了,不要??小难点!比如说仍旧那个事例

wget -r -nd ftp://10.8.8.8/movie/

结果如何目录都尚未了,faint!怎么会那样?呵呵,你假使想要那样就让它这样呢,否则使用

wget -r -nH ftp://10.8.8.8/movie/

恩?movie也无须?OK,那就这么

wget -r -nH –cut-dirs=1 ftp://10.8.8.8/movie/

那有啥样用啊?cuteftp比他好用多了,而且,你那断了线能连吗?呵呵,不好意思,可以连

wget -c -r -nH –cut-dirs=1 ftp://10.8.8.8/movie/

可是cuteftp能做下边的事务吗?比如,现在游人如织网站使用Apache建站,并不提供ftp服务,但是Apache有一个indexing效能,可以提
供一个像样于ftp的界面,好多文件我想下啊,咋办?由于是HTTP协议,CuteFTP无能为力了,倒是flash
get等有哪些get all那种作用,不知晓她们对此目录处理怎样。但是wget一点题材都没有,不信?大家拿CTAN为例(例子并不对劲,CTAN有FTP服务),大家下载那里面
所有的宏包,呵呵

wget -r -k

-k代表将延续转换为本地连接。可是现在同一有下边的题材呀,那就把您需求的充足吧,其它可能你平素不需求向下走那么多层,比如,我们即将到第二层,那么

wget -r -l2 -k

现行新的难点是,由于网页有一个排序成效,很讨厌,因为下载的时候把网页重复了累累次,那么大家可拔取-A和-R开关控制下载类型,并且可以行使通配符,呵呵,现在任意了吧

wget -r -R ‘*.htm*\?*’ -k

这一次没有那种网页了吧?-R的意思在于拒绝下载匹配类型的公文,-A代表无非接受的文件类型,如-A
‘*.gif’将仅下载gif图片,假诺有多个允许或然不允许,可以选取,分开。


么,大家后日在运用代理服务器,怎么做呢?呵呵,很欢跃你选用了wget,你可以行使它的配备文件,环境变量来行使代理。这里推荐应用环境变量,如在
bash里面大家可以把随时用的proxy加到.bash_profile里面,那是Linux标准写法(很多软件都用的,什么apt-get,yum
等等)

export http_proxy=

接下来,proxy就默许打开了,即使急需暂时关闭,能够使用

wget –proxy=off -r -k

自然,写一个.wgetrc文件也足以,该文件可以从/usr/local/etc里面找到,里面有很详细的注释,我就不多说了。

下载网页的时候可比费心的事体是,有的网页被同时针对了很多遍,那么为了防止频仍下载,我们运用

wget -nc -r -k

可以防止那件业务。为了不被有些连年指向非

wget -nc -np -r -k

幸免下载非该目录里面的文书,那也防止了到区其他host下边去。当然,倘使你愿意有其一职能,在三个host之间跳来跳去的下载,可以使用

wget -nc -np -H -r -k

使得可以在五个host之间span,同时-I和-X可以使得大家唯有跟踪某些目录只怕不跟踪某些目录。若是某些HTML里面你必要的东西不是由那种事物作出来的,你就得利用–follow-tags和–ignore-tags了。

啊,我有个公文之中都是连连,怎么做?如若不是html你只必要

wget -i your.file

若果是,那也不繁

wget -F -i your.file

 

wget 使用指南
wget是一个从网络上自行下载文件的轻易工具。它帮助HTTP,HTTPS和FTP协议,可以行使HTTP代理.

所谓的机动下载是指,wget可以在用户退出系统的之后在后台执行。那象征那你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在后台执行直到义务到位,相对于任何半数以上浏览器在下载大量数额时索要用户一向的参预,那省去了极大的辛勤。

wget
可以跟踪HTML页面上的链接依次下载来创立远程服务器的地头版本,完全重建原始站点的目录结构。这又常被称作”递归下载”。在递归下载的时候,wget
遵从罗布ot Exclusion标准(/robots.txt).
wget可以在下载的还要,将链接转换成指向本地文件,以福利离线浏览。

wget
相当平静,它在带宽很窄的情事下和不安宁网络中有很强的适应性.假设是出于网络的原由下载战败,wget会四处的品尝,直到一切文件下载落成。倘诺是服务
器打断下载进度,它会再次联到服务器上从甘休的地方持续下载。那对从那一个限定了链接时间的服务器上下载大文件越发管用。

wget的广阔用法
wget的施用格式

Usage: wget [OPTION]… [URL]…

用wget做站点镜像:
wget -r -p -np -k

  • r
    代表递归下载,会下载所有的链接,然而要留心的是,不要单独行使这么些参数,因为如若您要下载的网站也有其他网站的链接,wget也会把其余网站的东西
    下载下来,所以要加上 -np这几个参数,表示不下载其余站点的链接.
    -k代表将下载的网页里的链接修改为地方链接.-p得到所有显示网页所需的要素,比
    如图片什么的.

# 或者
wget -m

在不平静的网络上下载一个片段下载的公文,以及在空闲时段下载
wget -t 0 -w 31 -c -o down.log &
# 可能从filelist读入要下载的文本列表
wget -t 0 -w 31 -c -B ftp://dsec.pku.edu.cn/linuxsoft -i filelist.txt -o
down.log &

上边的代码仍能用来在网络比较空闲的时段开展下载。我的用法是:在mozilla大校不便利当时下载的URL链接拷贝到内存中然后粘贴到文件filelist.txt中,在清晨要出来系统前执行下面代码的第二条。

行使代理下载
wget -Y on -p -k

代理能够在环境变量或wgetrc文件中设定
# 在环境变量中设定代理
export PROXY=
# 在~/.wgetrc中设定代理
http_proxy =
ftp_proxy =

wget各个选项分类列表
启动
-V, –version 显示wget的版本后脱离
-h, –help 打印语法帮忙
-b, –background 启动后转入后台执行
-e, –execute=COMMAND
执行`.wgetrc’格式的吩咐,wgetrc格式参见/etc/wgetrc或~/.wgetrc

笔录和输入文件
-o, –output-file=FILE 把记录写到FILE文件中
-a, –append-output=FILE 把记录追加到FILE文件中
-d, –debug 打印调试输出
-q, –quiet 安静情势(没有出口)
-v, –verbose 冗长格局(那是缺省设置)
-nv, –non-verbose 关掉冗长情势,但不是宁静形式
-i, –input-file=FILE 下载在FILE文件中出现的URLs
-F, –force-html 把输入文件作为HTML格式文件相比
-B, –base=URL 将URL作为在-F -i参数指定的文书中冒出的相对链接的前缀
–sslcertfile=FILE 可选客户端证书
–sslcertkey=KEYFILE 可选客户端证书的KEYFILE
–egd-file=FILE 指定EGD socket的公文名

下载
–bind-address=ADDRESS
指定位置利用地方(主机名或IP,当本地有多少个IP或名字时行使)
-t, –tries=NUMBER 设定最大尝试链接次数(0 代表无界定).
-O –output-document=FILE 把文档写到FILE文件中
-nc, –no-clobber 不要覆盖存在的文书或使用.#前缀
-c, –continue 接着下载没下载完的文件
–progress=TYPE 设定进程条标记
-N, –timestamping 不要再度下载文件除非比当地文件新
-S, –server-response 打印服务器的答复
–spider 不下载任刘亚辉西
-T, –timeout=SECONDS 设定响应超时的秒数
-w, –wait=SECONDS 两回尝试之间间隔SECONDS秒
–waitretry=SECONDS 在再一次链接之间等待1…SECONDS秒
–random-wait 在下载之间等待0…2*WAIT秒
-Y, –proxy=on/off 打开或关闭代理
-Q, –quota=NUMBER 设置下载的容量限制
–limit-rate=RATE 限定下载输率

目录
-nd –no-directories 不创建目录
-x, –force-directories 强制成立目录
-nH, –no-host-directories 不创立主机目录
-P, –directory-prefix=PREFIX 将文件保留到目录 PREFIX/…
–cut-dirs=NUMBER 忽略 NUMBER层远程目录

HTTP 选项
–http-user=USER 设定HTTP用户名为 USER.
–http-passwd=PASS 设定http密码为 PASS.
-C, –cache=on/off 允许/不容许服务器端的数额缓存 (一般意况下同意).
-E, –html-extension 将持有text/html文档以.html扩张名保存
–ignore-length 忽略 `Content-Length’头域
–header=STRING 在headers中插入字符串 STRING
–proxy-user=USER 设定代理的用户名为 USER
–proxy-passwd=PASS 设定代理的密码为 PASS
–referer=URL 在HTTP请求中带有 `Referer: URL’头
-s, –save-headers 保存HTTP头到文件
-U, –user-agent=AGENT 设定代理的名目为 AGENT而不是 Wget/VERSION.
–no-http-keep-alive 关闭 HTTP活动链接 (永远链接).
–cookies=off 不使用 cookies.
–load-cookies=FILE 在起来会话前从文件 FILE中加载cookie
–save-cookies=FILE 在对话为止后将 cookies保存到 FILE文件中

FTP 选项
-nr, –dont-remove-listing 不移走 `.listing’文件
-g, –glob=on/off 打开或关闭文件名的 globbing机制
–passive-ftp 使用被动传输情势 (缺省值).
–active-ftp 使用主动传输形式
–retr-symlinks 在递归的时候,将链接指向文件(而不是目录)

递归下载
-r, –recursive 递归下载--慎用!
-l, –level=NUMBER 最大递归深度 (inf 或 0 代表无穷).
–delete-after 在现在终止后局地删除文件
-k, –convert-links 转换非绝对链接为相对链接
-K, –backup-converted 在更换文件X以前,将之备份为 X.orig
-m, –mirror 等价于 -r -N -l inf -nr.
-p, –page-requisites 下载呈现HTML文件的装有图片

递归下载中的包含和不蕴含(accept/reject)
-A, –accept=LIST 分号分隔的被接受增加名的列表
-R, –reject=LIST 分号分隔的不被接受的增加名的列表
-D, –domains=LIST 分号分隔的被接受域的列表
–exclude-domains=LIST 分号分隔的不被接受的域的列表
–follow-ftp 跟踪HTML文档中的FTP链接
–follow-tags=LIST 分号分隔的被盯梢的HTML标签的列表
-G, –ignore-tags=LIST 分号分隔的被忽视的HTML标签的列表
-H, –span-hosts 当递归时转到外部主机
-L, –relative 仅仅跟踪绝对链接
-I, –include-directories=LIST 允许目录的列表
-X, –exclude-directories=LIST 不被含有目录的列表
-np, –no-parent 不要追溯到父目录

问题
在递归下载的时候,遭受目录中有普通话的时候,wget制造的本地目录名会用URL编码规则处理。如”天网防火墙”会被存为”%CC%EC%CD%F8%B7%C0%BB%F0%C7%BD”,那造成阅读上的高大不便宜。

澳门金沙国际 9

相关文章