Cum se configurează smartphone-uri și PC-uri. Portal informativ

Trimiteți informații despre browser. Chei de înregistrare și introducere a fișierelor

Cu toții descărcam uneori fișiere de pe Internet. Dacă utilizați programe cu interfata grafica, atunci totul se dovedește a fi extrem de simplu. Cu toate acestea, atunci când lucrați pe linia de comandă Linux, lucrurile devin oarecum mai complicate. Mai ales pentru cei care nu sunt familiarizați cu instrumentele adecvate. Unul dintre aceste instrumente este extrem de utilitate puternică wget, care este potrivit pentru a efectua toate tipurile de descărcări. Vă aducem în atenție douăsprezece exemple, analizând pe care le puteți stăpâni capacitățile de bază ale wget.

$ wget https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
După introducerea acestei comenzi, va începe descărcarea Nagios Core. În timpul acestui proces, veți putea vedea date despre descărcare, de exemplu - informații despre câte date au fost deja descărcate, viteza actuală și cât timp a mai rămas până la sfârșitul descărcării.

2. Descărcați fișierul și salvați-l cu un nume nou

Dacă dorim să salvăm fișierul descărcat sub un nume diferit de numele său original, vom avea nevoie de comanda wget cu parametrul -O:

$ wget -O nagios_latest https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
Cu această abordare, fișierul descărcat va fi salvat sub numele nagios_latest.

3. Limitarea vitezei de descărcare a fișierelor

Dacă este necesar, viteza de descărcare a fișierelor folosind wget poate fi limitată. Ca urmare, această operațiune nu va ocupa întreg canalul de date disponibil și nu va afecta alte procese asociate rețelei. Puteți face acest lucru utilizând opțiunea --limit-rate și specificând o limită de rată exprimată în octeți (ca număr obișnuit), kiloocteți (cu K după număr) sau megaocteți (M) pe secundă:

$ wget ––limit-rate=500K https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror =excellmedia
Limita de viteză de descărcare este setată aici la 500 Kb/s.

4. Finalizarea unei descărcări întrerupte

Dacă operațiunea a fost întreruptă în timpul descărcarii fișierelor, puteți relua descărcarea utilizând opțiunea -c a comenzii wget:

$ wget –c https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
Dacă acest parametru nu este utilizat, descărcarea fișierului descărcat incomplet va începe de la început.

Dacă încărcați un fișier dimensiune uriașăși doriți să efectuați această operație în fundal, puteți face acest lucru folosind parametrul -b:

$ wget –b https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Dacă aveți o listă de adrese URL pentru fișiere de descărcat, dar nu doriți să începeți manual descărcarea acestor fișiere, puteți utiliza opțiunea -I. Cu toate acestea, înainte de a începe descărcarea, trebuie să creați un fișier care să conțină toate adresele. De exemplu, puteți face acest lucru cu următoarea comandă:

$vi url.txt
Trebuie să plasați adrese în acest fișier - câte una pe fiecare linie. În continuare, tot ce rămâne este să rulați wget , trecând fișierul nou creat cu o listă de descărcări către acest utilitar:

$ wget –I url.txt
Executarea acestei comenzi va descărca toate fișierele din listă unul câte unul.

7. Măriți numărul total de încercări de descărcare a fișierelor

Pentru a configura numărul de încercări pentru a descărca un fișier, puteți utiliza opțiunea --tries:

Wget ––tries=100 https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Comanda pentru a descărca fișierul din server FTP anonim folosind wget arată astfel:

$ wget FTP-URL
Dacă sunt necesare un nume de utilizator și o parolă pentru a accesa fișierul, comanda va arăta astfel:

$ wget –-ftp-user=dan ––ftp-parola=********* FTP-URL

9. Creați o copie locală a site-ului web

Dacă trebuie să descărcați conținutul unui întreg site web, puteți face acest lucru folosind opțiunea --mirror:

$ wget --mirror -p --convert-links -P /home/dan xyz.com
fi atent la Opțiuni suplimentare Linie de comanda:

  • -p: descarcă toate fișierele necesare pentru afișare corectă Pagini HTML.
  • --convert-links: Linkurile din documente vor fi convertite în scopuri vizionare locală site-ul.
  • -P /home/dan: materialele vor fi salvate în folderul /home/dan.

10. Descărcați doar fișiere de un anumit tip de pe site

Pentru a descărca numai fișiere de pe site anumit tip, puteți folosi parametrii -r -A:

$ wget -r -A.txt Website_url

11. Omite fișiere de un anumit tip

Dacă doriți să copiați un întreg site web, dar nu aveți nevoie de un anumit tip de fișier, puteți dezactiva descărcarea folosind opțiunea --reject:

$ wget --reject=png Website_url

12. Încărcați folosind propriul fișier .log

Pentru a descărca un fișier și a utiliza propriul fișier .log, utilizați opțiunea -o și specificați numele fișierului jurnal:

$ wget -o wgetfile.log https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Rezultate

Wget este destul de ușor de utilizat, dar foarte utilitate utilă Linux. Și, de fapt, ceea ce am vorbit este doar o mică parte din ceea ce poate face ea. Sperăm că această recenzie îi va ajuta pe cei noi să aprecieze programul și, poate, să îl adauge la arsenalul lor zilnic de instrumente de linie de comandă.

Dragi cititori! Folosiți instrumente de linie de comandă? șiruri Linux pentru a descărca fișiere? Dacă da, vă rugăm să ne spuneți despre ele.

JavaScript este blocat în browserul dvs. Vă rugăm să activați JavaScript pentru ca site-ul să funcționeze!

WGet este un program pentru descărcarea fișierelor și
descărcarea întregului site.

Venind din lumea Linux, utilitarul distribuit gratuit Wget vă permite să descărcați ca fișiere separate de pe Internet și site-uri întregi, urmând link-uri de pe paginile web.

Pentru a obține ajutor cu parametrii WGet, tastați man wget pe Linux sau wget.exe --help pe Windows.

Să presupunem că vrem să creăm copie integrală site-ul www.site.com de pe disc. Pentru a face acest lucru, deschideți linia de comandă (Wget este un utilitar de consolă) și scrieți următoarea comandă:

Wget.exe -r -l10 -k -p -E -nc http://www.site.com WGET va parcurge recursiv (parametrul -r) directoare și subdirectoare de pe serverul la distanță, inclusiv stiluri CSS (-k) cu maximum adâncimea recursiunii egală cu zece (-l), apoi înlocuiți linkurile absolute din documentele HTML descărcate cu unele relative (-k) și extensiile cu html(-E) pentru vizualizarea locală ulterioară a site-ului descărcat. Când descărcați din nou, nu vor exista fețe și reluările (-nc) vor fi suprascrise. Din păcate, stilurile interne și imaginile specificate în stiluri nu sunt descărcate

Dacă intenționați să descărcați orice director de pe site (cu toate subfolderele sale), atunci ar fi mai logic să includeți parametrul -np pe linia de comandă. Nu va permite utilitarului să urce în ierarhia directoarelor deasupra directorului specificat atunci când caută fișiere:

Wget.exe -r -l10 -k http://www.site.com -np

Wget.exe -r -l10 -k http://www.site.com -c

În mod implicit, tot ce este descărcat este salvat în directorul de lucru al utilitarului. Parametrul -P va ajuta la determinarea unei locații diferite pentru fișierele copiate:

Wget.exe -r -l10 -k http://www.site.com -P c:\internet\fișiere

În fine, dacă setari de retea Dacă rețeaua dumneavoastră necesită utilizarea unui server proxy, setările acestuia trebuie comunicate programului. Cm.

Wget -m -k -nv -np -p --user-agent="Mozilla/5.0 (compatibil; Konqueror/3.0.0/10; Linux)" SITE_ADDRESS

Wget -i FIȘIER

Descărcarea unui fișier în directorul specificat(-P):

Wget -P /path/for/save ftp://ftp.example.org/some_file.iso

Utilizarea numelui de utilizator și a parolei pe FTP/HTTP (opțiunea 1):

Wget ftp://login: [email protected]/some_file.iso

Utilizarea numelui de utilizator și a parolei pe FTP/HTTP (opțiunea 2):

Wget --user=login --password=parola ftp://ftp.example.org/some_file.iso

Descărcați la fundal(-b):

Wget -b ftp://ftp.example.org/some_file.iso

Continuați (-c continua) încărcarea unui fișier descărcat anterior incomplet:

Wget -c http://example.org/file.iso

Descărcați pagina cu o adâncime de 10, scriind jurnalul în fișierul jurnal:

Wget -r -l 10 http://example.org/ -o log

Descărcați conținutul directorului http://example.org/~luzer/my-archive/ și toate subdirectoarele acestuia, fără a merge mai sus în ierarhia directoarelor:

Wget -r --no-parent http://example.org/~luzer/my-archive/

Pentru a vă asigura că linkurile din toate paginile descărcate sunt convertite în cele relative pentru vizualizare locală, trebuie să utilizați comutatorul -k:

Wget -r -l 10 -k http://example.org/

Identificarea pe server este, de asemenea, acceptată:

Wget --save-cookies cookies.txt --post-data "user=foo&password=bar" http://example.org/auth.php

Copiați întregul site:

Wget -r -l0 -k http://example.org/

De exemplu, nu descărcați arhive zip:

Wget -r -R „*.zip” http://freeware.ru

Conectați-vă și descărcați fișierul cheie

@echo off wget --save-cookies cookies.txt --post-data "login=YOURLOGIN&password=YOUR PAROLA" http://beta.drweb.com/files/ -O- wget --load-cookies cookies.txt " http ://beta.drweb.com/files/?p=win%%2Fdrweb32-betatesting.key&t=f" -O drweb32-betatesting.key

Atenţie! Registrul parametrilor WGet este diferit!

Tastele de lansare de bază

-V
--versiune
Afișează versiunea Wget.

-h
--Ajutor
Afișează ajutor cu o descriere a tuturor comutatoarelor din linia de comandă Wget.

-b
--fundal
Intră în modul de fundal imediat după lansare. Dacă fișierul de ieșire nu este specificat -o, rezultatul este redirecționat către wget-log.

-e comanda
--execute comanda
Executați comanda ca și cum ar fi parte din . O comandă rulată în acest fel va fi executată după comenzile din .wgetrc, având prioritate asupra acestora. Pentru a lansa mai mult de o comandă wgetrc, utilizați mai multe comutatoare -e.

Chei de înregistrare și introducere a fișierelor

-o fișier jurnal
--output-file=fișier jurnal
Înregistrați toate mesajele într-un fișier jurnal. De obicei, mesajele sunt afișate ca eroare standard.

-un fișier jurnal
--append-output=fișier jurnal
Adăugați la fișierul jurnal. La fel ca -o, doar fișierul jurnal nu este suprascris, ci atașat. Dacă fișierul jurnal nu există, va fi creat un fișier nou.

-d
--depanare
Activează ieșirea informațiilor de depanare, de ex. diverse informatii, util pentru dezvoltatorii Wget în caz de operare incorectă. Este posibil ca administratorul de sistem să fi ales să construiască Wget fără suport pentru depanare, caz în care -d nu va funcționa. Amintiți-vă că o construcție activată pentru depanare este întotdeauna sigură - Wget nu va scoate informații de depanare decât dacă este solicitată în mod explicit prin -d.

-q
--Liniște
Dezactivează ieșirea Wget.

-v
--verbos
Include rezultate detaliate cu toate informațiile posibile. Setat implicit.

-nv
--non-verbos
Ieșire non-verboză - dezactivează verbozitatea, dar nu trece complet în tăcere (utilizați -q pentru aceasta), sunt afișate mesaje de eroare și informații de bază.

-i dosar
--input-file=fișier
Citiți adresa URL din fișierul de intrare, caz în care URL-ul nu trebuie să fie specificat pe linia de comandă. Dacă URL-urile sunt specificate pe linia de comandă și în fișierul de intrare, URL-urile din linia de comandă vor fi solicitate mai întâi. Fișierul nu trebuie (dar poate) să fie un document HTML - este suficientă o listă secvențială de adrese URL. Totuși, dacă este specificat --force-html, fișierul de intrare va fi considerat html. În acest caz, pot apărea probleme cu referințele relative, care pot fi rezolvate prin specificare în interiorul fișierului de intrare sau --base=url pe linia de comandă.

-F
--force-html
Când citiți o listă de adrese dintr-un fișier, setează formatul fișierului la HTML. Acest lucru vă permite să organizați descărcările folosind link-uri relative într-un fișier HTML local atunci când specificați în interiorul fișierului de intrare sau --base=url pe linia de comandă.

-B URL
--base=URL
Folosit împreună cu -F pentru a adăuga o adresă URL la începutul legăturilor relative din fișierul de intrare specificat de -i.

Descărcați cheile

--bind-address=ADRESA
Când deschideți conexiunile client TCP/IP, bind() pe ADRESA mașinii locale. ADDRESS poate fi specificată ca un nume de gazdă sau o adresă IP. Această cheie poate fi utilă dacă aparatului i se aloca mai multe adrese IP.

-t număr
--încearcă=număr
Setează numărul de încercări la număr. Setarea 0 sau inf corespunde număr infinitîncercări. Implicit la 20, cu excepția erori critice tastați „conexiune refuzată” sau „fișier nu a fost găsit” (404), în care încercările nu sunt reluate.

-O dosar
--output-document=fișier
Documentele nu sunt salvate în fișierele corespunzătoare, ci sunt concatenate într-un fișier numit fișier. Dacă fișierul există deja, acesta va fi suprascris. Dacă fișierul este dat -, documentele vor fi scrise la ieșirea standard (overriding -k). Rețineți că combinația cu -k este definită în mod normal doar pentru descărcarea unui singur document.

-nc
--no-clobber
Dacă un fișier este descărcat de mai multe ori în același director, atunci comportamentul lui Wget este determinat de mai multe comutatoare, inclusiv -nc. In unele cazuri fișier local va fi ștearsă sau suprascrisă atunci când este descărcat din nou, în altele va fi salvat.
Când rulați Wget fără -N, -nc sau -r, descărcarea aceluiași fișier în același director face ca copia originală a fișierului să fie păstrată, dar exemplar nou se scrie cu fisierul de nume.1. Dacă fișierul este descărcat din nou, a treia copie va fi numită fișier.2 etc. Dacă se specifică comutatorul -nc, acest comportament este suprimat și Wget va refuza să descarce noi copii ale fișierului. Astfel, „no-clobber” este o denumire greșită în acest mod- nu suprascrierea fișierelor este împiedicată (sufixele digitale au împiedicat deja suprascrierea), ci crearea de copii multiple.
Când rulați Wget cu comutatorul -r, dar fără -N sau -nc, re-descărcarea fișierului are ca rezultat suprascrierea celui vechi. Adăugarea -nc previne acest comportament prin păstrarea versiunilor originale ale fișierelor și ignorând orice versiuni noi de pe server.
Când rulați Wget cu comutatorul -N, cu sau fără -r, decizia de descărcare versiune noua fișierul depinde de marcajele de timp locale și de la distanță și de dimensiunea fișierului. -nc nu poate fi specificat cu -N.
Când este specificat -nc, fișierele cu extensii .html și .htm vor fi încărcate din disc localși procesate ca și cum ar fi fost descărcate de pe Internet.

-c
--continua
Continuați descărcarea unui fișier descărcat parțial. Acest lucru este util atunci când trebuie să finalizați o descărcare începută de un alt proces sau program Wget. De exemplu:

Wget -c ftp://site/ls-lR.Z

Dacă există un fișier ls-lR.Z în directorul curent, atunci Wget îl va considera prima parte fișier ștersși va cere serverului să continue descărcarea cu o indentare de la început egală cu lungimea fișierului local.

Nu este nevoie să specificați această cheie pentru a permite procesului Wget curent să continue descărcarea dacă pierde conexiunea la jumătate. Acesta este comportamentul original. -c afectează doar descărcările începute înainte de procesul Wget curent dacă fișierele locale există deja.

Fără -c, exemplul anterior va stoca fișierul șters în ls-lR.Z.1, ls-lR.Z rămânând neschimbat.

Începând cu Wget 1.7, atunci când se utilizează -c cu un fișier care nu este gol, Wget va refuza să pornească din nou descărcarea dacă serverul nu acceptă descărcarea, deoarece aceasta ar duce la pierderea datelor descărcate. Ștergeți fișierul dacă doriți să începeți din nou descărcarea.

De asemenea, din versiunea Wget 1.7, când se folosește -c pe un fișier lungime egală Wget va refuza să descarce fișierul pe server și va afișa un mesaj explicativ. Același lucru se întâmplă dacă fișierul de la distanță este mai mic decât cel local (poate că a fost schimbat pe server de la încercarea anterioară) - deoarece „continuare” în acest caz este lipsită de sens, descărcarea nu este efectuată.

Pe de altă parte, când se utilizează -c, fișierul local va fi considerat subdescărcat dacă lungimea fișierului la distanță este mai mare decât lungimea celui local. În acest caz, octetul (lungime (la distanță) - lungime (local)) va fi descărcat și lipit la sfârșitul fișierului local. Acesta este un comportament așteptat în unele cazuri: de exemplu, puteți utiliza -c pentru a descărca un nou lot de date colectate sau fișier jurnal.

Cu toate acestea, dacă fișierul de pe server a fost modificat și nu pur și simplu atașat, atunci veți primi un fișier corupt. Wget nu are niciun mecanism pentru a verifica dacă un fișier local este începutul unui fișier la distanță. Ar trebui să fiți deosebit de atenți când utilizați -c împreună cu -r, deoarece fiecare fișier va fi considerat nedescărcat.

Un fișier corupt poate fi obținut și atunci când utilizați -c cu un proxy HTTP strâmb, care adaugă linia de comandă „descărcare întreruptă”. Versiunile viitoare pot adăuga un comutator „rollback” pentru a corecta astfel de cazuri.

Comutatorul -c poate fi utilizat numai cu servere FTP și HTTP care acceptă antetul Range.

--progress=tip
Selectarea tipului de indicator al progresului de descărcare. Valori posibile: „punct” și „bară”.
Indicatorul de tip „bară” este utilizat implicit. Afișează o bară de progres ASCII (așa-numitul „termometru”). Dacă ieșirea nu este în TTY, atunci tipul de indicator „punct” este utilizat în mod implicit.
Pentru a trece la modul „punct”, specificați --progress=dot. Progresul descărcării este urmărit și afișat ca puncte, unde fiecare punct reprezintă marime fixa datele descărcate.
Când descărcați puncte, puteți modifica stilul de ieșire specificând punct:style. Stilurile diferite definesc semnificații diferite pentru un singur punct. În mod implicit, un punct reprezintă 1K, 10 puncte formează un grup, 50 de puncte pe linie. Stilul binar este mai orientat spre "computer" - 8K per punct, 16 puncte pe cluster și 48 puncte pe linie (384K pe linie). Stilul mega este cel mai potrivit pentru descărcarea fișierelor foarte mari - fiecare punct corespunde la 64K, 8 puncte pe cluster și 48 puncte pe linie (linia corespunde la 3M).
Stilul implicit poate fi setat prin .wgetrc. Această setare poate fi suprascrisă pe linia de comandă. Excepția este că „punctul” are prioritate față de „bara” dacă ieșirea nu este într-un TTY. Pentru a folosi întotdeauna bar, specificați --progress=bar:force.

-N
--marcarea temporală
Permite utilizarea marcajelor de timp.

-S
--server-răspuns
Ieșiți antetele serverului HTTP și răspunsurile serverului FTP.

--păianjen
Când este lansat cu această cheie, Wget se comportă ca un păianjen web; nu descarcă pagini, ci doar verifică prezența acestora. De exemplu, vă puteți verifica marcajele folosind Wget:

Wget --spider --force-html -i bookmarks.html

Această caracteristică necesită multă muncă pentru ca Wget să obțină funcționalitatea păianjenilor reale.

-T secunde
--timeout=secunde
Setează expirarea rețelei în secunde. Echivalent cu specificarea --dns-timeout, --connect-timeout și --read-timeout în același timp.
Când Wget se conectează la sau citește de la o gazdă la distanță, verifică timpul de expirare și anulează operațiunea când expiră. Acest lucru previne apariția unor anomalii precum citirile suspendate sau încercările nesfârșite de conectare. Singurul timeout implicit este timeout-ul de citire de 900 de secunde. Setarea timeout-ului la 0 dezactivează verificările.
Dacă nu știți exact ce faceți, cel mai bine este să nu setați nicio valoare pentru cheile de timeout.

--dns-timeout=secunde
Setează timpul de expirare pentru Interogări DNSîn secunde secunde. Interogările DNS care nu sunt finalizate în timpul specificat vor eșua. În mod implicit, nu este setat niciun timeout pentru interogările DNS, altele decât cele definite de bibliotecile de sistem.

--connect-timeout=secunde
Setează timpul de expirare a conexiunii în secunde. Conexiunile TCP care durează mai mult până la configurare vor fi abandonate. În mod implicit, nu este setat niciun timeout de conexiune, în afară de valorile definite de bibliotecile de sistem.

--read-timeout=secunde
Setează timpul de expirare de citire (și scriere) în secunde. Lectura care necesită mai mult timp nu va avea succes. Valoarea implicită este de 900 de secunde.

--limit-rate=sumă
Setează limita de viteză de descărcare la cantitatea de octeți pe secundă. Valoarea poate fi exprimată în octeți, kiloocteți cu sufixul k sau megaocteți cu sufixul m. De exemplu, --limit-rate=20k va seta limita de viteză de descărcare la 20KB/s. Această limită este utilă dacă dintr-un motiv oarecare nu doriți ca Wget să risipească toată lățimea de bandă disponibilă. Wget implementează limita prin sleep on timpul necesar după o citire în rețea care a durat mai puțin decât limita specificată. Ca urmare, această strategie duce la o încetinire a vitezei Transmisie TCP aproximativ până la limita specificată. Cu toate acestea, pentru a stabili un echilibru este necesar anumit timp, așa că nu fi surprins dacă limita nu funcționează bine pentru fișierele mici.

-w secunde
--wait=secunde
Așteptați numărul specificat de secunde între descărcări. Utilizarea acestei funcții este recomandată pentru a reduce sarcina pe server prin reducerea frecvenței solicitărilor. În loc de secunde, timpul poate fi specificat în minute cu sufixul m, ore cu sufixul h sau zile cu sufixul d.
Specificarea unei valori mari este utilă dacă rețeaua de destinație sau gazda nu este disponibilă, astfel încât Wget să aștepte suficient timp pentru a remedia problemele de rețea înainte de a încerca din nou.

--waitretry=secunde
Dacă nu doriți ca Wget să aștepte între diferite descărcări, ci doar între încercări de descărcări eșuate, puteți utiliza acest comutator. Wget va crește liniar timpul de expirare, așteptând 1 secundă după prima eroare pentru un anumit fișier, 2 secunde după a doua eșec și așa mai departe până când valoare maximă secunde. Deci, o valoare de 10 va face Wget să aștepte până la (1 + 2 + ... + 10) = 55 de secunde pe fișier. Acest comutator este activat implicit în wgetrc global.

--aleatoriu-așteaptă
Unele site-uri web pot analiza jurnalele pentru a identifica utilizatorii de descărcare, cum ar fi Wget, examinând asemănările statistice în pauzele dintre solicitări. Acest comutator setează pauze aleatorii în intervalul de la 0 la 2 * secunde de așteptare, unde valoarea așteptării este specificată cu comutatorul --wait. Acest lucru permite excluderea lui Wget de la o astfel de analiză. Un articol recent pe tema dezvoltării unor platforme de utilizatori populare a prezentat cod care permite ca astfel de analize să fie efectuate din mers. Autorul a propus blocarea subrețelelor de clasa C pentru a bloca programele de descărcare automată, în ciuda posibilei modificări a adresei atribuite de DHCP. Crearea tastei --random-wait a fost inspirată de această recomandare bolnavă de a bloca mulți utilizatori nevinovați din vina unuia.

-Y pornit/oprit
--proxy=pornit/dezactivat
Activează sau dezactivează suportul proxy. Dacă este setată variabila de mediu corespunzătoare, atunci suportul proxy este activat implicit.

-Cota Q
--quota=quota
Stabilește o cotă pentru descărcări automate. Valoarea este specificată în octeți (implicit), kiloocteți (sufixați cu k) sau megaocteți (sufixați cu m). Cota nu afectează descărcarea unui fișier ..gz, fișierul ls-lR.gz va fi descărcat ca întreg. Același lucru se întâmplă atunci când specificați mai multe adrese URL pe linia de comandă. Cota contează atunci când descărcați recursiv sau când specificați adrese în fișierul de intrare. Acea. Puteți specifica în siguranță site-uri wget -Q2m -i - descărcarea va fi întreruptă atunci când cota este atinsă. Setarea valorilor la 0 sau inf anulează restricțiile.

Dns-cache=off
Dezactivează memorarea în cache a interogărilor DNS. Wget își amintește de obicei adresele interogate în DNS, așa că nu trebuie să continuați să interogați server DNS cam același set (de obicei mic) de adrese. Acest cache există doar în memorie. Noul proces Wget va interoga din nou DNS. Cu toate acestea, în unele cazuri, memorarea în cache a adreselor nu este de dorit chiar și pentru o perioadă scurtă de timp când rulați o aplicație precum Wget. De exemplu, unele servere HTTP au adrese IP alocate dinamic, care se modifică din când în când. Al lor înregistrări DNS actualizat cu fiecare modificare. Dacă o descărcare Wget de la o astfel de gazdă este întreruptă din cauza unei modificări a adresei IP, Wget va încerca din nou descărcarea, dar (din cauza memorării în cache DNS) va încerca să se conecteze la vechea adresă. Cu memoria cache DNS dezactivată, Wget va efectua interogări DNS la fiecare conexiune și, astfel, va obține adresa dinamică corectă de fiecare dată. Dacă nu înțelegeți descrierea de mai sus, probabil că nu veți avea nevoie de această cheie.

--restrict-file-names=mod
Setează ce seturi de caractere pot fi utilizate la crearea unui nume de fișier local de la o adresă URL la distanță. Caracterele interzise de această cheie sunt excluse, de exemplu. sunt înlocuite cu %HH, unde HH este codul hexazecimal al caracterului corespunzător. În mod implicit, Wget scapă caracterele care nu au permisiunea de a face parte din numele fișierului pe sistemul dvs. de operare, precum și caracterele de control, care sunt de obicei neprintabile. Acest comutator este util pentru a schimba valoarea implicită dacă salvați fișierul pe o partiție non-nativă sau doriți să suprascrieți evadarea caracterelor de control. Când modul este setat la „unix”, Wget scapă caracterul / și caracterele de control din intervalele 0-31 și 128-159. Aceasta este valoarea implicită pentru sistemele de operare Unix. Când modul este setat la „windows”, Wget scapă caracterele \, |, /, :, ?, ", * și caracterele de control din intervalele 0-31 și 128-159. În plus, Wget în modul Windows folosește + în schimb of : pentru a separa gazda și portul în nume de fișiere locale și @ în loc de ? pentru a separa partea solicitată a numelui fișierului de restul. Astfel, URL-ul stocat în modul Unix ca www..pl?input=blah, în Modul Windows va fi salvat ca www..pl@input=blah. Acest mod este implicit în Windows. Dacă adăugați nocontrol la modul, de exemplu unix,nocontrol, evadarea caracterelor de control este dezactivată. Puteți utiliza --restrict-file-names=nocontrol pentru a dezactiva scăparea caracterelor de control fără a afecta alegerea modului de scăpare a caracterelor de control specifice sistemului de operare.

Chei de director

-nd
--fără-directoare
Nu creați o structură de directoare când descărcați recursiv. Cu acest comutator, toate fișierele sunt salvate în directorul curent fără a fi suprascrise (dacă numele apare de mai multe ori, numele vor primi sufixul.n).

-X
--force-directoare
Reversul -nd - creează o structură de directoare chiar dacă nu ar fi fost creată altfel..txt va salva fișierul pe site/robots.txt.

-nH
--no-host-directories
Dezactivează crearea directorului gazdă..ru/. Această cheie anulează acest comportament.

--protocol-directoare
Utilizați numele protocolului ca componentă de director pentru fișierele locale. De exemplu, cu acest comutator wget -r http://gazdă va salva pe http/gazdă/... în loc de gazdă/....

--cut-dirs=număr
Ignorați numărul de niveluri de imbricare a directoarelor. Acesta este un comutator util pentru gestionarea precisă a directoarelor pentru a salva conținutul descărcat recursiv.. Când descărcați cu -r, copia locală va fi salvată pe ftp.. Dacă comutatorul -nH poate elimina ftp.. Aici este locul --cut-dirs vine în ajutor; îl obligă pe Wget să închidă ochii la numărul de subdirectoare la distanță. Mai jos sunt câteva exemple de lucru de --cut-dirs.

Fără opțiuni -> ftp. -nH -> pub/xxx/ -nH --cut-dirs=1 -> xxx/ -nH --cut-dirs=2 -> . --cut-dirs=1 -> ftp.site/xxx/

Dacă trebuie doar să scăpați de structura directorului, atunci acest comutator poate fi înlocuit cu o combinație de -nd și -P. Totuși, spre deosebire de -nd, --cut-dirs nu pierde subdirectoare - de exemplu, cu -nH --cut-dirs=1, subdirectorul beta/ va fi salvat ca xxx/beta, așa cum era de așteptat.

-P prefix
--directory-prefix=prefix
Setează directorul rădăcină la prefix. Directorul rădăcină este directorul în care vor fi salvate toate fișierele și subdirectoarele, adică. partea de sus a arborelui de descărcare. Mod implicit. (directorul curent).

Chei HTTP

-E
--html-extensie
Această cheie adaugă extensia .html la numele fișierului local dacă adresa URL descărcată este de tipul application/xhtml+xml sau text/html și sfârșitul său nu se potrivește expresie uzuala\.?. Acest lucru este util, de exemplu, atunci când oglindiți site-uri care folosesc pagini .asp, când doriți să funcționeze în oglindă server obișnuit Apache. De asemenea, util atunci când descărcați conținut generat dinamic. O adresă URL precum http://site.com/article.cgi?25 va fi salvată ca article.cgi?25.html. Paginile salvate în acest fel vor fi descărcate și suprascrise cu fiecare oglindire ulterioară, deoarece Wget nu poate potrivi fișierul X.html local la o adresă de la distanță URL X (nu știe încă că URL-ul returnează un răspuns precum text/html sau application/xhtml+xml). Pentru a preveni reîncărcarea, utilizați comutatoarele -k și -K, astfel încât versiunea originală să fie salvată ca X.orig.

--http-user=utilizator
--http-passwd=parolă
Specifică numele utilizatorului și parola a accesa server HTTP. În funcție de tipul de solicitare, Wget le va codifica folosind o schemă de autorizare obișnuită (nesecurizată) sau digest. O altă modalitate de a specifica numele de utilizator și parola este în URL-ul propriu-zis. Oricare dintre metode vă dezvăluie parola oricui deschide ps. Pentru a evita dezvăluirea parolelor, stocați-le în fișiere .wgetrc sau .netrc și asigurați-vă că aceste fișiere nu pot fi citite de alți utilizatori care folosesc chmod. Nu este recomandat să stocați parole deosebit de importante chiar și în aceste fișiere. Scrieți parolele în fișiere și apoi ștergeți-le imediat după rularea Wget.

--fără-cache
Dezactivează stocarea în cache pe partea serverului. În această situație Wget trimite către un server la distanță directiva corespunzătoare (Pragma: no-cache) pentru a obține o versiune actualizată a fișierului, mai degrabă decât în ​​cache. Acest lucru este util în special pentru ștergerea documentelor învechite de pe serverele proxy. Memorarea în cache este activată în mod implicit.

--fără cookie-uri
Dezactivează utilizarea cookie-urilor. Cookie-urile sunt un mecanism pentru menținerea stării serverului. Serverul trimite un cookie clientului folosind antetul Set-Cookie, iar clientul include acest cookie în toate solicitările ulterioare. Deoarece Cookie-urile permit proprietarilor de servere să urmărească vizitatorii și să partajeze aceste informații între site-uri, pe care unii le consideră o încălcare a confidențialității. În mod implicit, sunt utilizate cookie-uri; cu toate acestea, cookie-urile nu sunt salvate implicit.

--load-cookies fișier
Încărcarea cookie-urilor din fișier înainte de prima solicitare HTTP. fisier - fisier textîn formatul utilizat inițial pentru fișierul cookie.txt al Netscape. De obicei, această opțiune este necesară pentru oglindirea site-urilor care necesită autorizare pentru o parte sau tot conținutul. Autorizarea se face de obicei prin emiterea serverului cookie HTTP după primirea și verificarea informațiilor de înregistrare. Un cookie este apoi trimis de browser la vizualizarea acelei părți a site-ului și oferă identificarea. Oglindirea unui astfel de site necesită ca Wget să servească aceleași cookie-uri ca și browserul. Acest lucru se realizează prin intermediul --load-cookies - pur și simplu spuneți Wget locația cookie-urilor.txt și va trimite cookie-uri identice pentru browser. Diferitele browsere stochează cookie-uri în locuri diferite: Netscape 4.x. ~/.netscape/cookies.txt. Mozilla și Netscape 6.x. Fișierul cookie Mozilla se mai numește cookies.txt și se află undeva în ~/.mozilla în directorul de profil. Calea completă arată de obicei ca ~/.mozilla/default/some-weird-string/cookies.txt. Internet Explorer. Cookie-ul Wget poate fi obținut prin meniul File, Import and Export, Export Cookies. Testat pe Internet Explorer 5; Funcționarea cu versiuni anterioare nu este garantată. Alte browsere. Dacă utilizați un browser diferit, --load-cookies va funcționa numai dacă formatul fișierului se potrivește cu formatul Netscape, de exemplu. ceea ce se așteaptă Wget. Dacă nu puteți utiliza --load-cookies, poate exista o altă alternativă. Dacă browserul dvs. are un „manager de cookie-uri”, atunci puteți vizualiza cookie-urile necesare pentru oglindire. Notați numele și valoarea cookie-ului și furnizați-le manual lui Wget, ocolind suportul „oficial”:

Wget --cookies=off --header „Cookie: nume=valoare”

--salvați fișierul cookie
Salvarea cookie-urilor în fișier înainte de a ieși. Această opțiune nu salvează cookie-uri și cookie-uri expirate fără un anumit timp de expirare (așa-numitele „cookie-uri de sesiune”). Vezi și --keep-session-cookies.

--păstrați cookie-urile de sesiune
Când este specificat --save-cookies, acesta salvează module cookie de sesiune. De obicei, cookie-urile de sesiune nu sunt salvate, deoarece se așteaptă să fie uitate când browserul este închis. Salvarea acestora este utilă pentru site-urile care necesită autorizare pentru a accesa pagini. Când utilizați această opțiune, diferite procese Wget pentru un site vor apărea ca un singur browser. Deoarece De obicei, formatul fișierului cookie nu conține cookie-uri de sesiune, Wget le marchează cu un marcaj de expirare de 0. --load-cookies le tratează ca cookie-uri de sesiune, dar acest lucru poate cauza probleme pentru alte browsere Cookie-urile încărcate în acest fel sunt interpretate ca cookie-uri de sesiune , adică salvarea cu --save-cookies trebuie să specifice din nou --keep-session-cookies.

--ignora-lungimea
Din păcate, unele servere HTTP (programe CGI, mai exact) trimit un antet Content-Length incorect, ceea ce îl înnebunește pe Wget pentru că. crede că documentul nu a fost descărcat complet. Acest sindrom poate fi observat dacă Wget încearcă să descarce același document din nou și din nou, indicând de fiecare dată o eroare a conexiunii pe același octet. Cu acest comutator, Wget ignoră antetul Content-Length ca și cum nu ar fi existat niciodată.

--header=antet-aditional
Specificați un antet suplimentar pentru Transferuri HTTP Server. Anteturile trebuie să conțină „:” după unul sau mai multe caractere care nu sunt goale și nu trebuie să conțină întreruperi de rând. Puteți specifica mai multe antete suplimentare utilizând comutatorul --header de mai multe ori.

Wget --header="Accept-Charset: iso-8859-2" --header="Accept-Language: hr" http://aaa.hr/

Specificarea unui șir gol ca antet șterge toate anteturile personalizate specificate anterior.

--proxy-user=utilizator
--proxy-passwd=parolă
Specifică numele utilizatorului și parola parolei pentru autorizare pe serverul proxy. Wget le codifică folosind o schemă de autorizare de bază. Aici se aplică aceleași considerente de securitate ca și pentru cheia --http-passwd.

--referer=url
Include un antet „Referer: url” în cerere. Util dacă, atunci când difuzează un document, serverul crede că comunică cu un browser interactiv și verifică dacă câmpul Referer conține pagina care indică documentul solicitat.

--save-headers
Salvează anteturile de răspuns HTTP într-un fișier imediat înainte de conținut, folosind un șir gol ca delimitator.

-U agent-șir
--user-agent=șir-agent
Identificat ca browser-șir de agent pentru serverul HTTP. Protocolul HTTP permite identificarea clientului folosind câmpul antet User-Agent. Acest lucru permite diferențierea software-ului, de obicei pentru statistici sau pentru a urmări încălcările protocolului. Wget este de obicei identificat ca Wget/version, unde este versiunea Versiune curentă Wget. Cu toate acestea, unele site-uri au o politică de adaptare a rezultatelor browserului pe baza câmpului User-Agent. Practic nu este Idee rea, dar unele servere refuză accesul altor clienți decât Mozilla și Microsoft Internet Explorator. Această cheie vă permite să modificați valoarea User-Agent returnată de Wget. Utilizarea acestei chei nu este recomandată decât dacă sunteți sigur de ceea ce faceți.

--post-data=șir
--post-file=fișier
Utilizări metoda POST pentru toți solicitări HTTPși trimite datele specificate în cerere. --post-data trimite șirul ca date, iar --post-file trimite conținutul fișierului. Altfel funcționează la fel. Vă rugăm să rețineți că Wget trebuie să cunoască inițial lungimea cererii POST. Argumentul pentru --post-file trebuie să fie un fișier obișnuit; specificarea unui FIFO ca /dev/stdin nu va funcționa. Nu este complet clar cum poate fi ocolită această limitare în HTTP/1.0. Deși HTTP/1.1 introduce transmisie în bloc, care nu necesită cunoștințe inițiale despre lungime, clientul nu o poate folosi decât dacă este sigur că comunică cu serverul HTTP/1.1. Și nu poate ști acest lucru până când nu primește un răspuns, care, la rândul său, ajunge la o cerere cu drepturi depline. Problema oului și a puiului. Notă: dacă Wget primește o redirecționare ca răspuns la Solicitare POST, nu va trimite date POST la adresa URL de redirecționare. De multe ori adrese URL, care se ocupă de POST, lansează o redirecționare către o pagină obișnuită (chiar dacă acest lucru este interzis din punct de vedere tehnic) care nu dorește să accepte POST. Nu este încă clar dacă acest comportament este optim; daca nu merge va fi schimbat. Exemplul de mai jos demonstrează cum să vă conectați la server folosind POST și apoi să descărcați paginile dorite, accesibile numai utilizatorilor autorizați:

Wget --save-cookies cookies..php wget --load-cookies cookies.txt -p http://server.com/interesting/article.php

Configurarea WGET

Setările de bază care trebuie scrise de fiecare dată pot fi specificate în fișierul de configurare a programului. Pentru a face acest lucru, mergeți la directorul de lucru Wget, găsiți acolo fișierul sample.wgetrc, redenumiți-l în .wgetrcși notează parametrii necesari de configurare în editor.

User-agent = "Mozilla/5.0" încercări = 5 număr de încercări de descărcare așteptați = 0 nu întrerupeți continua = activat trebuie să descărcați dir_prefix = ~/Downloads/ unde să puneți use_proxy=on descărcat - utilizați un proxy http_proxy - caracteristicile serverului dumneavoastră proxy.

  • Setați variabila de mediu WGETRC la calea completă către fișier.
  • Setați variabila HOME pentru a indica calea către folderul de acasă utilizator (c:\Documente și setări\jonh). Apoi wget va căuta fișierul „wgetrc” în acel folder.
  • Alternativ, puteți crea un fișier wget.ini în același folder în care se află wget.exe și puteți seta acolo parametri suplimentari pentru linia de comandă wget.

Informații utile despre WGET pot fi găsite aici:

  • PhantomJS- Folosiți dacă aveți nevoie să descărcați un site unde unele dintre date sunt încărcate folosind JavaScript
.

Lucrând în consolă, de multe ori trebuie să interacționăm cu rețeaua, de exemplu, să descarcăm fișiere sau pagini întregi de Internet. Dacă descărcam pagini de internet destul de rar, atunci cu fișiere situația este complet diferită. Acestea pot fi diferite scripturi, pachete de instalare, programe, chei, liste de pachete și multe altele. Puteți descărca fișierul în consola Linux folosind utilitarul wget. O vom analiza în acest articol.

Acesta este un utilitar foarte puternic care poate funcționa prin protocoalele HTTP, HTTPS și FTP. În plus, este acceptată lucrul printr-un proxy. Comanda wget linux poate descărca fișiere chiar și în fundal - fără interacțiunea utilizatorului, spre deosebire de majoritatea browserelor web.

Pe lângă descărcarea fișierelor, este posibil să salvați pagini web sau chiar site-uri web întregi, datorită funcției de deschidere a linkurilor pe pagini. Această caracteristică se mai numește și încărcare recursivă. Vom analiza toate acestea în articolul de astăzi, dar să începem, ca întotdeauna, cu sintaxa și opțiunile de bază ale utilitarului.

Comanda wget linux are o sintaxă foarte simplă:

Opțiuni de $ wget link_address

Puteți specifica mai multe adrese URL de descărcare, dar mai multe simultan. Opțiunile nu sunt necesare, dar în majoritatea cazurilor sunt folosite pentru a configura opțiunile de pornire.

Opțiuni

Sintaxa opțiunilor este foarte slabă. Fiecare opțiune are de obicei atât un lung cât și nume scurt. Ele pot fi scrise fie înainte, fie după URL. Nu este nevoie să puneți un spațiu între opțiune și valoarea acesteia; de exemplu, puteți scrie -o log sau -olog. Aceste valori sunt echivalente. De asemenea, dacă opțiunile nu au parametri, nu este necesar să începeți fiecare cu o cratimă, le puteți scrie pe toate împreună: -drc și -d -r -c. Aceste opțiuni wget sunt, de asemenea, echivalente.

Acum să trecem la lista de opțiuni. Wget are prea multe opțiuni, ne vom uita doar la cele principale.

  • -V (--versiune)- afișați versiunea programului
  • -h (--ajutor)- eliberarea unui certificat
  • -b (--fundal)- lucrează în fundal
  • -o fişier (--out-file)- specificați fișierul jurnal
  • -d (--debug)- activați modul de depanare
  • -v (--verbos)- afișați informații maxime despre funcționarea utilitarului
  • -q (--liniștit)- afisarea unui minim de informatii despre lucrare
  • -i fișier (--input-file)- citiți URL-ul din fișier
  • --force-html- citiți fișierul specificat în parametrul anterior ca html
  • -t (--încearcă)- numărul de încercări de conectare la server
  • -O dosar (--document-ieșire)- fisierul in care vor fi salvate datele primite
  • -с (--continuare)- continuați o descărcare întreruptă anterior
  • -S (--server-răspuns)- afișați răspunsul serverului
  • --păianjen- verificați funcționalitatea URL-ului
  • -T time (--timeout)- expirarea conexiunii la server
  • --limit-rate- limitați viteza de descărcare
  • -w (--așteaptă)- intervalul dintre cereri
  • -Q (--cotă) - dimensiune maximă descărcări
  • -4 (--inet4doar)- utilizați protocolul ipv4
  • -6 (--inet6doar)- utilizați protocolul ipv6
  • -U (--user-agent)- șir USER AGENT trimis către server
  • -r (--recursiv) - operarea recursivă a utilităţii
  • -l (--nivel)- adâncimea în timpul scanării recursive
  • -k (--convert-links)- convertiți link-urile în cele locale atunci când încărcați pagini
  • -P (--prefix-director)- directorul de unde vor fi descărcate fișierele
  • -m (--oglindă)- descărcați site-ul pe mașina dvs. locală
  • -p (--page-requisites)- în timpul încărcării site-ului, descărcați toate resursele necesare

Desigur, acestea nu sunt toate chei wget, dar există deja prea multă teorie aici, acum să trecem la practică. Exemplele wget sunt mult mai interesante.

Folosind wget Linux

Comanda wget linux vine de obicei implicit pe majoritatea distribuțiilor, dar dacă nu, poate fi instalată foarte ușor. De exemplu, o instalare care folosește yum ar arăta astfel:

yum -y instalează wget

Și în distribuțiile bazate pe Debian:

sudo apt install wget

Acum să trecem direct la exemple:

Comanda wget linux va descărca un fișier și îl va salva în directorul curent. În timpul descărcării vom vedea progresul, dimensiunea fișierului, data acestuia ultima schimbare, precum și viteza de descărcare:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

2. Salvați fișierul cu alt nume

Opțiunea -O vă permite să specificați un nume pentru fișierul salvat, de exemplu, descărcați un fișier wget numit wget.zip:

wget -O wget.zip http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

3. Descărcați mai multe fișiere

Puteți descărca mai multe fișiere cu o singură comandă, chiar și folosind protocoale diferite, pur și simplu specificând adresa URL a acestora:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz ftp://ftp.gnu.org/gnu/wget/wget-1.10.1.tar.gz.sig

4. Obțineți URL-ul din fișier

wget -i /wget/tmp.txt

5. Continuați descărcarea

Utilitarul wget linux este conceput pentru a funcționa pe rețele lente și instabile. Deci, dacă ați descărcat dosar mareși conexiunea s-a pierdut în timpul descărcării, apoi puteți descărca fișierul wget folosind opțiunea -c.

wget -c http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Opțiunea -b face ca programul să ruleze în fundal, toate ieșirile vor fi scrise într-un fișier jurnal, comutatoarele speciale wget sunt utilizate pentru a configura fișierul jurnal:

wget -b -o ~/wget.log http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

7. Limitarea vitezei de descărcare

Comanda wget linux nu numai că vă permite să continuați descărcarea fișierelor, dar limitează și viteza de descărcare. Există o opțiune --limit-rate pentru aceasta. De exemplu, să limităm viteza la 100 de kilobiți:

wget --limit-rate=100k ftp://ftp.iinet.net.au/debian/debian-cd/8.4.0/amd64/iso-dvd/debian-8.4.0-amd64-DVD-1.iso

Aici, ca și în alte comenzi similare, sunt disponibili indici pentru a indica viteza - k - kilobiți, m - megabiți, g - gigabiți și așa mai departe.

8. Conexiune folosind login și parola

Unele resurse necesită autentificare pentru a-și descărca fișierele. Folosind opțiunile --http-user=nume utilizator, –http-password=parolă și --ftp-user=nume utilizator, --ftp-password=parolă puteți seta numele de utilizator și parola pentru resurse HTTP sau FTP.

wget --http-user=narad --http-password=parola http://mirrors.hns.net.in/centos/6.3/isos/x86_64/CentOS-6.3-x86_64-LiveDVD.iso

wget --ftp-user=narad --ftp-password=parola ftp://ftp.iinet.net.au/debian/debian-cd/6.0.5/i386/iso-dvd/debian-6.0.5-i386 -DVD-1.iso

9. Descărcați și executați

Probabil ați văzut deja astfel de comenzi. wget vă permite să executați imediat scripturile descărcate:

wget -O - http://site/script.sh | bash

Dacă opțiunea -O nu trece niciun argument, atunci fișierul descărcat va fi tipărit la ieșirea standard, apoi îl putem redirecționa de la interpretul bash, așa cum se arată mai sus.

10. Salvați fișierul într-un folder

În mod implicit, wget salvează fișierul în dosarul curent, dar acest comportament este foarte ușor de modificat folosind opțiunea -P:

wget -P ~/Downloads/ http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

11. Transferați informațiile browserului

Unele site-uri filtrează roboții, dar putem transmite informații false despre browserul nostru (user-agent) și pagina de la care provenim (http-referer).

wget ‐‐refer=http://google.com ‐‐user-agent=”Mozilla/5.0 Firefox/4.0.1″ //site

12. Numărul de încercări de descărcare

În mod implicit, wget încearcă să reîncerce descărcarea de 20 de ori înainte de a eșua. Numărul de ori poate fi modificat folosind opțiunea --tries:

Cele mai bune articole pe această temă