If-Koubou

Rakenna Download Scheduler pienellä ohjelmointitaito

Rakenna Download Scheduler pienellä ohjelmointitaito (Miten)

Me kaikki rakastamme ladata tavaraa internetistä, ja hyviä latausjohtajan työkaluja löytyy paljon, joita voimme käyttää latausten aikatauluun. Latausjohtajan käyttö saattaa olla helpompaa, mutta ei ole haittaa Ubuntun mukana tulevien työkalujen tutkimisessa ja sen hyödyntämisessä.

Tässä artikkelissa näytämme sisäänrakennetun Ubuntun ohjelmiston, jonka avulla voimme ladata juttuja Internetistä wget. Tämän lisäksi näytämme sinulle, kuinka aikataulun lataaminen Cronilla on.

Lataa Wgetin käyttö

Wget on ilmainen ohjelmistopaketti tiedostojen hakemiseen HTTP: n, HTTPS: n ja FTP: n, yleisimmin käytettyjen Internet-protokollien avulla. Se on ei-interaktiivinen komentorivityökalu, joten sitä voi helposti kutsua skripteistä, cron-töistä, päätteistä ilman X-Windows-tukea jne.

Avaa päätelaitteesi ja tutkia, miten voimme käyttää wgetia ladata tavaraa verkosta. Latauksen perus syntaksi wgetin kanssa on seuraava:

wget [vaihtoehto] ... [URL] ...

Tämä komento lataa wget-käsikirjan paikalliseen asemaan

wget http://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntussa on kron daemon, jota käytetään aikataulujen suorittamiseen tietyn ajan. Crontabin avulla voit määrittää toimet ja ajat, joiden aikana ne on suoritettava. Näin teet normaalisti tehtävän suorittamisen komentorivityökalulla.

Avaa pääteikkuna ja kirjoita crontab -e.

Jokainen crontabin osioista erottaa välilyönti, jossa lopullisessa osassa on yksi tai useampi tila. Cron-merkintä koostuu minuutista (0-59), tunnit (0-23, 0 = keskiyö), päivä (1-31), kuukausi (1-12), arkipäivä (0-6, 0 = sunnuntai). Kolmannen merkinnän edellä crontab lataa wget.pdf klo 2 am. Ensimmäinen merkintä (0) ja toinen merkintä (2) merkitsevät 2:00. Kolmannen viidennen merkinnän (*) tarkoittaa päivämäärää, kuukautta tai viikkoa. Viimeinen merkintä on wget-komento ladata wget.pdf määritetystä URL-osoitteesta.

Tämä on perustana wgetille ja miten Cron toimii. Otetaan ryöstö todellisessa esimerkissä aikataulun lataamisesta.

Lataa ajoitus

Aiomme ladata Firefox 3.6 klo 2 AM. Koska ISP antaa vain rajallisen määrän tietoja, meidän on keskeytettävä lataus klo 8 AM. Tämä on asennus näyttää.

Ohita ensimmäiset 2 merkinnät edellä crontab. Kolmas ja neljäs komento ovat vain 2 komentoa, joita tarvitset. Kolmas komento määrittää tehtävän, joka lataa Firefoxin klo 2:

[koodi]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/koodi]

-C-vaihtoehdolla tarkoitetaan, että wgetin pitäisi jatkaa olemassa olevaa latausta, ellei sitä ole vielä saatu valmiiksi.

Neljäs komento lopettaa wgetin klo 8. 'Killall' on unix-komento, joka tappaa prosessit nimen mukaan.

[koodi]
0 8 * * * killall wget
[/koodi]

Killall wget kertoo Ubuntulle, että se lopettaa tiedoston lataamisen klo 8 mennessä.

Muita hyödyllisiä wget-komentoja

1. Hakemiston määrittäminen tiedoston lataamiseksi

[koodi]
wget -output-document = / home / zainul / Lataukset / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/koodi]

vaihtoehdon -output-dokumentin avulla voit määrittää hakemiston ja ladatun tiedoston nimen

2. Verkkosivun lataaminen

wget pystyy myös lataamaan verkkosivuston.

[koodi]
wget -m http://www.google.com/profiles/zainul.franciscus
[/koodi]

Yllä oleva komento lataa koko google-profiilin web-sivuni. Vaihtoehdolla "-m" kerrotaan, että wget lataa "peilikuva" määritetystä URL-osoitteesta.

Toinen tärkeä vaihtoehto on kertoa wgetille, kuinka monta linkkiä sen pitäisi seurata, kun se lataa verkkosivuston.

[koodi]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/koodi]

Yllä oleva wget-komento käyttää kahta vaihtoehtoa. Ensimmäinen vaihtoehto "-r" kertoo, että wget lataa määritetyn sivuston rekursiivisesti. Toinen vaihtoehto "-l1" kertoo, että wget saa vain ensimmäisen tason linkit kyseiseltä verkkosivustolta. Voimme asettaa kolme tasoa "-l2" ja "-l3".

3. Robottien puuttuminen

Webmaster ylläpitää tekstitiedostoa nimeltä Robot.txt. 'Robot.txt' ylläpitää luettelon URL-osoitteista, joita WWW-sivun indeksointirobotti, kuten wget, ei pitäisi indeksoida. Voimme kertoa wgetille, että "Robot.txt" jätetään huomiotta "-erobots = off" -vaihtoehdolla. Seuraava komento kertoo wgetille, että lataan google-profiilin en- simmäisen sivun ja jätän Robot.txt-sivun.

[koodi]
wget -erobots = pois http://www.google.com/profiles/zainul.franciscus
[/koodi]

Toinen hyödyllinen vaihtoehto on -U. Tämä vaihtoehto peittää wgetin selaimena. Huomaa, että sovelluksen peittäminen muuksi sovellukseksi saattaa rikkoa verkkopalvelujen tarjoajan termiä ja palvelua.

[koodi]
wget -erobots = pois -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/koodi]

johtopäätös

Wget on hyvin vanha koulu, joka on vielä hakkeroiva GNU-ohjelmistopaketti, jota voimme ladata tiedostoja. Wget on vuorovaikutteinen komentorivityökalu, joka tarkoittaa, että voimme antaa sen käydä tietokoneessamme taustalla tarvitsematta käynnistää mitään sovellusta. Katso wget-man sivua

[koodi]
$ mies wget
[/koodi]

ymmärtää muita vaihtoehtoja, joita voimme käyttää wgetin kanssa.

Linkit

Wget-käsikirja
Kuinka yhdistää kaksi ladattua tiedostoa, kun wget epäonnistuu puoliväliin
Linux QuickTip: lataaminen ja purkaminen yhdellä askeleella