Jos sinulla on vaikea tekstitiedosto, jota yrität käsitellä, jakaminen osioihin voi joskus auttaa käsittelemään aikaa, varsinkin jos aiomme tuoda tiedoston laskentataulukkoon. Tai ehkä haluat hakea tietyn rivin riviltä tiedostosta.
Anna split, wc, tail, cat ja grep. (älä unohda sed ja awk). Linuxissa on runsaasti apuohjelmia tekstitiedostojen käsittelemiseen komentorivillä. Meidän tehtävämme tänään käytämme split ja wc.
Ensin tarkastelemme lokitiedostoamme ....
> ls -l
-rw-r-r-1 thegeek ggroup 42046520 19.09.2006 11:42 access.log
Näemme, että tiedostokoko on 42MB. Se on hieman iso ... mutta kuinka monta riviä me käsittelemme? Jos halusimme tuoda tämän Exceliin, meidän pitäisi pitää se alle 65 000 riviä.
Tarkistetaan tiedostojen rivien määrä käyttämällä wc-apuohjelmaa, joka tarkoittaa "sananlaskentaa".
> wc -l access.log
146330 access.log
Olemme aivan yli rajan. Meidän on jaettava tämä 3 segmenttiin. Käytämme split-apuohjelmaa tämän tekemiseen.
> split -l 60000 access.log
> ls -lyhteensä 79124
-rw-rw-r- 1 thegeek ggroup 40465200 2006-09-19 12:00 access.log
-rw-rw-r- 1 thegeek ggroup 16598163 19.09.2006 12:05 xaa
-rw-rw-r- 1 thegeek ggroup 16596545 19.09.2006 12:05 xab
-rw-rw-r- 1 thegeek ggroup 7270492 19.09.2006 12:05 xac
Olemme nyt jakaneet tekstitiedostot 3 erilliseen tiedostoon, joista kukin sisältää alle 60000 riviä, jotka tuntuivat hyvältä numerolta. Viimeinen tiedosto sisältää jäljellä olevan summan. Jos aiot leikata tämän tiedoston puoliksi, olisit tehnyt tämän:
> split -l 73165 access.log
Ja se kaikki on siinä.