Voit helposti muuntaa PDF-tiedostoja muokattavaksi tekstiä Linuxissa käyttäen "pdftotext" -komennon työkalua. Jos alkuperäisessä PDF-tiedostossa on kuitenkin kuvia, niitä ei pureta. Jos haluat purkaa kuvia PDF-tiedostosta, voit käyttää toista komentorivityökalua nimeltä "pdfimages".
HUOMAUTUS: Kun sanomme kirjoittavan jotain tässä artikkelissa ja tekstin ympärillä on lainauksia, älä kirjoita lainauksia, ellei toisin mainita.
"Pdfimages" -työkalu on osa poppler-utils-pakettia. Voit tarkistaa, onko se asennettu järjestelmään ja asenna se tarvittaessa tässä artikkelissa kuvattuihin vaiheisiin.
Voit avata PDF-tiedoston PDF-tiedostojen avulla painamalla Terminal-ikkunan painamalla Ctrl + Alt + T-näppäintä. Kirjoita seuraava komento kehotteeseen.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / Poistotut kuvat / image
HUOMAUTUS: Korvaa tässä artikkelissa näkyvien komentojen komentojen ja PDF-tiedostonimen ensimmäinen polku alkuperäisen PDF-tiedoston polkuun ja tiedostonimiin. Toisen polun pitäisi olla polku juurikansioon, johon haluat tallentaa otetut kuvat. Sana "kuva" toisen polun lopussa edustaa sitä mitä haluat esitellä tiedostonimesi kanssa. Kuvien tiedostonimet on numeroitu automaattisesti (000, 001, 002, 003, jne.). Jos haluat lisätä tekstiä kunkin kuvan alkuun, kirjoita tämä teksti toisen polun loppuun. Esimerkissämme jokainen kuvatiedoston nimi alkaa kuvasta, kuten kuvasta 001.ppm, image-002.ppm, jne. Lisäämällä tekstin ja numeron väliin lisätään viiva.
Oletuskuvaformaatti on PPM (kannettava pikakuva) ei-monokromaattisille kuville tai PBM (kannettava bittikartta) monokromaattisille kuville. Nämä muodot on suunniteltu helposti vaihdettaviksi alustojen välillä.
HUOMAUTUS: Voit saada kaksi kuvatiedostoa kutakin kuvaa varten PDF-tiedostossasi. Toinen kuva jokaiselle kuvalle on tyhjä, joten voit selvittää, mitkä kuvat sisältävät tiedoston tiedostot tiedostopäällikön tiedostossa olevasta pienoiskuvasta.
Lisää .jpg-kuvatiedostoja lisäämällä komentoon "-j" -vaihtoehto, kuten alla on esitetty.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / Poistotut kuvat / image
HUOMAUTUS: Voit myös muuttaa oletuslähtöä PNG: lle käyttäen "-png" -vaihtoehtoa tai TIFF: ää käyttämällä "-tiff" -vaihtoehtoa.
Jokaisen kuvan pääkuvatiedosto tallennetaan .jpg-tiedostoksi. Toinen tyhjä kuva on edelleen .ppm- tai .pbm-tiedosto.
Jos haluat muuttaa kuvia vain tietyn sivun jälkeen, käytä "-f" -vaihtoehtoa numerolla, joka ilmaisee ensimmäisen sivun muunnettavaksi, kuten alla olevassa esimerkkikomennossa on esitetty.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / Poistetut kuvat / image
HUOMAA: Yhdistimme "-j" -vaihtoehdon "-f" -vaihtoehdolla, jotta saisimme .jpg-kuvia ja teimme samoin jäljempänä mainituilla "-l" -vaihtoehdoilla.
Voit muuntaa kaikki kuvat ennen tietyn sivun ja tiettyä sivua käyttämällä -l-kirjainta (pienet kirjaimet "L", ei numero "1"), jossa on numero, joka ilmoittaa viimeisen muokattavan sivun, kuten alla on esitetty.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / Poistetut kuvat / image
HUOMAUTUS: Voit käyttää "-f" - ja "-l" -vaihtoehtoja yhdessä muuntamalla kuvat tiettyyn sivualueeseen asiakirjan keskellä.
Jos PDF-tiedostossa on omistajan salasana, käytä "-opw" -vaihtoehtoa ja salasanaa yksittäisissä lainauksissa alla kuvatulla tavalla. Jos PDF-tiedoston salasana on käyttäjän salasana, käytä "-upw" -vaihtoehtoa salasanan sijasta.
HUOMAUTUS: Varmista, että komennossa on yksittäisiä lainauksia salasanasi ympärillä.
pdfimages -opw 'salasana' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
Jos haluat lisätietoja pdfimages-komennon käytöstä, kirjoita "pdfimages" Terminal-ikkunan kehotteeseen ja paina Enter. Komennon käyttö näkyy luettelossa komennossa käytettävissä olevista vaihtoehdoista.