Onko PDF-dokumentti, jonka haluat poistaa kaiken tekstin? Entä skannatun asiakirjan kuvatiedostot, jotka haluat muuntaa muokattavaksi tekstiksi? Nämä ovat joitain yleisiä asioita, joita olen nähnyt työpaikalla, kun käsittelette tiedostoja.
Tässä artikkelissa puhun useista eri tavoista, joilla voit yrittää poimia tekstiä PDF-tiedostosta tai kuvasta. Tulostustulokset vaihtelevat tekstin ja kuvan laadun ja laadun mukaan. Tulokset vaihtelevat myös käytettävän työkalun mukaan, joten kannattaa kokeilla niin monta vaihtoehtoa kuin mahdollista saadaksesi parhaan tuloksen.
Yksinkertaisin ja nopein tapa aloittaa on kokeilla online-PDF-tekstinpoisto-palvelu. Nämä ovat normaalisti vapaita ja voivat antaa sinulle juuri etsimäsi tarvitsematta asentaa mitään tietokoneellesi. Tässä on kaksi, jota olen käyttänyt erittäin hyviä ja erinomaisia tuloksia:
ExtractPDF on ilmainen työkalu tarttua kuvia, tekstiä ja fontteja PDF-tiedostosta. Ainoa rajoitus on, että PDF-tiedoston maksimikoko on 10 Mt. Se on vähän pieni; joten jos sinulla on suurempi tiedosto, kokeile joitain muita alla olevia menetelmiä. Valitse tiedosto ja napsauta sitten Lähetä tiedosto painiketta. Tulokset ovat yleensä erittäin nopeita ja tekstin esikatselu tulee näkyviin, kun napsautat teksti -välilehteä.
Se on myös mukava lisäetuna, että se poimii kuvia PDF-tiedostosta myös siinä tapauksessa, että tarvitset niitä! Kaiken kaikkiaan online-työkalu toimii erinomaisesti, mutta olen saanut pari PDF-dokumenttia, joka antaa minulle hauska tuotos. Teksti nou- datetaan hienosti, mutta jostain syystä sillä on rivi tauon jälkeen jokaisen sanan jälkeen! Ei valtava ongelma lyhyt PDF-tiedosto, mutta varmasti ongelma tiedostoja, joilla on paljon tekstiä. Jos näin käy, kokeile seuraavaa työkalua.
Online-tekstintunnistus yleensä pyrkii toimimaan asiakirjoissa, jotka eivät muuttuneet kunnolla ExtractPDF: llä, joten kannattaa kokeilla molempia palveluita nähdäksesi, mitkä antavat sinulle paremman tuoton. Online OCR: llä on myös joitain hienoja ominaisuuksia, jotka voivat olla käteviä kenelle tahansa, jolla on suuri PDF-tiedosto, joka tarvitsee vain muuntaa tekstiä muutaman sivun sijasta koko asiakirjan sijaan.
Ensimmäinen asia, jonka haluat tehdä, on mennä eteenpäin ja luoda ilmainen tili. Se on vähän ärsyttävää, mutta jos et luo ilmaista tiliä, se muuntaa PDF-tiedostosi vain osittain koko dokumentin sijasta. Lisäksi, sen sijaan, että pystyt vain lataamaan vain 5 Mt: n asiakirjan, voit ladata jopa 100 Mt tiedostoa, jolla on tili.
Valitse ensin kieli ja valitse sitten haluamasi tulostusmuodot. Sinulla on pari vaihtoehtoa ja voit valita useamman kuin yhden, jos haluat. Alla Monisivuinen asiakirja, voit valita Sivunumerot ja valitse vain ne sivut, jotka haluat muuntaa. Sitten valitset tiedoston ja napsautat Muuntaa!
Muuntamisen jälkeen sinut viedään Dokumentit-osioon (jos olet kirjautunut sisään), josta näet kuinka monta vapaata sivua olet jättänyt ja linkit lataamiesi tiedostojen lataamiseen. Näyttää siltä, että sinulla on vain 25 sivua ilmaiseksi päivässä, joten jos tarvitset enemmän, sinun on joko odotettava vähän tai ostettava lisää sivuja.
Online OCR teki erinomaisen työn PDF-tiedostojen muuntamisesta, koska se pystyi ylläpitämään tekstin todellista ulkoasua. Testissä otin Word-dokumentin, joka käytti luoteja, eri fonttikoot jne. Ja muunsi sen PDF-muotoon. Sitten käytin Online OCR muuntaa sen takaisin Word-muodossa ja se oli noin 95% sama kuin alkuperäinen. Se on melko vaikuttava minulle.
Lisäksi, jos aiot muuntaa kuvan tekstiksi, Online OCR voi tehdä sen yhtä helposti kuin poimia tekstiä PDF-tiedostoista.
Koska puhumme kuvasta tekstin OCR, haluan mainita toinen hyvä sivusto, joka toimii todella hyvin kuvia. Vapaa Online OCR oli erittäin hyvä ja erittäin tarkka, kun otettiin tekstiä koekuvilta. Otin pari kuvaa iPhonesta kirjojen, lehtien jne. Sivuilta ja olin yllättynyt siitä, kuinka hyvin se pystyi muuttamaan tekstin.
Valitse tiedosto ja napsauta sitten Lataa-painiketta. Seuraavassa näytössä on pari vaihtoehtoa ja esikatselukuva. Voit rajata sen, jos et halua OCR: n koko asiaa. Napsauta sitten OCR-painiketta ja muunnettu teksti näkyy kuvan esikatselun alapuolella. Sillä ei myöskään ole rajoituksia, mikä on todella mukavaa.
Verkkopalvelujen lisäksi on olemassa kaksi freeware-PDF-muunninta, jotka haluan mainita, jos tarvitset paikallisesti tietokoneellasi toimivia ohjelmistoja suorittamalla tulokset. Online-palveluilla tarvitset aina Internet-yhteyden, joka ei välttämättä ole kaikkien käytettävissä. Huomasin kuitenkin, että freeware-ohjelmien tulosten laatu oli huomattavasti huonompi kuin verkkosivustojen tulokset.
A-PDF Text Extractor on freeware, joka tekee melko hyvää työtä tekstin poistamisesta PDF-tiedostoista. Kun olet ladannut sen ja asentanut sen, valitse PDF-tiedosto valitsemalla Avaa. Aloita prosessi valitsemalla sitten Pura teksti.
Se pyytää sinua sijainnin tallentamaan tekstin tulostustiedoston ja sitten se alkaa purkaa. Voit myös napsauttaa painiketta Vaihtoehto -painiketta, jonka avulla voit valita vain tietyt sivut poimimaan ja uutotyypiksi. Toinen vaihtoehto on mielenkiintoinen, koska se erottaa tekstin eri asetteluissa ja kannattaa kokeilla kaikkia kolmea, jotta näet, mitkä antavat sinulle parhaan tuoton.
PDF2Text Pilot tekee erinomaisen tekstinpoiston. Sillä ei ole vaihtoehtoja; voit vain lisätä tiedostoja tai kansioita, muuntaa ja toivoa parasta. Se toimi hyvin joissakin PDF-tiedostoissa, mutta useimmissa niistä oli lukuisia asioita.
Napsauta vain Lisää tiedostoja ja valitse sitten Muuntaa. Kun muunnos on valmis, avaa tiedosto valitsemalla Selaa. Mittarilukema vaihtelee tämän ohjelman avulla, joten älä odota paljon.
Lisäksi on syytä mainita, että jos olet yritysympäristössä tai voit saada kätesi Adobe Acrobatin kopioista töistä, voit todella saada paljon parempia tuloksia. Acrobat ei ilmeisesti ole ilmainen, mutta sillä on mahdollisuus muuntaa PDF Word-, Excel- ja HTML-muotoon. Se myös parhaiten säilyttää alkuperäisen asiakirjan rakenteen ja muuntaa monimutkaista tekstiä.