kasulikke artikleid

Kuidas luua PDF-failide otsitavat arhiivi?

Selle nädala Goldavelez.com tehniliste nõuannete veerus - pidage oma küsimusi alles, inimesed! - aitame me lugejat, kellel on liiga palju olulisi pabereid, mis vajavad maagilise ülemineku digitaalsesse valdkonda. Vähemalt kõlab see palju põnevamalt kui “Optiline karakterituvastus”, mis ei keera tegelikult keelt.

Goldavelez.com lugeja Phil kirjutab:

Täname lahkete sõnade eest, Phil! Mul on hea meel aidata - mitte meelituste pärast, vaid seetõttu, et teie küsimus on selline, mille peale paljud lugejad on ilmselt mõelnud (ka mina kaasa arvatud). Mul on terve rida asju, mida tahaksin füüsilisest maailmast digitaalmaailma kolida, et saaksin siis Marie Kondo originaaldokumendid ja fotod unustusse vajuda. Paberipakid ei paku mulle rõõmu.

Teil on mõned võimalused, mida saate proovida. Alustaksin ilmselgega: Google. Eeldades, et loote PDF-e, laadige fail (id) üles Google Drive'i. Paremklõpsake mis tahes üksikul PDF-failil, hõljutage hiirekursorit kursori „Ava koos” kohal ja valige „Google Docs”. Seejärel proovib Google käitada teie PDF-failil mõnda OCR-i ja te peaksite saama saadud faili dokumendina salvestada. Seejärel saate selle dokumendi (ja kõigi muude teisendatud dokumentide) kaudu otsida Drive'i kaudu.

Mida rohkem ma selle peale mõtlen, tundub see lahendus pisut ebalegantne, arvestades, kui palju faile peate töötama. Selle asemel võiksin proovida sellist tarkvara nagu TesseractStudio.Net - või lihtsalt Tesseract OCR, kui te ei karda käsurida. Seda peaksite saama kasutada failidest OCR-andmete loomiseks ja saate neid otsida otse Windowsi või macOS-i kaudu. OCRmyPDF on veel üks võimalus, mis sarnaneb Tesseract OCR-iga, kuid jällegi peate mängima tippitud käskudega, et rakendada failidele OCR. Pole GUI-d ega ka (otsest) Windowsi tuge.

Samuti on seal sisseehitatud OCR-iga kaasasolev avatud lähtekoodiga dokumentide kataloogimise tööriist Paperwork, mida kindlasti kaaluksin, arvestades, et see on mõeldud kõik-ühes tarkvaraks dokumentide arhiveerimiseks, sortimiseks ja otsimiseks. See kõlab nagu see võib olla just see, mida otsite.

Ma pole PDF-XChange Viewerit kasutanud, kuid teised on seda valikuliselt soovitanud. Tasuta versioon laseb teie PDF-idesse vesimärke, kuid selle abil saab piltidest PDF-e luua ja kui mul on õigus, lisage OCR neile olemasolevatele PDF-idele. Tasub uurida, isegi kui see pole ideaalne (tasuta) lahendus. Sarnaselt saab FreeOCR võtta teie pilte või PDF-e, rakendada OCR-i ja eksportida tulemusi lihttekstifailide või Wordi dokumentidena. Kui te ei soovi oma arhiivides otsimist nii teha, on see valik.

Tasuliste lahenduste osas on alati olemas Adobe Acrobat Pro või Foxit PhantomPDF . Mõlemad võimaldavad teil lisada OCR-faile PDF-idele ja te peaksite saama kõiki oma dokumente töödelda suure pakkina (või luua skripti, mis teeb seda kaustade väärtusega sisuga). Võib-olla õnnestub teil see rakendus rakenduste tasuta prooviversioonide ajal isegi korda saada, kui nad ei sea oma OCR-võimalustele piiranguid. Olen ka näinud, kuidas teie probleemiga teised leiavad edu, kasutades sellist rakendust nagu PDF-tekstituvastus, mis võiks olla odavam alternatiiv.

See on kõik, mida ma võin peas mõelda (ja väikese uurimisega). Loodetavasti töötab üks neist lahendustest teie jaoks välja - ilma väikese vaeva kulutamata. Kirjutage tagasi ja andke mulle teada, milline rakendus töötas teie jaoks kõige paremini!

Tech 911 Kas teil on mõni tehniline küsimus, mis hoiab teid öösel üleval? Meile meeldiks sellele vastata! E-post, mille teemareale on kirjutatud "Tech 911".