hasznos cikkek

Hogyan hozhatok létre kereshető PDF-fájlokat?

A heti Goldavelez.com technikai tanácsadási oszlopban - tartsa meg a kérdéseit, emberek! - segítünk egy olvasót, akinek túlságosan sok olyan fontos papíra van, amelyeknek varázslatos átmenetükre van szükségük a digitális birodalomba. Legalábbis sokkal izgalmasabbnak hangzik, mint az „Optikai karakterfelismerés”, amely nem igazán dobja ki a nyelvét.

A Goldavelez.com olvasója, Phil írja:

Köszönöm a kedves szavakat, Phil! Örülök, hogy segíthetek - nem a hízelgő miatt, hanem azért, mert a kérdése az, amire valószínűleg sok olvasó gondolkodott (beleértve magamat is). Van egy csomó dolgom, amelyeket szívesen áthelyeznék a fizikai világból a digitális világba, tehát Marie Kondo eredeti dokumentumait és fényképeit feledésbe tehetem. Papírhalmok nem hoznak örömöt.

Néhány lehetőség kipróbálható. Egy nyilvánvalóval kezdjem: a Google. Feltételezve, hogy PDF-fájlokat készít, töltse fel fájljait a Google Drive-ba. Kattintson a jobb gombbal bármelyik egyedi PDF-fájlra, vigye az egérmutatót az „Open With” elemre, és válassza a „Google Docs” elemet. A Google ezután megpróbál futtatni egy OCR-t a PDF-fájlján, és Önnek képesnek kell lennie arra, hogy a kapott fájlt dokumentumként mentse. Ezután ezen a dokumentumon (és bármilyen máson konvertálva) keresztül megkeresheti magát a Drive-ot.

Minél inkább gondolkodok rajta, ez a megoldás kissé elegánsnak tűnik, figyelembe véve, hogy hány fájllal kell dolgoznia. Ehelyett kipróbálhatom egy olyan szoftvert, mint a TesseractStudio.Net - vagy csak a Tesseract OCR-t, ha nem félsz a parancssortól. Ezt képesnek kell lennie arra, hogy OCR-adatokat hozzon létre a fájljaiból, majd közvetlenül a Windowson vagy a MacOS-on keresztül is megkeresheti azokat. Az OCRmyPDF egy másik olyan lehetőség, amely hasonló a Tesseract OCR-hez, de ismét gépelt parancsokkal fog játszani, hogy az OCR fájlokat alkalmazzon. Nincs GUI, és nincs (közvetlen) Windows támogatás.

Van még a papírmunka, egy nyílt forráskódú dokumentumkatalógus eszköz, amelyhez a közvetlenül beépített OCR tartozik, amelyet határozottan megfontolnék, tekintettel arra, hogy az egy-egy szoftverként lett tervezve a dokumentumok archiválására, rendezésére és keresésére. Úgy tűnik, hogy éppen ez az, amit keres.

Még nem használtam a PDF-XChange Viewer alkalmazást, de mások ajánlották ezt opcióként. Az ingyenes verzió vízjeleket dob ​​le a PDF-fájlokba, de képeket hozhat létre PDF-ekből, és ha helyesek vagyok, hozzáadhat OCR-t ezekhez a meglévő PDF-fájlokhoz. Érdemes feltárni, még akkor is, ha nem ez az ideális (ingyenes) megoldás. Hasonlóképpen, a FreeOCR el is készítheti képeit vagy PDF- eit, alkalmazhatja az OCR-t, és exportálhatja az eredményeket egyszerű szöveges fájlok vagy Word-dokumentumok formájában. Ha nem bánja, hogy így keres az archívumon, akkor ez egy lehetőség.

Ami a fizetett megoldásokat illeti, mindig ott van az Adobe Acrobat Pro vagy a Foxit PhantomPDF . Mindkettő lehetővé teszi az OCR hozzáadását a PDF-ekhez, és képesnek kell lennie arra, hogy az összes dokumentumot nagy kötegként feldolgozza (vagy hozzon létre egy szkriptet, amely ezt mappák értékű tartalmával teszi lehetővé). Lehet, hogy mindez megtörténik az alkalmazások ingyenes kipróbálása során, ha nem korlátozzák az OCR képességeiket. Láttam másokat is, akik a saját problémájukkal olyan alkalmazást használnak, mint a PDF OCR, amely olcsóbb alternatíva lehet.

Ez minden, amit a fejem tetejére gondolok (és egy kis kutatással). Remélhetőleg ezeknek a megoldásoknak az egyik az ön számára megfelelő - anélkül, hogy egy kis vagyonba kerülne. Írja vissza, és tudassa velem, melyik alkalmazás működött a legjobban az Ön számára!

Tech 911 Van olyan technikai kérdése, amely éjszaka feltartóztatja Önt? Szeretnénk válaszolni! E-mail a tárgysorban a "Tech 911" -rel.