to je u ovom slucaju isuvise uzaludan posao
Najbolje je lepo kreatora obavestiti i da posalje kako valja.
Jeste najbolje, ali problem nastaje kada ne znaš kreatora
U međuvremenu, malo sam kopao i pronašao rešenje…verovatno nije baš najelegantnije na svetu, ali (može da) završi posao
Prvo, instaliraj
sudo apt-get install python-pdfminer
Zatim otvori terminal u direktorijumu gde ti se nalazi pdf koji hoćeš da obradiš (kod mene sam sve prebacio na desktop, zbog slika), i zadaj komandu
pdf2txt -o fajl.txt fajl.pdf
dobićeš txt fajl sa problematičnim slovima koja više nisu praznine, nego su označena kodovima… (cid:255) je malo “đ”, (cid:253) veliko “Č” itd
Sada dobijeni txt otvoriš u Open/Libre ofisu, ideš na Edit/ Find&Replace, i u prozorčetu koje se otvori, u Search polje ukucaš željeni kod, u replace polje slovo koje će ga zameniti, klikkneš na Replace All i za sekundu su kodovi zamenjeni ispravnim slovima…ovu operaciju ponoviš onoliko puta koliko ima nedostajućih naših slova (mislim da ih je bilo ukupno 4)
U prilogu je skrinšot koji bolje od mene objašnjava kako se šta radi, kao i problematični zakon
Jedini problem, koji ne umem za sada da rešim, je formatiranje, koje moraš ručno da odradiš u ofisu, ali i to je za nijansu bolje od ručne zamene svih nedostajućih slova u fajlu
Srećno
View attachment 1015
View attachment 1016