Pdf cikk szöveg tisztítás

Probléma lehet a pdf-ből átmásolt szövegek esetében az:

  • ő és ű betűkkel (kalaposak, a két vessző helyett),
  • új sor karakterrel (nem látható wordpress szerkesztés közben, de a cikk tördelését nagyban bonyolítja, mivel új sor kezdődik paragrafuson belül és a kinézetet rontja.)

Ezen problémák tömeges kezelésére (kézzel persze mindegyik javítható wordpress-ben) az alábbi javasolt.

ő és ű

A pdf cikk teljes szövegét másold egy sima text editorba – windows-ban pl. notepad.exe vagy notepad++.exe (https://notepad-plus-plus.org). Figyelj a hasábok sorrendjére – a szöveg maradjon változatlan.

Majd jelölj ki a szövegben egy “õ”-t, másolás (ctrl+c); majd Szerkesztés / Csere menüpont (vagy notepad++-ban Keresés/Csere), Keresendő: (ctrl+v); megjelenik az “õ”; Csere erre: ő; “Az összes cseréje” gombra mindet cseréli.

Screenshot from 2018-02-09 10:32:42

Ugyanez a teendő a kalapos ű-vel: “û”-t cseréljük “ű”-re. Kis- és nagybetűket javíthatjuk a cikkben kézzel.

Új sor karakter törlés

Ez csak a notepad++-ban lehetséges.

Keresés / Csere menüpont, a “Keresési mód”-ot állítsuk “Bővített”-re, majd a “Keresendő”-höz írjuk be: “\n\r”; “Csere erre” -be pedig egy szóközt.

Screenshot from 2018-02-09 10:40:56

Ugyanezt végezzük el:

  • csere “\n”, szóközre
  • csere “\r”, szóközre

Így néz ki majd kb. (vagy egy sorban az egész)

Screenshot from 2018-02-09 10:44:40

Ezt a szöveget jelöljük ki és másoljuk a wordpress cikkbe.