PDF zu TXT bzw. HMTL

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.

BBCode ist ausgeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Ansicht erweitern Die letzten Beiträge des Themas: PDF zu TXT bzw. HMTL

von Jo » 05 Sep 2008, 10:30

TLupus hat geschrieben:Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet.
PDF ist fast wie ausdrucken. Grundsätzlich könnten OCR-Texterkennungsprogramme hilfreich sein. Die besseren sind darauf spezialisiert bei harten Umbrüche zu erkennen, dass es ursprünglich kein Umbruch war. Aber die gibt es kostenlos höchstens als Demo.

von TLupus » 05 Sep 2008, 10:11

Danke, das doc sieht im Word Viewer wirklich gut aus, wie das pdf.

In Oo geladen leider absolut grauenhaft, Kraut und Rüben. In Works geladen ist alles linksbündig, inklusive der unerwünschten Umbrüche.

Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet. Ähnlich wie jpg, mpg und mp3.

von jensemann » 04 Sep 2008, 22:25

Hi,

vielleicht mal mit einem Konverter von PDF zu DOC versuchen: http://www.chip.de/downloads/Free-PDF-t ... 52033.html

Grüße aus dem Ruhrgebiet,
Jens

von ds10 » 04 Sep 2008, 21:51

Also mit pdf kenne ich mich nicht aus (das benutze ich einfach nur ;-)).

von TLupus » 04 Sep 2008, 18:13

Danke, hab zwar geguckt ob Oo pdf importieren kann, aber an die Zwischenablage hab ich nicht gedacht. Es geht sogar vollautomatisch, wenn ich im Adobereader "kopiere Datei in die Zwischenablage" auswähle und in Oo "einfügen". Dann formatiert er sogar automatisch um.

Allerdings ist trotzdem einiges an Handarbeit nötig, da noch einige unnütze Umbrüche übrig bleiben und manche nicht durch "space" ersetzt wurden. Außerdem werden einige nicht überflüssige Umbrüche ebenfalls entfernt.

Ich gehe mal davon aus, das der ursprüngliche Fließtext im pdf nicht mehr vorhanden ist?!

von ds10 » 04 Sep 2008, 11:25

PDF zu TXT bzw. HMTL

von TLupus » 04 Sep 2008, 11:09

Mal ganz was OT:

Ich habe ein Buch als pdf und kann es ohne Probleme als txt exportieren. Leider haben dann nicht nur die Absätze einen Zeilenumbruch, sondern auch jedes Zeilenenden.

Mein eBook kann nur txt & html einlesen und damit es lesbar ist bräuchte ich einen Fließtext. Gibt es eine Möglichkeit die Absätze als Fließtext zurück zu bekommen oder ist das schon im pdf nicht mehr vorhanden?

Nach oben