PDF zu TXT bzw. HMTL

Alles was sonst nicht passt. Bitte keine Werbung für Webseiten/Produkte usw.
Antworten
Benutzeravatar
TLupus
Platin Member
Beiträge: 1439
Registriert: 05 Dez 2003, 09:46
Wohnort: Berlin

PDF zu TXT bzw. HMTL

Beitrag von TLupus »

Mal ganz was OT:

Ich habe ein Buch als pdf und kann es ohne Probleme als txt exportieren. Leider haben dann nicht nur die Absätze einen Zeilenumbruch, sondern auch jedes Zeilenenden.

Mein eBook kann nur txt & html einlesen und damit es lesbar ist bräuchte ich einen Fließtext. Gibt es eine Möglichkeit die Absätze als Fließtext zurück zu bekommen oder ist das schon im pdf nicht mehr vorhanden?
ds10
Site Admin
Beiträge: 19191
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Beitrag von ds10 »

"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser
Benutzeravatar
TLupus
Platin Member
Beiträge: 1439
Registriert: 05 Dez 2003, 09:46
Wohnort: Berlin

Beitrag von TLupus »

Danke, hab zwar geguckt ob Oo pdf importieren kann, aber an die Zwischenablage hab ich nicht gedacht. Es geht sogar vollautomatisch, wenn ich im Adobereader "kopiere Datei in die Zwischenablage" auswähle und in Oo "einfügen". Dann formatiert er sogar automatisch um.

Allerdings ist trotzdem einiges an Handarbeit nötig, da noch einige unnütze Umbrüche übrig bleiben und manche nicht durch "space" ersetzt wurden. Außerdem werden einige nicht überflüssige Umbrüche ebenfalls entfernt.

Ich gehe mal davon aus, das der ursprüngliche Fließtext im pdf nicht mehr vorhanden ist?!
ds10
Site Admin
Beiträge: 19191
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Beitrag von ds10 »

Also mit pdf kenne ich mich nicht aus (das benutze ich einfach nur ;-)).
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser
jensemann
Server Hoster
Beiträge: 254
Registriert: 05 Mär 2005, 12:12
Wohnort: D-Ruhrgebiet

Beitrag von jensemann »

Hi,

vielleicht mal mit einem Konverter von PDF zu DOC versuchen: http://www.chip.de/downloads/Free-PDF-t ... 52033.html

Grüße aus dem Ruhrgebiet,
Jens
sumsen ist buper :-)
Benutzeravatar
TLupus
Platin Member
Beiträge: 1439
Registriert: 05 Dez 2003, 09:46
Wohnort: Berlin

Beitrag von TLupus »

Danke, das doc sieht im Word Viewer wirklich gut aus, wie das pdf.

In Oo geladen leider absolut grauenhaft, Kraut und Rüben. In Works geladen ist alles linksbündig, inklusive der unerwünschten Umbrüche.

Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet. Ähnlich wie jpg, mpg und mp3.
Jo
Site Admin
Beiträge: 11897
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

TLupus hat geschrieben:Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet.
PDF ist fast wie ausdrucken. Grundsätzlich könnten OCR-Texterkennungsprogramme hilfreich sein. Die besseren sind darauf spezialisiert bei harten Umbrüche zu erkennen, dass es ursprünglich kein Umbruch war. Aber die gibt es kostenlos höchstens als Demo.
Antworten