Mal ganz was OT:
Ich habe ein Buch als pdf und kann es ohne Probleme als txt exportieren. Leider haben dann nicht nur die Absätze einen Zeilenumbruch, sondern auch jedes Zeilenenden.
Mein eBook kann nur txt & html einlesen und damit es lesbar ist bräuchte ich einen Fließtext. Gibt es eine Möglichkeit die Absätze als Fließtext zurück zu bekommen oder ist das schon im pdf nicht mehr vorhanden?
PDF zu TXT bzw. HMTL
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser
Unterstütze die Weiterentwicklung von TV-Browser
Danke, hab zwar geguckt ob Oo pdf importieren kann, aber an die Zwischenablage hab ich nicht gedacht. Es geht sogar vollautomatisch, wenn ich im Adobereader "kopiere Datei in die Zwischenablage" auswähle und in Oo "einfügen". Dann formatiert er sogar automatisch um.
Allerdings ist trotzdem einiges an Handarbeit nötig, da noch einige unnütze Umbrüche übrig bleiben und manche nicht durch "space" ersetzt wurden. Außerdem werden einige nicht überflüssige Umbrüche ebenfalls entfernt.
Ich gehe mal davon aus, das der ursprüngliche Fließtext im pdf nicht mehr vorhanden ist?!
Allerdings ist trotzdem einiges an Handarbeit nötig, da noch einige unnütze Umbrüche übrig bleiben und manche nicht durch "space" ersetzt wurden. Außerdem werden einige nicht überflüssige Umbrüche ebenfalls entfernt.
Ich gehe mal davon aus, das der ursprüngliche Fließtext im pdf nicht mehr vorhanden ist?!
Also mit pdf kenne ich mich nicht aus (das benutze ich einfach nur ).
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser
Unterstütze die Weiterentwicklung von TV-Browser
Hi,
vielleicht mal mit einem Konverter von PDF zu DOC versuchen: http://www.chip.de/downloads/Free-PDF-t ... 52033.html
Grüße aus dem Ruhrgebiet,
Jens
vielleicht mal mit einem Konverter von PDF zu DOC versuchen: http://www.chip.de/downloads/Free-PDF-t ... 52033.html
Grüße aus dem Ruhrgebiet,
Jens
sumsen ist buper
Danke, das doc sieht im Word Viewer wirklich gut aus, wie das pdf.
In Oo geladen leider absolut grauenhaft, Kraut und Rüben. In Works geladen ist alles linksbündig, inklusive der unerwünschten Umbrüche.
Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet. Ähnlich wie jpg, mpg und mp3.
In Oo geladen leider absolut grauenhaft, Kraut und Rüben. In Works geladen ist alles linksbündig, inklusive der unerwünschten Umbrüche.
Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet. Ähnlich wie jpg, mpg und mp3.
PDF ist fast wie ausdrucken. Grundsätzlich könnten OCR-Texterkennungsprogramme hilfreich sein. Die besseren sind darauf spezialisiert bei harten Umbrüche zu erkennen, dass es ursprünglich kein Umbruch war. Aber die gibt es kostenlos höchstens als Demo.TLupus hat geschrieben:Das pdf Format scheint wirklich ein Endformat zu sein, zum nachbearbeiten nicht sonderlich geeignet.
Biete selber TV-Daten an / Provide TV data yourself • Film-/Serienbeschreibungen → https://www.omdb.org