![]() |
Skript zum Text extrahieren Moinsen, ich arbeite an einem Projekt, bei dem ich mir eine Menge Arbeit sparen kann wenn ich ein Skript anwende. Ich würde euch hierbei gern um Rat Fragen: Der Ablauf ist wie folgt: das fiktive Skript liegt im selben Verzeichnis wie die doc-Dateien und soll nun den Inhalt jeder doc-Datei in eine gleichnamige txt-Datei schreiben. Da es sich hierbei aber um speziellere Zeichen handelt (mkhedruli Alphabet), brauche ich die txt-Dateien im UTF-8 kodiert. Meine Suche nach diesem relativ spezifischen Programm hat mir leider nicht geholfen. Kennt ihr ein solches Programm? Wahrscheinlich müsste ich es selbst schreiben.. aber so ein schrauber wie schrauber bin ich noch nicht :kaffee: |
Suchst du sowas wie das hier => Docx to Text convertor :wtf: |
Prinzipell schon - aber der hatte da nichts von utf-8 encoding stehen, deswegen habe ich den verworfen. |
Da bin ich wieder! Ich habe ein schönes schlankes Programm gefunden dass die Aufgabe erledigt. word2text converter |
Ja gibt ganz coole tools - auf der Arbeit brauche ich schonmal das hier: "Convert XLS" An Excel Converter software tool for XLS, CSV files etc. In deinem Fall hätten sie auch ein entsprechendes Tool gehabt, die trail Versionen sind normal "ausreichend" :D Kann sogar commandline und so tausende Sachen konvertieren Hier für Word: Easily Convert Document Files to/from PDF, Doc, HTML, RTF, TXT etc. with 'Convert Doc' from Softinterface Und die Produktübersicht: Produktübersicht |
Ich habe vor Jahren mal das Freeware Textverarbeitungsprogramm AbiWord (das sich per Script mit Befehlen von der Kommandozeile aus aufrufen lässt) dazu missbraucht .doc in .txt umzuwandeln. Kannst dir mal ansehen ob es auch .docx in deiner Zielsprache mit UTF 8 kann.. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:33 Uhr. |
Copyright ©2000-2025, Trojaner-Board