text aus Worddatei lesen



  • Hi,
    wie kann ich denn einen Text aus einer Worddatei bis zum Textende einlesen und auf dem Bildschirm ausgeben?

    ß



  • du könntest es so probieren:

    zeilenweise einlesen, alles wegschmeissen was nicht nach buchstabe, zeilenwechsel oder leerzeichen ausschaut und unter berücksichtigung der zeilenwechsel ausgeben...

    mfg



  • Hab ich schon probiert.
    Mit fscanf usw. gibt der mir immer nur 5 ASCII-Zeichen aus und dann ist Schluss!
    Sind auch immer dieselben ASCII-Zeichen ,unabhängig vom Text der in der Worddatei steht!



  • Das Word-Format ist a) geheim und b) ziemlich kompliziert aufgebaut. Wie wärs wenn du dir was einfacheres suchst? 🙂



  • Haha, so ein Blödsinn, als wenn das format geheim wäre 😃 lol.
    Das du nur die ersten 5 Zeichen bekommst liegt vermutlich daran das das 6te eine binäre Null ist und dein Programm denkt der String wäre da zu ende.
    Selber Programmieren von sowas wird schwierig und sehr aufwendig. Such dir lieber was fertiges.



  • Original erstellt von etechniker:
    Haha, so ein Blödsinn, als wenn das format geheim wäre 😃 lol.

    Wo finde ich denn die Spezifikation?



  • StarOffice kann doch auch docs lesen und schreiben ...

    Irgendwo habich mal ne gute Seite gefunden wo Excel und ich mein auch doc Dateien ziemlich gut spezifiziert waren, wenn ich die Seite in meiner 10km langen Favoritenliste wiederfinde poste ich die mal

    edit: hm hatte noch ne bessre aber zb bei http://www.wotsit.org/ ist was einfach mal bei google nach file formats schaun

    [ Dieser Beitrag wurde am 20.01.2003 um 14:19 Uhr von dreaddy editiert. ]



  • alle MS Office Formate sind closed.
    Es kann natürlich keine 100% geheimen Formate geben, größtenteils ist .doc und .xls,... schon bekannt. aber alles inoffiziell.

    wenn du schonmal StarOffice <-> MS Office dokumente ausgetauscht hast, dann weisst du das 🙂



  • alles reverse-engineered. Funktioniert meistens, aber nicht immer. Unter ner Spezifikation stell ich mir was anderes vor ...



  • Original erstellt von Bashar:
    alles reverse-engineered. Funktioniert meistens, aber nicht immer. Unter ner Spezifikation stell ich mir was anderes vor ...

    Ja klar, das rückt Microsoft bestimmt auch raus. Woher soll man das Format denn sonst haben wenn nicht "reverse-engineered"... Manchmal sind die Spezifikationen aus dem Inet aber auch nicht schlecht... (aber nicht immer)



  • Original erstellt von mi+chl:
    **du könntest es so probieren:

    zeilenweise einlesen, alles wegschmeissen was nicht nach buchstabe, zeilenwechsel oder leerzeichen ausschaut und unter berücksichtigung der zeilenwechsel ausgeben...

    mfg**

    Das KÖNNTE klappen, du muss die Datei dann aber Binär einlesen. Dann hast du aber nur den blanken Text. Keine Formatierungen, keine Bilder, keine Absätze...u.s.w.u.s.f.



  • Original erstellt von MaSTaH:
    Ja klar, das rückt Microsoft bestimmt auch raus. Woher soll man das Format denn sonst haben wenn nicht "reverse-engineered"... Manchmal sind die Spezifikationen aus dem Inet aber auch nicht schlecht... (aber nicht immer)

    Sag ich doch, es ist geheim. Ich weiß jetzt ehrlich gesagt nicht, ob du mir irgendwas mitteilen willst, oder ob du nur den Thread nicht ganz verfolgt hast.





  • dito



  • Du könntest doch die Word-Datei als *.txt abspeichern und dann die Daten auslesen??

    MfG RawBurner



  • wir sind hier im Ansi Forum, trotzdem möchte ich auf die WinApi verweisen, ich kann mir nicht vorstellen das OLE Objekte darin nicht abgedeckt werden. Und Word Dokumente sind OLE Objekte.

    Schaut mal danach, OLE.

    Gruß,
    Ole (nein, mein name hat nichts mit dem Objektformat zu tun :D)


Anmelden zum Antworten