Het is de bedoeling dat er in een map gezocht word naar stukken text in bestanden.
Bestandsformaten kunnen zijn :
rtf
pdf
xpf
Deze kunnen niets anders zijn, er worden geen manuele handeling uitgevoerd om te converteren.
c++ (qt)
De vraag : welk van de 3 formaten zal het makkelijkst zijn om de bewerkingen op uit te voeren?
(Ikzelf heb geen word(office) en de rtf is ofwel leeg ofwel vol code bij mij thuis.)
c++ bestanden inlezen, text bewerken
-
- Elite Poster
- Berichten: 1358
- Lid geworden op: 14 mei 2008, 15:36
- Locatie: Bevergem :-)
- Uitgedeelde bedankjes: 272 keer
- Bedankt: 178 keer
Notepad++ zoeken in files op een directory
[
Post made via mobile device ]
[

-
- Deel van't meubilair
- Berichten: 29849
- Lid geworden op: 28 okt 2003, 09:17
- Uitgedeelde bedankjes: 434 keer
- Bedankt: 1972 keer
Ik begrijp de vraag eigenlijk niet goed... misschien toch nog eens uitleggen ?
- Heronic
- Elite Poster
- Berichten: 2748
- Lid geworden op: 20 okt 2003, 16:41
- Locatie: Bij mijn vrouw
- Uitgedeelde bedankjes: 426 keer
- Bedankt: 208 keer
Wel heb lijsten die in :
rtf
pdf
xpf
kunnen komen. (Dat is al opslaan als.) Bijkomende handelingen (rtf nog eens openen in word en opslaan als doc ofzo zijn helaas te veel gevraagd wegens te veel werk.)
Elk bestand is in feite een lijst die moet gefilterd worden. Ik moet er dus data uit kunnen halen om in een db te kunnen stoppen.
Plan b is dat ik een dropbox van op de bron pc share met mijn nas en daar een script over laat lopen, die kan eventueel opzetten en met sed en awk.
Resultaat via txt terug naar de dropbox. En dan op de bronpc klein programma'tje dat het resultaat (txt) gaat bekijken, eventuele melding genereren en aanpassing op txt uitvoeren.
Plan a is die hele omweg via dropbox achterwege laten en gewoon een klein programma'tje maken. Maar wat is dan de meest makkelijke/minst omslachtige manier?
rtf
xpf
kunnen komen. (Dat is al opslaan als.) Bijkomende handelingen (rtf nog eens openen in word en opslaan als doc ofzo zijn helaas te veel gevraagd wegens te veel werk.)
Elk bestand is in feite een lijst die moet gefilterd worden. Ik moet er dus data uit kunnen halen om in een db te kunnen stoppen.
Plan b is dat ik een dropbox van op de bron pc share met mijn nas en daar een script over laat lopen, die kan eventueel opzetten en met sed en awk.
Resultaat via txt terug naar de dropbox. En dan op de bronpc klein programma'tje dat het resultaat (txt) gaat bekijken, eventuele melding genereren en aanpassing op txt uitvoeren.
Plan a is die hele omweg via dropbox achterwege laten en gewoon een klein programma'tje maken. Maar wat is dan de meest makkelijke/minst omslachtige manier?
“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
My excuse? Being dunk. Whats yours?
-
- Deel van't meubilair
- Berichten: 29849
- Lid geworden op: 28 okt 2003, 09:17
- Uitgedeelde bedankjes: 434 keer
- Bedankt: 1972 keer
Dus je wil eigenlijk het RTF, PDF, ... formaat gaan parsen en er enkel de tekst uithalen ? Mmm... lijkt me niet echt eenvoudig... voor zoiets kan je hopen dat er een library bestaat want dat zelf schrijven is een hele klus (maar niet onmodelijk, van PDF weet ik dat er een developers manual is die de structuur beschrijft).
Ik denk dat je best eens met de bron gaat praten... en vraagt of men niet steeds een CSV of zo kan aanleveren.
Ik denk dat je best eens met de bron gaat praten... en vraagt of men niet steeds een CSV of zo kan aanleveren.
- Heronic
- Elite Poster
- Berichten: 2748
- Lid geworden op: 20 okt 2003, 16:41
- Locatie: Bij mijn vrouw
- Uitgedeelde bedankjes: 426 keer
- Bedankt: 208 keer
Jazeker alles is al eens gedaan.
Ondertussen al 2 linux bestaande cli programma'tjes op los gelaten zonder resultaat.
latex2rtf zal ik vrijdag avond eens bekijken.
Oostende - lokeren nu
Ondertussen al 2 linux bestaande cli programma'tjes op los gelaten zonder resultaat.
latex2rtf zal ik vrijdag avond eens bekijken.
Oostende - lokeren nu

“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
My excuse? Being dunk. Whats yours?