c++ bestanden inlezen, text bewerken

Alles over programmeren en development binnen de IT-wereld
Plaats reactie
Gebruikersavatar
Heronic
Elite Poster
Elite Poster
Berichten: 2748
Lid geworden op: 20 okt 2003, 16:41
Locatie: Bij mijn vrouw
Uitgedeelde bedankjes: 426 keer
Bedankt: 208 keer

Het is de bedoeling dat er in een map gezocht word naar stukken text in bestanden.

Bestandsformaten kunnen zijn :

rtf
pdf
xpf

Deze kunnen niets anders zijn, er worden geen manuele handeling uitgevoerd om te converteren.

c++ (qt)

De vraag : welk van de 3 formaten zal het makkelijkst zijn om de bewerkingen op uit te voeren?
(Ikzelf heb geen word(office) en de rtf is ofwel leeg ofwel vol code bij mij thuis.)
“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
johan.devos
Elite Poster
Elite Poster
Berichten: 1358
Lid geworden op: 14 mei 2008, 15:36
Locatie: Bevergem :-)
Uitgedeelde bedankjes: 272 keer
Bedankt: 178 keer
Provider
Te Koop forum

Notepad++ zoeken in files op een directory

[Afbeelding Post made via mobile device ]
Gebruikersavatar
Heronic
Elite Poster
Elite Poster
Berichten: 2748
Lid geworden op: 20 okt 2003, 16:41
Locatie: Bij mijn vrouw
Uitgedeelde bedankjes: 426 keer
Bedankt: 208 keer

Nee hoor : code of niks. Text krijg ik er niet uit.
“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
ubremoved_539
Deel van't meubilair
Deel van't meubilair
Berichten: 29849
Lid geworden op: 28 okt 2003, 09:17
Uitgedeelde bedankjes: 434 keer
Bedankt: 1972 keer

Ik begrijp de vraag eigenlijk niet goed... misschien toch nog eens uitleggen ?
Gebruikersavatar
Heronic
Elite Poster
Elite Poster
Berichten: 2748
Lid geworden op: 20 okt 2003, 16:41
Locatie: Bij mijn vrouw
Uitgedeelde bedankjes: 426 keer
Bedankt: 208 keer

Wel heb lijsten die in :
rtf
pdf
xpf
kunnen komen. (Dat is al opslaan als.) Bijkomende handelingen (rtf nog eens openen in word en opslaan als doc ofzo zijn helaas te veel gevraagd wegens te veel werk.)
Elk bestand is in feite een lijst die moet gefilterd worden. Ik moet er dus data uit kunnen halen om in een db te kunnen stoppen.

Plan b is dat ik een dropbox van op de bron pc share met mijn nas en daar een script over laat lopen, die kan eventueel opzetten en met sed en awk.
Resultaat via txt terug naar de dropbox. En dan op de bronpc klein programma'tje dat het resultaat (txt) gaat bekijken, eventuele melding genereren en aanpassing op txt uitvoeren.

Plan a is die hele omweg via dropbox achterwege laten en gewoon een klein programma'tje maken. Maar wat is dan de meest makkelijke/minst omslachtige manier?
“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
ubremoved_539
Deel van't meubilair
Deel van't meubilair
Berichten: 29849
Lid geworden op: 28 okt 2003, 09:17
Uitgedeelde bedankjes: 434 keer
Bedankt: 1972 keer

Dus je wil eigenlijk het RTF, PDF, ... formaat gaan parsen en er enkel de tekst uithalen ? Mmm... lijkt me niet echt eenvoudig... voor zoiets kan je hopen dat er een library bestaat want dat zelf schrijven is een hele klus (maar niet onmodelijk, van PDF weet ik dat er een developers manual is die de structuur beschrijft).

Ik denk dat je best eens met de bron gaat praten... en vraagt of men niet steeds een CSV of zo kan aanleveren.
2lan
Pro Member
Pro Member
Berichten: 263
Lid geworden op: 17 mei 2012, 13:31
Uitgedeelde bedankjes: 14 keer
Bedankt: 4 keer

brubbel
Elite Poster
Elite Poster
Berichten: 936
Lid geworden op: 04 jul 2012, 16:55
Uitgedeelde bedankjes: 81 keer
Bedankt: 179 keer

Zonder te gaan kijken, durf ik zomaar beweren dat alles al eens is gedaan. In Perl zal dat parsen van pdf/rtf/... in 3 lijnen kunnen.
Gebruikersavatar
Heronic
Elite Poster
Elite Poster
Berichten: 2748
Lid geworden op: 20 okt 2003, 16:41
Locatie: Bij mijn vrouw
Uitgedeelde bedankjes: 426 keer
Bedankt: 208 keer

Jazeker alles is al eens gedaan.
Ondertussen al 2 linux bestaande cli programma'tjes op los gelaten zonder resultaat.

latex2rtf zal ik vrijdag avond eens bekijken.
Oostende - lokeren nu ;)
“Insanity is my only means of relaxation "
My excuse? Being dunk. Whats yours?
Plaats reactie

Terug naar “Development”