Compress PDF

Alles over programmeren en development binnen de IT-wereld
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Kent er iemand een tool (of een library) om PDF files te compresseren (in essentie de images erin) ?

Bij een zoektocht kan ik er heel wat vinden maar dit zijn meestal online tools die beperkt zijn in gebruik.
Gebruikersavatar
cadsite
Elite Poster
Elite Poster
Berichten: 6466
Lid geworden op: 20 jan 2015, 15:10
Locatie: Kortrijk
Uitgedeelde bedankjes: 216 keer
Bedankt: 460 keer
Recent bedankt: 7 keer

Bericht

InDesign?
Daar kan je bepalen welke resolutie de afbeeldingen moeten hebben.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

InDesign is volgens mij een DTP pakket... geen idee of dat PDF's kan verwerken.

Ik zoek een tool (ideaal in Java) waarbij ik gewoon "compress pdfin.pdf pdfout.pdf" kan opgeven en die z'n ding doet.
Gebruikersavatar
Belgissschenaap
Elite Poster
Elite Poster
Berichten: 922
Lid geworden op: 21 nov 2020, 06:01
Uitgedeelde bedankjes: 91 keer
Bedankt: 112 keer

Bericht

Kan mutool (van mupdf) dit niet? Weet niet hoe de compressie exact gaat, maar handige tool, en is command line based zoals je aangeeft te willen.

https://mupdf.com/docs/mutool.html
Gebruikersavatar
Dizzy
Elite Poster
Elite Poster
Berichten: 11009
Lid geworden op: 06 dec 2009, 12:28
Locatie: Hier ter plaatse
Uitgedeelde bedankjes: 295 keer
Bedankt: 492 keer

Bericht

DarkV schreef:InDesign is volgens mij een DTP pakket... geen idee of dat PDF's kan verwerken.
Indesign kan dit zeker, is een basisonderdeel van het programma. ALs je drukwerk klaarmaakt moet dat ook naar een drukker en PDF is nog altijd een veelgebruikt formaat daarvoor. Je kan in Indesign instellen precies op wat je wil comprimeren. Het is uiteraard wel een duur programma dus als je het enkel hiervoor gebruikt dan is het misschien wat overkill.
Wil je iemand kwaad maken, vertel hem dan leugens. Wil je iemand razend maken, vertel hem dan de waarheid.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Belgissschenaap schreef:Kan mutool (van mupdf) dit niet? Weet niet hoe de compressie exact gaat, maar handige tool, en is command line based zoals je aangeeft te willen.
Ik kan alvast niets vinden van compressie op hun website. Je hebt in essentie twee vormen van compressie van een PDF, puur de tekst maar daar valt meestal niets op te winnen, en de images die in de PDF zitten (en mogelijks een hoge resolutie hebben). De tool die ik zoekt haalt deze laatste eruit, compressed ze en vervangt de oorspronkelijke image in de PDF.
Dizzy schreef:Indesign kan dit zeker, is een basisonderdeel van het programma.
Ik vermoed dat Indesign die kan/doet voor de PDF wordt aangemaakt... ik vertrek van bestaande PDF's... maar het is ook totale overkill moest het programma het kunnen.
Gebruikersavatar
Belgissschenaap
Elite Poster
Elite Poster
Berichten: 922
Lid geworden op: 21 nov 2020, 06:01
Uitgedeelde bedankjes: 91 keer
Bedankt: 112 keer

Bericht

DarkV

Sorry verkeerde link
https://mupdf.com/docs/manual-mutool-convert.html

Elke pdf tool die comprest zal ook de afbeeldingen comprimeren. Je moet niet iets specifiek hebben voor afbeeldingen, gewoon een totale compressie.
Maar dit kan dat dus verwezenlijken
PDF output

With PDF output, we will create a new PDF file that matches the visual appearance. The PDF output is still a work in progress, so some features may not work.

If the input is PDF, the output will have nothing in common except the visual appearance. All bookmarks, annotations, forms, etc, will be thrown away. If you want to do a PDF to PDF conversion, 'mutool clean' is a better tool to use.

The PDF output options are:

decompress
Decompress all streams (except compress-fonts/images).
compress
Compress all streams.
compress-fonts
Compress embedded fonts.
compress-images
Compress images.

ascii
ASCII hex encode binary streams.
pretty
Pretty-print objects with indentation.
linearize
Optimize for web browsers.
sanitize
Clean up graphics commands in content streams.
garbage
Garbage collect unused objects.
garbage=compact
... and compact cross reference table.
garbage=deduplicate
... and remove duplicate objects.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Belgissschenaap schreef:Elke pdf tool die comprest zal ook de afbeeldingen comprimeren.
In m'n zoektocht ben ik er toch al enkele tegen gekomen die louter de tekst compresseren (wat soms zelfs een groter bestand geeft).
Belgissschenaap schreef:Maar dit kan dat dus verwezenlijken
Ik heb zonet enkele testen gedaan en m'n PDF is gewoon corrupt en bijna alle images zijn precies verdwenen :eek:

mutool convert -O compress -o compressed.pdf test.pdf
Gebruikersavatar
cadsite
Elite Poster
Elite Poster
Berichten: 6466
Lid geworden op: 20 jan 2015, 15:10
Locatie: Kortrijk
Uitgedeelde bedankjes: 216 keer
Bedankt: 460 keer
Recent bedankt: 7 keer

Bericht

In Indesign maak je inderdaad de pdf. Als ik van een pdf moet starten open ik die in illustrator.

Het gratis alternatief is Inkscape.
Daarin kan je de pdf importeren en eventueel zelfs aanpassen. Dan 'printen' naar een pdf. Daar kan je in de instellingen de dpi aanpassen van afbeeldigen.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

cadsite schreef:Daarin kan je de pdf importeren en eventueel zelfs aanpassen. Dan 'printen' naar een pdf. Daar kan je in de instellingen de dpi aanpassen van afbeeldigen.
Niet echt handig als je enkele tienduizenden PDF's moet doen :wink:
Gebruikersavatar
cadsite
Elite Poster
Elite Poster
Berichten: 6466
Lid geworden op: 20 jan 2015, 15:10
Locatie: Kortrijk
Uitgedeelde bedankjes: 216 keer
Bedankt: 460 keer
Recent bedankt: 7 keer

Bericht

Tsja...
Het had handig geweest mocht je dit op voorhand gezegd hebben natuurlijk. :roll:
Gebruikersavatar
Belgissschenaap
Elite Poster
Elite Poster
Berichten: 922
Lid geworden op: 21 nov 2020, 06:01
Uitgedeelde bedankjes: 91 keer
Bedankt: 112 keer

Bericht

@DarkV

Ik kan je inhoudelijk niet veel helpen, ben zelf nog in de beginfase van deze software beland. Omdat ik een specifiek iets zocht en deze tool tegen gekomen ben.

Anders eens MUtool create proberen?
https://mupdf.com/docs/manual-mutool-create.html met als source een pdf


Maar denk wel dat deze kan wat je wilt, na er wat mee te spelen tot je goed resultaat hebt en dan met *.BAT alles in bulk doen.


Anders kan FOXIT Phantom PDF je ook helpen, die comprimeert sowieso ook de afbeeldingen aar mijn ervaring.
Desnoods met een valse of trial licentie zoeken. DIe kan het ook in BULK doen, maar gaat wel tijd kosten natuurlijk.

Is niet command line based, maar je moet dan een action maken, da's soms ook wel eens een sleur. Zeker om auto save aan te krijgen. Lukt mij niet altijd en daarom dat ik die mutool gebruikt heb.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Belgissschenaap schreef:Anders eens MUtool create proberen?
Het was deze welke ik gebruikt heb (zie m'n command line hierboven).
Belgissschenaap schreef:Desnoods met een valse of trial licentie zoeken.
Dan zijn er genoeg tools... maar ik probeerde het "netjes" te houden.
Ordon
Elite Poster
Elite Poster
Berichten: 2644
Lid geworden op: 27 apr 2019, 04:52
Uitgedeelde bedankjes: 42 keer
Bedankt: 81 keer

Bericht

Met Ghostscript lukt dat ook en kan natuurlijk via de command line.

Op de website van Adobe. :lol:
PDF compress in Linux with command line utilities.

Het is altijd een heel geharrewar om het juiste resultaat te verkrijgen: grootte versus kwaliteit.

Code: Selecteer alles

Ghostscript compress pdf
In Google voor heel wat voorbeelden.
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Ordon schreef:Met Ghostscript lukt dat ook en kan natuurlijk via de command line.

Op de website van Adobe. :lol:
PDF compress in Linux with command line utilities.
Net geinstalleerd op het systeem en eerste resultaat ging van 124 KB naar 73 KB (40% compressie op een zeer eenvoudige PDF).

Morgen de nodige testen doen met wat complexere en grotere PDF's

Thanks :banana: :banana: :banana:
Gebruikersavatar
Sasuke
userbase crew
userbase crew
Berichten: 5585
Lid geworden op: 13 aug 2003, 18:25
Locatie: Vlaanderen
Uitgedeelde bedankjes: 214 keer
Bedankt: 426 keer
Recent bedankt: 2 keer

Bericht

Ordon was me al voor ... denk dat zowat elke Enterprise ontwikkelaar hiervoor Ghostscript gebruikt inderdaad :-) En al zeker icm Java.
Who the fxxk is General Failure and why is he reading my hard disk ?
Afbeelding
Gebruikersavatar
diepvries
Plus Member
Plus Member
Berichten: 176
Lid geworden op: 03 jan 2017, 12:40
Locatie: W-VL
Uitgedeelde bedankjes: 14 keer
Bedankt: 6 keer

Bericht

Ik heb ook ooit de zoektocht gedaan en ben dan op deze uit gekomen: http://www.freepdfcompressor.com/
Geen idee hoe die werkt met afbeeldingen maar met standaard documenten heb ik toch een succes rate van 9/10 :beerchug:
:???: Orange LOVE 150Mbps
:???: Fortinet 60F + Linksys LGS116P + UCK G2 Plus + UAP AC Pro
:???: OVH VOIP + Gigaset C530IP
:???: iPhone 13 256 GB - Proximus Zen
:???: iPhone XR 64 GB - Orange Go Plus
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

DarkV schreef:Morgen de nodige testen doen met wat complexere en grotere PDF's
Geen idee maar productie PDF's van zo'n 20 MB komen er uiteindelijk enkele honderden KB's groter uit :cry:

Ik heb al diverse settings geprobeerd maar de resultaten blijven slecht.
diepvries schreef:Ik heb ook ooit de zoektocht gedaan en ben dan op deze uit gekomen: http://www.freepdfcompressor.com/
Geen idee hoe die werkt met afbeeldingen maar met standaard documenten heb ik toch een succes rate van 9/10 :beerchug:
Aan de settings te zien gebruikt deze precies Ghostscript onderliggend.
UBremoved_15318
Elite Poster
Elite Poster
Berichten: 1081
Lid geworden op: 10 maa 2010, 12:32
Locatie: Kapellen
Uitgedeelde bedankjes: 23 keer
Bedankt: 51 keer

Bericht

DarkV schreef:
Geen idee maar productie PDF's van zo'n 20 MB komen er uiteindelijk enkele honderden KB's groter uit :cry:
Denk dat het vooral met de content heeft te maken, ik werk met pdf xchange editor, de bestanden waar ik op werk krijg ik ook niet echt kleiner, tenzij ik de kwaliteit zeer veel verlaag.

Het originele 300 pagina's tellende bestand van 50MB heb ik wel kunnen verkleinen naar 42MB met een van de tools, maar denk dat het meer een cleanup is van het bestand.
Gebruikersavatar
Sasuke
userbase crew
userbase crew
Berichten: 5585
Lid geworden op: 13 aug 2003, 18:25
Locatie: Vlaanderen
Uitgedeelde bedankjes: 214 keer
Bedankt: 426 keer
Recent bedankt: 2 keer

Bericht

Wat is de bron van je PDF ? Compressie achteraf is altijd minder efficiënt dan compressie op de source. Eventueel kan je beter focussen op de creatie van de pdfs ipv compressie achteraf ? E.g. xml/xslt optimalisatie ?
Who the fxxk is General Failure and why is he reading my hard disk ?
Afbeelding
DarkV
Elite Poster
Elite Poster
Berichten: 4018
Lid geworden op: 17 apr 2019, 09:47
Uitgedeelde bedankjes: 102 keer
Bedankt: 140 keer

Bericht

Via ILovePDF.com heb ik m'n 20 MB PDF gecompressed (default setting) naar zo'n 14 MB (27% compressie).

Op zich moet het dus lukken... maar dus niet met Ghostscript :-(

De bron van de PDF's zijn trouwens scans (hier werden al enkele aanpassingen gedaan), maar ook externe PDF's (waar we dus geen controle op hebben). Het probleem is dat deze nu voor wettelijke doeleinden moeten geupload worden in een extern systeem, alsook in onze eigen database worden opgeslagen (en dat neemt serieus toe als je enkele miljoenen PDF's hebt - gelukkig is maar een fractie daarvan echt te groot).