SeyrüseferİhbarnameEmare → Pdf'yi Parçala ve Yönet

Pdf'yi Parçala ve Yönet

İhbarname - Emare
Pazartesi, 09 Şubat 2015

PDF belgeleri günümüzde özelikle eğitim ve bilim alanında bilgi paylaşımı açısından en yaygın dosya biçimi olarak kabûl edilebilir. Bu tür dosyalarla sıklıkla uğraşmak gerekli olduğunda daha verimli çalışabilmek için dosyayı görüntülemeye yarayan yazılımların sağladığından daha fazlasına ihtiyaç duyulması olağandır.

Böyle ihtiyaçların en yaygınları mevcut büyük bir .pdf belgesini sayfalara ayırmak, birkaç belgenin sayfalarını birleştirmek, şifrelemek veya şifrelemeyi kaldırmak olarak sayılabilir.

Bu ihtiyaca bağlı olarak bu amaçlara hizmet etmeye çalışan pek çok yazılım mevcuttur. Linux işletim sistemi altında karşılaştığım en iyi örnek olarak PDFtk (PDF tool kit) gösterilebilir. PDFtk kaynak kodundan [1] derlenebileceği gibi kullandığınız dağıtımın paket yöneticisi vasıtasıyla da sisteminize kurulabilir. Mesela debian tabanlı bir sistem kullanıyorsanız tek yapılması gereken aşağıdaki komutu çalıştırmaktır:

 

~ $ sudo apt-get install pdftk

 

PDFtk komut satırından çalışmak için tasarlanmıştır. Ayrıca artalanda PDFtk'yı çalıştıran grafik kullanıcı arayüzüne sahip muhtelif yazılımlar da mevcut görünmektedir. Bununla birlikte burada sadece PDFtk kullanılacaktır.

PDFtk'nın oldukça kapsamlı yeteneklerini görebilmek için yazılımın --help dosyası incelenebilir. Burada sadece birkaç temel uygulamadan bahsedilecektir.

İlk olarak deneme için parola korumalı bir belgeye ihtiyaç var; kaynak [2] den ISSW1 İstanbul 2005 faaliyetine ait sıkıştırılmış dosya indirildiğinde içinde 24 adet .pdf dosyası biçimde hazırlanmış makale elde edilecek.

Bu dosyalar nedense şifrelenmiş fakat parola da sıkıştırılmış dosyanın içinde ayrıca verilmiş: 8ISSW

Söz konusu makalelerden birini her açmak istediğimizde yukarıdaki parolayı tekrar girmek gerekiyor ki rahatsız edici bir durum. Ayrıca bu dosyaları bilgisayarınızın diskine kaydettiğinizi ve aradığınızı daha hızlı bulabilmek için bir yerel arama motoru kullandığınızı varsayarsak; şifrelenmiş dosyalar arama motoru tarafından indekslenemeyeceğinden daha sonra bulabilmeniz de pek mümkün olmayacaktır. Temelde bu iki sebeple söz konusu dosyaların korumalarının kaldırılması uygun olur. Bunu PDFtk ile yapmak gayet basit; uç birim komut satırında: (belgelerin bulunduğu dizinin içinde olduğumuzu düşünürsek)

 

~ $ pdftk 0-Odabasi.pdf input_pw 8ISSW output parolasıKaldırılmışDosya.pdf

 

Kırmızı eldeki şifrelenmiş dosyalardan birinin adı, yeşil parola, mavi ise elde edilecek yeni dosyanın adıdır. Böylece "Effect of Initial Bias on the Roll Response and Stability of Ships in Beam Seas" adlı dosyayı artık parola girmeden okuyabilirsiniz ve indeksleyebilirsiniz, eski dosya ise silinebilir. Parolası bilinmeyen bir dosyanın şifresini kırmak ise tamamen başka bir mevzudur.

İkinci olarak bu dosyayı tek tek sayfalara ayırmak istenirse:

 

~$ pdftk A=parolasıKaldırılmışDosya.pdf burst

 

Böylece deneme için kullanılan 17 sayfalık belge 17 ayrı sayfaya parçalanmış oldu. Eğer tek tek sayfalara ayırmak değil de mesela 7 ile 11 arasındaki sayfalar tek parça olarak elde edilmek istenirse bu defa:

 

~$ pdftk A=parolasıKaldırılmışDosya.pdf cat A7-11 output sayfalar-7-11.pdf

 

Belgelerin birleştirilmesinden de bahsetmek gerekirse, daha önce "burst" ile parçaladığımız belgenin mesela 3,5 ve 11. sayfalarını içeren yeni bir dosya oluşturmak istenirse:

 

~$ pdftk pg_0003.pdf pg_0005.pdf pg_0011.pdf cat output sayfalar-3-5-11.pdf

 

Dizin içindeki bütün sayfalar tekrar birleştirmek istenirse:

 

~$ pdftk *.pdf cat output hepsiBirleştirilmiş.pdf

 

Son olarak, daha önce elde edilen belgelerden birini (pg_0001.pdf) "deneme" parolası ile 128bit şifreleyerek biraz olsun üçüncü taraflardan korumak istenirse:

 

~$ pdftk pg_0001.pdf output şifrelenmişBelge.pdf user_pw deneme

 

Bu arada belirtmekte fayda var; giriş ve çıkış dosyası adlarında boşluk ve & gibi özel karakterler desteklenmiyor! ve kullanılmamalı. Türkçeye özgü harflerin kullanılmasında ise bir sıkıntı yok.

♦ Açıklamalar

1. ISSW: International Ship Stability Workshop [geri]

♦ Kaynaklar

1. Pdftk kaynak kodu: https://www.pdflabs.com/docs/install-pdftk-on-redhat-or-centos/
2. http://shipstab.org/files/Proceedings/ISSW/ISSW_2005_Istanbul_Turkey.zip
 







Telif Hakkı © 1997-2020 [uskudar.biz] - sürüm 5.5.1 - Bütün Hakları Saklıdır. Kullanım şartları için tıklayın!
Joomla! GNU/GPL lisansı altında özgür bir yazılımdır.