XPDF::PDF資料をnamazuにたべさせる Part1

これまで、インターネットや雑誌付録で見つけたPDFの資料がいろいろとありますが、資料を整理して、いつでも情報を拾えるようにするのは、なにかとメンドクサイなぁ、とおもっていたので、だったら、一括で検索出来るようにすればいいじゃん!と思いついてこんなの作ってみました(大分前ですが)

ということで、今回は、xpdf+namazu でドキュメント検索の仕組みです

用意する物は

xpdf:http://www.foolabs.com/xpdf/download.html
namazu:http://www.namazu.org/index.html.ja#download

まずは、xpdf ですが、上記URLから、ソースをダウンロード。
合わせて日本語パッケージも。

  1. [root@buri src]# wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02.tar.gz
  2. [root@buri src]# wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-japanese.tar.gz

freetype は、既に入っていたので省略。

  1. [root@buri src]# tar zxvf xpdf-3.02.tar.gz
  2. [root@buri src]# cd xpdf-3.02
  3. [root@buri xpdf-3.02]# ./configure --enable-multithreaded
  4. -snip-
  5. configure: WARNING: Couldn't find Motif
  6. configure: WARNING: Couldn't find FreeType
  7. configure: WARNING: -- You will be able to compile pdftops, pdftotext,
  8. pdfinfo, pdffonts, and pdfimages, but not xpdf or pdftoppm

warningがでましたが、今回は、pdftotextだけが必要なので、xpdf は無くてもOK。

  1. [root@buri xpdf-3.02]# make
  2. [root@buri xpdf-3.02]# make install

これでOK。
続いて日本語パッケージを展開して該当フォルダへコピー

  1. [root@buri xpdf-3.02]# cd ..
  2. [root@buri src]# tar zxvf xpdf-japanese.tar.gz
  3. [root@buri src]# cd xpdf-japanese

READMEを読むと、中身をコピーしろと書いてあるので、コピー
その後、xpdfrxへ設定を追加。

  1. [root@buri xpdf-japanese]# cp -R * /usr/local/share/xpdf/japanese/
  2. [root@buri xpdf-japanese]# cat add-to-xpdfrc >> /usr/local/etc/xpdfrc

これで、完了。

次は、namazu。
既にいれてあったので、これも省略。
そして、今回は、phpモジュールもinstall

  1. [root@buri namazu-2.3.1]# wget http://keihanna.dl.sourceforge.jp/php-i18n/14174/namazu-2.3.1.tgz
  2. [root@buri namazu-2.3.1]# tar zxvf namazu-2.3.1.tgz
  3. [root@buri namazu-2.3.1]# cd namazu-2.3.1
  4. [root@buri namazu-2.3.1]# phpize
  5. [root@buri namazu-2.3.1]# ./configure --with-namazu
  6. [root@buri namazu-2.3.1]# make
  7. [root@buri namazu-2.3.1]# make install

インストール終ったら、php.iniファイルへ、dllの読み込みを設定

  1. [root@buri namazu-2.3.1]# vi /usr/local/lib/php.ini

---Added---
 [Namazu]
 # Namazu Module
 extension = namazu.so
---Added---

んで、apacheを再起動して、phpinfo でnamazuがインストールされたことを確認。

これで、環境構築は完了。あとは、PDFを食べさせて見るところを作ればOK。

次回へ続きます~

Tags for XPDF::PDF資料をnamazuにたべさせる Part1


■お知らせ
鯖の電気代が2万/月を超えました。新しい鯖を購入して電気代を下げるようにしましたが、ご協力いただける方がいらっしゃいましたら、よろしくお願いします。
カンパしなくても、鯖は存続しますので、WebMoney余ってるよ~という方だけ、よろしくお願いしますm(__)m
WebMoney ぷちカンパ
カスタム検索