TechDays

トップ «前の日記(2004-06-05) 最新 次の日記(2004-06-07)» 編集

2004-06-06 [長年日記]

_ 8時半におきて

勉強。すずしくてはかどる。

_ かさ

撥水が悪くなってきたので防水スプレーを吹きかけようか。もうスプレーしまくりで。

_ pdfからtextの抽出法

以前はacrobatのtext選択機能を使っていたのだが、いかんせんめんどうだった。前田さんからxpdfのお話を伺って早速試してみる。

1.Linux boxにxpdfのパッケージを入れる。apt-get install xpdf

2.適当なフォルダにhoge.pdfをアップロードする。

3.pdfがおいてあるフォルダで"pdftotext hoge.pdf"を実行

4.hoge.txtが作成されるので、回収。

5.exciteのtext翻訳で・・(ry

結構精度よく展開してくれるので重宝しています。2段組とかになってるドキュメントは若干内容が前後しますが、まぁそれくらいはてめえで直せってことで。前田さん有難うございます。(もともとはnamazuのお話をしていたのですが。。)


トップ «前の日記(2004-06-05) 最新 次の日記(2004-06-07)» 編集

過去の日記


2002|07|08|09|10|11|12|
2003|01|02|03|04|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|
2011|03|05|09|