読者です 読者をやめる 読者になる 読者になる

へっぽこびんぼう野郎のnewbie日記

けろけーろ(´・ω・`)!

Python + PDFQueryでPDFをParseして1列取得してみた

PDFQueryって? pdfをパースして、 xmlにしてくれて、 pythonのオブジェクトとしても使えるやつ 依存関係 lxmlとかいうのと PyQueryとかいうの (jQueryみたいに書けるように作ったやつ。すごい。ぼくjQuery知らんけど) こんな感じでここから取得できる PDF…