我搞了个python code来对 22.15 这门课的材料里面的slides各自最后一页(Summary)进行抽取,汇总成了真·summary。
办法如下:
import os
files = [f for f in os.listdir('.') if os.path.isfile(f)]
files = filter(lambda f: f.endswith(('.pdf', '.PDF')), files)
from PyPDF2 import PdfFileReader
for f in files:
pagenum = PdfFileReader(open(f, 'rb')).getNumPages()
code = 'gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER -dFirstPage=' + str(pagenum) + ' -dLastPage=' + str(pagenum) + '24 -sOutputFile=' + f + '1 ' + f
os.system(code)
files = [f for f in os.listdir('.') if os.path.isfile(f)]
files = filter(lambda f: f.endswith(('.pdf1', '.PDF')), files)
code = 'gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -sOutputFile=summary.pdf '
for f in files:
code = code + f + ' '
os.system(code)
for f in files:
os.system('rm '+f)
说白了就是每个pdf文件我都弄个临时文件.pdf1,只包含最后一页,然后融合在一起,再把临时文件删了。我感觉还不错吧。