Anthropic PDF Skill
全栈 PDF:读、写、合并、拆分、水印、加密、表单填写、OCR。一切跟 .pdf 沾边的瑞士军刀。
作者: Anthropic
来源: github.com
安装
npx degit anthropics/skills/skills/pdf ~/.claude/skills/pdf pdf skill 覆盖了所有你本来要用半打 Python 库才能搞定的 PDF 操作。
它会根据你的任务自动选合适工具 —— pypdf、PyMuPDF 或 shell。
能做的事
- 读取与抽取:文本、表格、元数据、图片
- 合并与拆分:多份 PDF 合一,或一份拆成单页
- 批注:水印、页码、页眉
- 表单:用程序填 PDF 表单(详见 FORMS.md)
- 安全:加密、解密、密码保护
- OCR:把扫描版 PDF 变成可搜索
- 生成:从头创建带版式控制的新 PDF
反直觉的几点
- 默认用
pypdf跑快速操作,只在需要渲染或精确定位时才升级到PyMuPDF - 表单支持是真的——包含填写、扁平化、验证
- OCR 可以选择性应用(只对扫描页跑)
搭配使用
pptx:把演讲稿转成讲义 PDFdocx:把报告转 PDF 分发brand-guidelines:给最终 PDF 套 Anthropic 品牌风格
策展笔记
只要你的任务里出现 “.pdf” 这串字符,从这里开始。 多数人低估了”知识工作”里有多少其实是 PDF 折腾——这个 skill 让那部分消失。
调用示例
用 PDF skill 把这三份 Q4 报告合并成一份,每页加「CONFIDENTIAL」水印,
把扫描版附录 OCR 成可搜索的文本。