摸索了一番,答案已经比较明显了:
ArchiveBox
可以将网页保存成单文件,pdf,屏幕截图等,也可以保存,目前正在开发,不过dev分支和master差的比较远。
顺便想到微信机器人,于是写了个转发到微信机器人就能保存的脚本,打包好了。
用的是wechaty,免费的网页版uos协议。项目地址:
https://github.com/darknightlab/wechat-bot
模拟浏览器执行archivebox存档有点麻烦,作者说到现在还没有REST API,所以拿selenium做了一个。地址:
https://github.com/darknightlab/archivebox-python