Wenku Doc Downloader

1. 下载“百度文库”文档,仅支持导出为txt文档或图片型的pdf。 2. “豆丁网”文档页面支持存储为图片型的pdf。

As of 2021-11-27. See the latest version.

You will need to install an extension such as Tampermonkey, Greasemonkey or Violentmonkey to install this script.

You will need to install an extension such as Tampermonkey or Violentmonkey to install this script.

You will need to install an extension such as Tampermonkey or Violentmonkey to install this script.

You will need to install an extension such as Tampermonkey or Userscripts to install this script.

You will need to install an extension such as Tampermonkey to install this script.

You will need to install a user script manager extension to install this script.

(I already have a user script manager, let me install it!)

You will need to install an extension such as Stylus to install this style.

You will need to install an extension such as Stylus to install this style.

You will need to install an extension such as Stylus to install this style.

You will need to install a user style manager extension to install this style.

You will need to install a user style manager extension to install this style.

You will need to install a user style manager extension to install this style.

(I already have a user style manager, let me install it!)

Author
JoyofFire
Ratings
0 0 0
Version
0.5
Created
2021-11-22
Updated
2021-11-27
Size
9.31 KB
License
GPL-3.0-only
Applies to

Wenku Doc Downloader 使用说明(经常更新,如高频使用请关注)

1 注意!

  1. 图片型的文档需要下载额外的脚本程序“图片下载合并器”(exe程序,约18M)来生成pdf文件,作者保证其安全性,如果无法信任可以不用。
  2. 附加程序【图片下载合并器】 链接: https://pan.baidu.com/s/1PTM6watxNlqs-jvvX6XKzg 提取码: abe9 该链接最后更新于:2021/11/24
  3. 【图片下载合并器】的启动速度取决于文档长度,如果文档超过100页,大概要等待10-15秒以上,请保持耐心。

2 目前不支持的情况

  1. 对表格型文档有限的支持(仅提取每个单元格中的文字,无法提取表格)
  2. 对图形与文字混合的文档有限的支持(仅能提取其中的纯文字,像括号箭头等图形无法提取)(如下图)。
  3. 将要到来的功能:存储图形与文字混合型文档为pdf文件(文字可以选中!),约一周内发布!
  • 图形与文字.png

3 功能

  1. 下载百度文库的文档,包括

    1. ppt型
    2. pdf型
    3. doc型的文字部分
  2. 对豆丁网文档的简单支持:以图片的形式保存为pdf文件(即使原文档是文字的而非扫描的图片)

4 使用方法:

  1. 打开你需要的百度文库页面,滑动到页面底部,能看到蓝色的长方形按钮。
  2. (如果需要)点击蓝色按钮(等同于点击“继续阅读”),将文档全部展开,直到按钮变成绿色。
  3. 点击绿色按钮,等待数秒,弹出下载弹窗。
  4. 如果下载的是【纯文本文档.txt】,直接保存到任意位置即可,这就是目标文档。
  5. 如果下载的是【urls.csv】,保存到【图片下载合并器】所在的文件夹内,然后按照其使用方法操作(下载的压缩包里有说明)。

5 图片型文档(需要下载额外的脚本程序↑)的额外说明

  1. 一个特殊的报错解决方案
    • 如果报错信息如图,那么说明文档页面没有完全加载
    • 解决办法就是在页面上下滚动浏览,保证图片都加载出来了,然后再次点击页面底部的绿色按钮即可。
    • 空url导致get失败.png

6 未来要加入的功能 & 不会实现的功能

  1. 支持图形与文字混合型文档导出pdf(中优先度:初步思路是用html转pdf)
  2. 对表格文档的完全支持(低优先度:找不到表格的html排版规律)
  3. 不支持导出docx文档。原因是html排版过于复杂,如何转换到dcox完全没有头绪。

7 备注:

  1. 本脚本完全免费,禁止被用于任何商业目的。
  2. 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致。
  3. 其他问题请联系 [email protected]
  4. Wenku Doc Downloader 发布于 greatest.deepsurf.us
  5. 不定时更新。