[原创]百度豆丁文库免费下载教程


(文章ID:243)|(编辑:admin)|(点击次数:2707)|(添加时间:2011-11-25 15:47:01)|(添加IP:182.135.189.127)

    

[本站原创]

    百度文库、豆丁文库作为优秀的网络应用产品,分享了众多优秀的文档。但是,我们却经常因为没有足够的财富值,眼巴巴看着自己喜欢的文档却无法下载。这些文库页面都采用了flash作为文档浏览器,以显示图片的方式在页面显示预览,通过常规方法,无法获取源文件的原始位置,我们通常情况下采用的方法是无法下载文件的。

    对于这样的文档,许多人都有过想下载却又无法下载的经历。那么有没有下载的方法呢?其实网络上也有许多方法。本文结合自身应用的实际,介绍两种方法。

    方法一:屏幕截图法

    这当然是我们首先想到的方法。通过这种方式,可以把文档预览窗口内容作为图片保存下来,通过插入word文档、画图再编辑、OCR识别等方式进一步进行处理。

    具体操作流程如下:

    1、首先打开要下载的文档页面,按下屏幕截屏按键“Print Screen SysRq(有些键盘上为‘PrtScSysRq’等)”,将当前屏幕内容,截取为图片保存在剪贴板中。

    此外,采用其它的屏幕截图工具也可以截取当前屏幕内容,再复制即可。比如QQ的屏幕截图功能等。

    2、在画图软件中,按下粘贴菜单,截取文档部分,再复制粘贴到Word软件(或者其它软件)中进一步进行编辑。如图片1、图片2。

    

图片1

    

图片2

    3、如果获取的文档仅仅需要打印,则直接打印编辑后的Word文件即可。如果要对文档进行编辑,这样操作显然还不能满足要求。

    我们可以用OCR识别软件,将获取的图片识别为文字。支持汉字识别的软件非常多,目前也很成熟,识别率很高。对于百度文库、豆丁文库这样的标准字体的文件图片来说,都没有问题。推荐的OCR识别软件有:《汉王OCR》、《尚书七号》等。

    方法二:工具软件法

    支持免费下载百度文库、豆丁文库的软件有许多,笔者经过试用和比较,推荐采用《易读文档下载器》。

    该软件运行在.Net Framework 2.0库环境下(需要单独安装),无需安装,解压直接点击“DocLibDownload.exe”可执行文件即可运行,这个软件同时支持百度文库和豆丁文库,使用时,只需把包含文档的网页地址复制到软件中,软件即开始了自动下载。如下图:

    

    

图片3

    稍等片刻即可完成下载,打开软件所在目录,就可以看到下载完成后生成的两个文件,如下图所示。

    

    

图片4

    这两个文件分别是Pdf格式电子书文件和txt格式文本文件。其中Pdf格式的电子书和原文件有完全一致的分页格式,无需再进行排版,方便打印,但是也有一个缺点,即文件不可以再编辑修改。Txt格式的文本文件,是软件根据所获取的图片通过Ocr光学识别原理识别文字的文本文件,优点是方便编辑,但是同样也存在缺点,其缺点是无法识别图片(文中插图在软件oriantimgres目录下保存),段落排版格式混乱,需要手动调整。

    如果再结合第三方软件,比如将Pdf转会为Word的Pdf2Word等软件,就可以将获得Pdf文件转换为Word,方便继续编辑。

    综上所述,无论是采用“屏幕截图法”还是“工具软件法”都是通过首先获取文件图片,再识别图片获取文本的方式来获得其中的文件内容。其实并非实际意义上的“下载”,更应该理解为“照着样子重新做”,同时,网络上还有一些其它的下载软件,也采用类同的原理。



·上一篇:一森教育考试随身练v1.1.0下载
·下一篇:关于Excel动态引用的问题

粤ICP备13075271号  | Copyright © 2024 Isen Software Studio - 一森软件工作室  |  Designed by www.isennet.com  | 站长入口