当前位置:首页 期刊杂志

网络文本资源下载技巧详解

时间:2024-06-19

☆ 吴晓龙

(南京玄武区教师进修学校,江苏南京 210016)

网络文本资源下载技巧详解

☆ 吴晓龙

(南京玄武区教师进修学校,江苏南京 210016)

教师们经常上网,也经常在网上搜索到一些有用的文本资源。有时辛辛苦苦找到有用的资源,可是却下不下来。本文主要给大家介绍一些网络文本资源下载的一般方法和一些高级技巧。

方法一:最简单的下载,也是教师们用得最多的方法。

(1)选择网页的文本,这时文字显现反选状态(蓝底,白字)。

(2)右键,复制(或CTRL+C)以上选择的文本。

(3)打开相应的软件,如Word、PPT等。

(4)粘贴文本(或CTRL+V)。

通过以上步骤,网络上的文本资源被成功复制、下载。

问题:用以上方法下载网络文本资源,如果网页上的文本不能选择怎么办?如果网页上的文本可以选择,但不能成功复制怎么办(有些网页文本你一单击右键复制,它会提示非法拷贝等提示)?

请大家尝试如下网络文本资源的下载方法。

方法二:“另存为”法,基本操作如下。

(1)先上网找到相应的网页文本资源。

(2)点击IE浏览器的“文件”菜单。

(3)在文件菜单下选择“另存为”。

(4)把“保存类型”选择为“文本文件”,然后把保存位置设置为“桌面”或者你需要保存的位置,再点“保存”按钮。

在桌面或者你选择的保存位置会生成一个文本文件,打开文本文件就会出现你要下载的文本信息,再用选择-复制-粘贴的方法将其复制到你所需要的地方,如Word、PPT中等等。

给大家介绍用方法二下载的实例:

http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml

以上链接就不能直接复制、粘贴,但可用以上介绍的方法二下载。

方法三:还有一些网页的文字,用“另存为”的方法也不行,那你可以尝试如下方法。

打开网页,在IE浏览器的“查看”菜单里 选“源文件”,在里面找找看你没有你需要的文字,如果有,再进行“复制”-“粘贴”操作。

用这种方法,也可以下载以下页面的文本资源:

http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml

方法四:打开网页,在IE浏览器的“文件”菜单里选“使用Microsoft Office Word编辑”。

用这种方法,同样也可以下载以下页面的文本资源:

http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml

方法五:打开网页,在IE浏览器的“工具”菜单——“Internet选项”——“安全”——Internet——自定义级别,然后在设置里把“脚本”里的 活动脚本 “禁用”,按“确定”。

重新启动IE浏览器,打开需要下载的网页,这时就可以选择、复制所需要的文本了。

复制完后别忘了把IE浏览器的活动脚本设置为启用,不然以后浏览网页的时候有些页面里的内容就看不到了。

下面介绍几种更高级一些的网络文本下载方法。

方法六:“拷屏——文字识别”法。

有些网页上的文本资源,你看到的看似是文本,但它是图片或者是FLASH等软件生成的“非文本格式的文本”,比如JPEG图片、SWF格式的动画、加密的PDF格式文本等。

大家可以尝试,拷屏后用文字识别软件识别的方法来下载。该方法操作相对较复杂,需要有一定的电脑操作基础。

这种下载方法的原理是:先将要下载网页的页面拷屏,生成JPEG图片,然后用文字识别软件将图片识别成文本(就和将报纸、杂志上的文字用扫描仪扫描到计算机后用文字识别软件识别原理相似)。

具体操作方法如下:

(1)打开需要下载的页面,按PrintScreen键(这个键一般在键盘的右上方,有些键盘可能是简写PSC)。

(2)打开图片处理软件Photoshop,新建一个文档,粘贴,这时你所选的网页页面以图片的形式出现在Photoshop中,用裁剪工具将没有文字或者不需要的部分剪去,剩下文本部分。

为了提高文字的识别率,请放大图片,将图片的分辨率提高到300以上。

图像大小调整的方法,Photoshop-图像-图像大小。将文件存储为JPEG格式(“文件”菜单-“存储为”)。

安装识别软件,这里以尚书七号OCR为例,软件下载地址:http://www.xwjy.cn/xici/soft/shangshu7.rar。

下载解压后点击安装文件Setup.exe,按提示点“下一步”直到“确定”,安装完成。

在“开始”菜单里运行“尚书七号OCR程序”,打开前面保存的JPEG图片,再按“识别”按钮,图片被识别成文本(红色框从左到右分别是“打开”按钮和“识别”按钮)。

识别软件的识别率受到图片清晰度等多种因素影响,如果没有100%识别适当手动修改一下即可。

在使用PrintScreen键“拷屏-识别”这种方法进行文本下载时,常见到的一个主要问题是:当需要下载的文本不只是电脑桌面那么一屏,而是有很多,需要拉垂直滚动条才能浏览全部文本,这时用PrintScreen键只有一屏一屏的拷贝,然后用文字识别软件进行识别,那是比较麻烦的。

下面给大家介绍一种可以滚动拷贝屏幕的方法。

滚动拷贝屏幕一般需要用到一些软件,这类的软件很多,下面以 HyperSnap 为例,软件下载地址:http://www.xwjy.cn/xici/soft/hypersnap670.rar。

先将Hypersnap软件下载到本地,然后双击安装:

下面要做的两项工作就是:在网上找到需要下载的页面文本(文本较多,带滚动条),然后启动HyperSnap软件进行滚动拷屏,具体方法如下:

(1)打开需要下载的文本页面,下面以http://www.xwjy.cn/jixujiaoyu/jinrituijian/200903/7843.shtml为例,并且将垂直滚动条拉到最顶端(这样便于从上往下滚动拷屏全部内容)。

(2)启动HyperSnap软件,可以从“开始”-“程序”菜单里启动,也可以从桌面上直接双击快捷按钮。

(3)进入HyperSnap程序界面,选择“捕捉”菜单下的“整页滚动”,这时会在需要下载的页面出现闪烁框,在闪烁框里点击鼠标左键,电脑就会自动滚动屏幕并拷屏。

(4)选择“文件”菜单下的“保存”或“另存为”将文件保存所需要的格式和位置。

(5)将拷屏的图片文件放大到300dpi以上,然后用识别软件进行文字识别。

方法七:“文字捕捉”法。

用HyperSnap软件还可以直接对页面进行“文字捕捉”(意思就是直接将页面的文字识别成可以拷贝的文本,这是一种非常“神奇”而又方便的方法),具体操作如下:

(1)打开HyperSnap软件。

(2)在“捕捉”菜单里选择“捕捉设置”,在“捕捉设置”的对话框里将“文本捕捉”选项卡里的“纯文字捕捉”和“格式化文本捕捉”选中,确定。

(3)打开找到的页面,然后点击HyperSnap的“文本捕捉”菜单下的“文本”,在网页页面鼠标就会变为区域选择状态。

(4)按住鼠标左键,选择需要捕捉的区域,然后文本就会被捕捉、识别,并呈现出来。

(5)将HyperSnap捕捉、识别后的文本复制、粘贴到相应的文字处理软件(如Word)即可。

于翼楠]

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!