打开一些PDF文件时,发现[无法长按选词划线]等操作,这大概率您这份是[扫描版PDF]。
什么是扫描版PDF?
扫描版PDF是通过扫描的方式把文档扫描成图片后转化成PDF格式,
一般有两种:电子文件直接转换为PDF文件;非电子文件(图片、手机拍的照片等)通过扫描或直接输出为的PDF。
扫描PDF本质上属于图像PDF,所以无法直接提取其中的文字。
文石提供了[OCR识别]功能 (需联网使用),可将扫描版PDF中的文字内容,进行识别提取。提供了更好的PDF阅读体验。
文石OCR功能为额度制,在登录onyx账号后,额度为 每日/300次;支持识别的语言文字:中文 英文。
建议先登录onyx账号使用,登录onyx账号教程。
1.打开PDF文件后,点击屏幕中间,打开上方的[OCR功能]。
2.选择对应的版式后,确认。
3.稍等片刻,识别功能后,即可长按选词。