OCR识别

ocr,文字识别,文字提取,ocr识别,ocr功能,ocr提取,内容识别,内容提取

打开一些PDF文件时,发现[无法长按选词划线]等操作,这大概率您这份是[扫描版PDF]。
什么是扫描版PDF? 扫描版PDF是通过扫描的方式把文档扫描成图片后转化成PDF格式, 一般有两种:电子文件直接转换为PDF文件;非电子文件(图片、手机拍的照片等)通过扫描或直接输出为的PDF。 扫描PDF本质上属于图像PDF,所以无法直接提取其中的文字。
文石提供了[OCR识别]功能 (需联网使用),可将扫描版PDF中的文字内容,进行识别提取。提供了更好的PDF阅读体验。
文石OCR功能为额度制,在登录onyx账号后,额度为 每日/300次;支持识别的语言文字:中文 英文。
建议先登录onyx账号使用,登录onyx账号教程
扫描版pdf无法长按选词


1.打开PDF文件后,点击屏幕中间,打开上方的[OCR功能]。


2.选择对应的版式后,确认。


3.稍等片刻,识别功能后,即可长按选词。

2024-02-01
0