这是一个专门用来 OCR(光学字符识别)图像格式字幕的软件,能够将 idx/sub(DVD)、sup(蓝光DVD)格式的字幕转成 utf-8 编码的 srt 格式,并提供 srt 格式校对 、字幕翻译、字幕合并等辅助功能。OCR 引擎为微软 Office 2003/2007 所带的 Microsoft Office Document Imaging (MODI),支持英文、简体中文、繁体中文、日文 等21种语言。
Q:为什么要开发 IdxSubOcr?
A:目前已经有一些免费的字幕OCR软件,英文的可以用 Subresync,中文的可以用 SubOCR。但是在使用了这些软件后,我还是决定开发 IdxSubOcr,理由如下:
1、希望能够使用方便性方面有所改善。Subresync 自带的 OCR 引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文、日文字符。
2、SubOCR 实在太庞大,而且在某些机器上运行出错。
Q:IdxSubOcr 的识别效果如何?
A:目前能够比较的相似软件是 Subresync 和 SubOCR,分别能识别英文和中文:
1、Subresync 有两种识别方式:使用 ocrdll 的自动方式和缺省的手工方式。Subresync 的识别率明显优于使用ocrdll的自动方式,与缺省的手工方式大致相同,但是击键次数大大减少,只有在碰到粘连在一起的字符才需要用户手工辨识,而 Subresync 需要对每个字母先进行人工辨识。
2、SubOCR 目前支持简体和繁体中文,繁体中文引擎的识别率优于简体中文引擎。IdxSubOcr 除中文外,还支持日文等21种语言的识别,识别率相当于 SubOCR 繁体中文引擎的识别率。
Q:IdxSubOcr 在使用上有什么要求?
A:IdxSubOcr 的运行环境存在下列限制:
1、只能从硬盘上运行,不能从光盘等只读设备上运行。
2、生成的srt文件采用 utf-8 编码,某些太过古老的软件可能不支持。
3、使用前需要安装 MODI OCR 引擎,该引擎的独立安装包可以从我的网盘下载,网盘地址在主页的置顶帖中定期更新。
|