掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5782|回复: 6

[改进建议] 为什么goldendict不开发OCR取词的模块?

[复制链接]

该用户从未签到

发表于 2014-8-26 20:45:29 | 显示全部楼层 |阅读模式
本帖最后由 risenh 于 2014-8-26 20:49 编辑 7 m; W4 i& K- }* c9 i' l- \+ ?

8 C/ s7 v& L" u5 d

网上搜到一个叫mygoldendict的Google Project,程序命名为goldendict-advance,但是里面只剩下开发过程,甚至还留下了用户使用手册,还有各功能模块展示的ppt,但就是没有程序可供下载。。。

0 `) S0 C' s, C( R3 G; }% G

ocr取词有道貌似好几年就在用了,金山,必应,海词都有,甚至欧路也有,开源的ocr程序有tesseract,上面那个goldendict-advance的ppt里面介绍就是用的这个tesseract,不知道为什么没有高手再弄一个出来。

1 ]& E9 k4 V4 U" g+ z2 u; X

可惜完全不会编程什么的,真是有心杀贼无力回天啊,不知道论坛里有没有高手可以造福一下大众?

该用户从未签到

发表于 2014-8-26 22:30:44 | 显示全部楼层

( q# B5 F6 F+ H3 O& N, [; K4 N5 J
折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要海量的时间。ABBYY Lingvo x5 也就能 OCR识别二十几个语种,效果还非常一般,这还是背靠自家强大的 Finereader 技术的成果。
0 p; d( j; D1 M  I1 B1 D
  w- l  q1 X. }% h' _就算只加上Windows下英语、汉语的OCR识别取词,做到有噵词典那样的,也是市场价格几百万人民币的大活。其它词典软件的OCR取词,基本是噱头,bug一大堆,不堪大用。
  X% ]0 B/ k9 A: h$ q5 t8 {" T* Z/ L) a! Q! \  t1 a% X' O4 A
造福是有限度的,就跟献血,也只能半年献个几百 cc,要一下子抽个几千,还不得死。/ p. a8 G7 r* g' l" B7 p' C
: ?! Y: Z. B' |' J# R: B; ]9 R
有时间的没技术,有技术的没时间和兴趣。* i" w/ s% Q& Q/ I; j/ _# a2 o
: R: X& R3 z: w/ L7 ]2 H
只有期待英雄的出现了。7 L9 q3 k* j/ v1 A" C/ u9 @# I+ ~

/ N1 z& p% |2 @
$ [3 h: u/ ^! K; e# |( _. [3 v

该用户从未签到

发表于 2014-8-26 22:33:02 | 显示全部楼层
能让Abs62继续下去已经谢天谢地了!
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-26 22:58:57 | 显示全部楼层
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋,晃得眼睛受不了,还不如手输简单。

    该用户从未签到

    发表于 2014-8-27 15:19:29 | 显示全部楼层
    louislaolu 发表于 2014-8-26 22:58 ; x. r0 T0 B( N6 g
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋 ...
    " o) u) @" c: F3 f; S
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-27 15:32:53 | 显示全部楼层
    rayman 发表于 2014-8-27 15:19 9 S5 q$ k* @3 S
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。

    + `8 L! N1 @  j9 i) I. c- G老大所言极是,这点倒是没有想到。

    该用户从未签到

     楼主| 发表于 2014-8-27 20:40:46 | 显示全部楼层
    Oeasy 发表于 2014-8-26 22:30
    ; c3 X7 F6 j, c9 o. z折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要 ...
    1 ?: W1 S: G: I" l4 G# K8 j" ~
    2 h" [* ]' }4 O5 k( m+ ], J( E$ v2 ?
    基础性的东西一向就是苦活累活啊,要是客观的需求动力不足那就更难了,不过,还是觉得这些个多功能的模块肯定还是会慢慢开发齐全出来的,时间早晚的事情,兴许哪天突然一个新的技术就突破让原来的苦累活变得轻松如意,当然前提是词典这东西还继续被人们使用下去
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-2 20:00 , Processed in 0.450283 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表