掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5835|回复: 6

[改进建议] 为什么goldendict不开发OCR取词的模块?

[复制链接]

该用户从未签到

发表于 2014-8-26 20:45:29 | 显示全部楼层 |阅读模式
本帖最后由 risenh 于 2014-8-26 20:49 编辑 / V6 a- @" R( o3 }
" |6 p; x2 g0 p+ a% ~; N

网上搜到一个叫mygoldendict的Google Project,程序命名为goldendict-advance,但是里面只剩下开发过程,甚至还留下了用户使用手册,还有各功能模块展示的ppt,但就是没有程序可供下载。。。


9 N6 A$ O+ i- r6 w: R

ocr取词有道貌似好几年就在用了,金山,必应,海词都有,甚至欧路也有,开源的ocr程序有tesseract,上面那个goldendict-advance的ppt里面介绍就是用的这个tesseract,不知道为什么没有高手再弄一个出来。

9 d, x' s% c7 F' _* j

可惜完全不会编程什么的,真是有心杀贼无力回天啊,不知道论坛里有没有高手可以造福一下大众?

该用户从未签到

发表于 2014-8-26 22:30:44 | 显示全部楼层
2 ~# U, f7 F1 I& Y. m$ i

. v  U; U, U) M0 h# }折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要海量的时间。ABBYY Lingvo x5 也就能 OCR识别二十几个语种,效果还非常一般,这还是背靠自家强大的 Finereader 技术的成果。
1 _4 b- {3 _8 ]9 h2 v% P) t
' s" B! u; D4 K( J* i2 @就算只加上Windows下英语、汉语的OCR识别取词,做到有噵词典那样的,也是市场价格几百万人民币的大活。其它词典软件的OCR取词,基本是噱头,bug一大堆,不堪大用。
/ @) p: H: |7 |; e
  @) A& A/ X* O$ i0 }造福是有限度的,就跟献血,也只能半年献个几百 cc,要一下子抽个几千,还不得死。; {* E6 {3 T- ]5 {/ r. A2 ?9 v

4 O2 n  |" H8 ?! ^, g& h$ _) ], N有时间的没技术,有技术的没时间和兴趣。
5 j1 `7 e. c& M6 i! O
; B) {% G& i" Y$ x只有期待英雄的出现了。
/ h+ J7 V& \& }7 f) ]8 x' R- l# \4 y! \  P9 \  b: b( y- V, |9 s

: p5 {+ U; s2 c

该用户从未签到

发表于 2014-8-26 22:33:02 | 显示全部楼层
能让Abs62继续下去已经谢天谢地了!
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-26 22:58:57 | 显示全部楼层
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋,晃得眼睛受不了,还不如手输简单。

    该用户从未签到

    发表于 2014-8-27 15:19:29 | 显示全部楼层
    louislaolu 发表于 2014-8-26 22:58 $ U& s6 ^  S7 S8 r* b. Q
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋 ...

    ) c" |! o  {: H4 J  _能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-27 15:32:53 | 显示全部楼层
    rayman 发表于 2014-8-27 15:19 % I& N3 d, F5 m9 w8 Z8 y
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。

    4 x: R2 X7 d$ D( ~老大所言极是,这点倒是没有想到。

    该用户从未签到

     楼主| 发表于 2014-8-27 20:40:46 | 显示全部楼层
    Oeasy 发表于 2014-8-26 22:30
    : L" k7 G4 F" U/ i9 m" R: z( |8 n4 A折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要 ...
    ( Y7 h2 \5 n3 b' C, y
    9 C5 p/ P# K' P1 w  e- i- y
    基础性的东西一向就是苦活累活啊,要是客观的需求动力不足那就更难了,不过,还是觉得这些个多功能的模块肯定还是会慢慢开发齐全出来的,时间早晚的事情,兴许哪天突然一个新的技术就突破让原来的苦累活变得轻松如意,当然前提是词典这东西还继续被人们使用下去
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-18 12:14 , Processed in 0.032331 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表