掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1296|回复: 16

[讨论] 文字版与图片版词典比较

[复制链接]
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2020-2-14 12:26:17 | 显示全部楼层 |阅读模式
    本帖最后由 999阿彌陀佛 于 2020-2-15 10:38 编辑 # N, c0 ^4 |7 Q$ @9 z
    / i4 @$ z2 N6 [  Y6 ^
    文字版與圖片版詞典比較
    9 I: t. z( u2 d9 v
    4 ?# H* _/ ^& Y+ ]- T# |文字版:
    % }# j  M8 i4 p, A優點:體積小,可全文檢索。可複製內容。# P( v' f2 f( W
    缺點:錯誤相對多一點。不夠嚴謹。7 d" K: C% Y. O: I/ g4 H2 n

    - J  e" h( W9 Q5 n圖片版
    , T% A' h! S& k0 [優點:相對權威、可靠,準確性更高些。
    * M- Y' x; ^4 O! n缺點:體積大,不能全文檢索。不能複製內容。7 a( H) r* i! p1 a+ m" e; c' h+ C, b

    ' {/ X4 n( b, y6 {7 A; K2 I5 m我覺得 圖片版辭典 最好做成切圖的,手機能用。整頁的MDX相當於一個能檢索的PDF,手機使用不太方便。當然 檢索比PDF還是方便很多。+ J$ Z. L  `; ~! Z" N9 i" B$ H  W' F* z

    3 X4 X; T2 N) b" O* v' r切圖的,切到單欄,我覺得就可以了,這樣製作難度也不大,可以接受,又保持了閱讀原書的體驗,可以上下比對閱覽。7 E+ o3 V9 v7 [
    3 }1 g7 ], O5 T3 w! j) M# t6 `
    切詞的,能做當然也很好,只是工作量太大,製作工期太長。缺點是沒有閱讀原書的體驗,不能上下比對閱覽。
      x6 q9 x0 a: u5 {" f* O# g$ @4 g* Q# H
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:07:35 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    . v4 ^; ~/ D2 G6 x9 n5 F8 L- \- n0 K3 J3 b本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...

    4 \% E2 H# o8 ~4 I- t图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,优点:4 r5 g  x& Q& I0 A1 W: Q6 T$ {

    ; m" o& s; H7 A9 x- c! l5 W1、可以同时查询很多词典,包括各种类型的词典,互相引证、对比、借鉴;
    ; ]( r' J" u6 x+ @7 ]
    ) ^. d: S& A, h3 Y) H2、使用PDF,需要在使用时一个一个费时打开,容易打断思路;而使用mdx词典,则仅在首次打开词典软件时费点时间(且不说现在几乎是24小时不关机),使用则完全是流畅无摩擦的。

    6 T! q# p+ T/ B$ D* s* y4 a+ U5 ]- L5 k  D
    3、即使是最简单的mdx的
    定位,通常也比扫描版PDF的定位方便快速。& C; w' S3 f4 v

    ( U/ x6 e8 T. R+ L
    / m. `) b$ l6 q; b* {8 e
    制作图片版的MDict词典完全不是浪费大神们的宝贵时间,很有意义。

    & a0 d) g' j& o' y' ^$ G  [) F. z9 T& ~+ `  v- e, ~% }+ [
    4 Q1 G! q- ^8 p) n- B* O/ N
    # E7 L2 ^( f9 F7 C3 _
    6 h/ }+ h$ g  P/ n4 G
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-2-14 12:53:42 | 显示全部楼层
    阿彌陀佛 兄:- Y  x$ x6 j3 r4 e2 E
    圖片單欄 + OCR 文字 並排- P3 a7 f* A5 W% ~
  • TA的每日心情
    擦汗
    2020-1-9 13:35
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2020-2-14 12:54:32 | 显示全部楼层
    個人認為:對於漢語來說,因為有很多字比較繁瑣且不易打出來,自然,識別也很難,所以為了最大可能保證準確,切圖版要比ocr要好些,且工作量不知少多少。其次,如果有現成的網站優先爬取網站。5 U  Y; T% y9 I" h8 a
    ocr<整頁<切圖<爬網站<現成app
  • TA的每日心情
    擦汗
    2024-2-8 08:54
  • 签到天数: 902 天

    [LV.10]以坛为家III

    发表于 2020-2-14 14:29:09 | 显示全部楼层
    只要制作上乘,一样值得拥有。
  • TA的每日心情
    慵懒
    2020-5-3 16:00
  • 签到天数: 207 天

    [LV.7]常住居民III

    发表于 2020-2-14 16:36:12 | 显示全部楼层
    我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是否被更改出错,文字版就难度更大了。% R! J# G; t% S* O8 c

    ! B$ t8 T/ U/ d和willianmson的观点差不多,我觉得词典好坏排序大致如下:
    . [/ |( S* V+ N0 f0 Q! n  R词典App文字版 / 可靠来源epub或mobi文字版 > 词典网站文字版 > 可靠来源pdf图片版(已校对OCR文字版>切图图片版>整页图片版>未校对OCR文字版)
    : X! |% X  z$ {# ^4 O; x! G+ y) o" F7 ^8 E
    其实文字版如果准确性能与书本持平的话,更方面好处可以吊打图片版(无论是否切图),个人觉得至少包括一下几点:5 g0 n/ [! X1 |9 }  x
    1. 文字版可以调整缩进,让阅读更方便! x/ T0 j( i1 Q. w/ D% ]) m
    2. 文字版可以添加语音和图片(官方来源更佳),让内容更丰富/ K1 l6 b' w2 f; U0 g. n7 j
    3. 文字版可以上色,让阅读更快速抓住重点$ b6 x: m- F' C4 t$ @' G' O6 ]4 d/ w) A
    4. 文字版可以演绎,让后续应用更佳丰富(比如复制节选到笔记)7 A  c- S% q; L4 g) t  _, ^9 `, x+ [
    5. 文字版可以自适应屏幕大小排版
    # D4 Q& \& |, z( Y# b6. 文字版可以动态折叠,比如隐藏双解的中文,让词典适配不同使用习惯
    / V) N( O7 ^1 {0 n1 c& w% Q7. 文字版可以全文搜索,让查询多一种选择4 h  I% O: t6 T  I( R6 _! N
    8. (欢迎持续补充列表)
    * [' w* ~( u& D
  • TA的每日心情
    慵懒
    12 小时前
  • 签到天数: 1733 天

    [LV.Master]伴坛终老

    发表于 2020-2-14 23:43:09 | 显示全部楼层
          关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质量与格式没有必然的联系,就算是权威、严谨的图书,例如《辞海》,也无法避免差错(本人也找到过),所以甚至有“无错不成书”的说法,正式出版物的标准是差错率不能超过1/10000。因此对于Txt格式的书来说,质量要具体对待,一本经过认真校对的Txt书,差错可以低于市面上常见的扫描版Pdf书。当然有些通过OCR得到的Txt书,如果没有经过认真校对,肯定错误百出。txt格式的书优点较多:①体积小、存储简单方便,也便于传输交流,不费流量;②格式简单,许多程序都可打开,而且不会像Doc等格式,有可能中病毒;③兼容性好,不管是手机,还是电脑、平板等移动设备;无论Windows,还是苹果等,所有操作系统都可以使用;虽然它有版式简单,显示效果较差,不支持标签记录,不支持图像、音频和视频,不够生动的缺点。
    ' }" O# x. S% p
  • TA的每日心情
    慵懒
    12 小时前
  • 签到天数: 1733 天

    [LV.Master]伴坛终老

    发表于 2020-2-15 02:05:14 | 显示全部楼层
           本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全文搜索,而且与扫描版Pdf格式那样占存储器空间很大,由此就有一个疑问:图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,究竟有何优点?如果没有,那么制作图片版的MDict词典是不是浪费了大神们的宝贵时间,有点得不偿失,不如直接使用扫描版Pdf格式词典?
    ' a- U# O3 Q! |. J, f
  • TA的每日心情
    开心
    2019-10-10 05:35
  • 签到天数: 328 天

    [LV.8]以坛为家I

    发表于 2020-2-15 09:48:02 | 显示全部楼层
    C大的切图版已兼顾了切词和整页版的,可任意切换的

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:39:03 | 显示全部楼层
    yfz48516 发表于 2020-2-14 23:43
    / _4 O8 E- u# k+ v$ R8 W; P关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质 ...
    # [$ _/ s6 i" |$ t
    校對好的TXT那是最方便了。
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:40:17 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    0 x) G1 q: W6 S1 c: n' \本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    0 L: Q# E) j' h: [. d7 m0 C( @
    圖片詞典檢索比PDF還是要方便很多
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:12:34 | 显示全部楼层
    Jiangxi 发表于 2020-2-15 09:48! P. W* b3 x" |0 ^# s
    C大的切图版已兼顾了切词和整页版的,可任意切换的
    3 {( ?3 R% a4 U) ~0 i% b
    期待能够开源,以促进进一步改进和维护。说实话,我费劲学了很久,也没用这个办法搞出一本,中间出现问题,也没有供交流、提问的合适地方。
  • TA的每日心情
    开心
    2020-2-28 21:03
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-3-2 16:34:19 来自手机 | 显示全部楼层
    johannhuang 发表于 2020-2-14 16:36
    . n/ P0 }$ `9 m& _; |$ I. j我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是 ...
    ) {; n4 v9 v' ]1 b; v% y0 s
    支持,虽然我用的少,最喜欢的就是简繁体转换
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2020-3-2 16:59:41 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:050 z, _; L+ t. N/ N
    本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    + i6 o3 [3 U. b3 \( v
    扫描版PDF除了通读或背诵远比MDX强,查词方面几乎是拙劣到无法忍受。且不说用手机无鼠标的条件下去查找扫描PDF中的某个词多艰难,就是电脑有鼠标的也是奇累无比,至少不如纸质书查得快。

    该用户从未签到

    发表于 2020-3-11 08:23:52 | 显示全部楼层
    十年前,图片词典几乎没人做,也没人用。原因:7 B7 H& Y& L4 W. c9 ~5 B" R+ E' [
    1 在词典制作风行之初,文本数据相对较多
    - M, W% y/ {8 V+ m8 o2 s/ m$ ?" Z9 w% }2 手机内存运存屏幕都小,图片词典装不下,打不开,看不了9 O0 l  i1 k$ w' c' a
    现在图片词典渐多,原因:; r7 c1 [: i; t
    1 文本数据挖掘殆尽. u- {9 M$ ~2 \* M7 G% g( m$ o
    2 电子终端越来越先进
    5 B% h2 f5 ]+ b" O4 [/ P3 图片版制作技术越来越成熟,像佛大的切图版,像c大的切片版
    ; U* y" \* @$ P# C6 U, D& Z4 大家对词典的需求越来越多样2 N2 O1 B7 \( \" X

    & P( y, H3 y& d0 L/ s8 V% n" B( w就词典而言,我觉得全文搜索意义不大,图片版基本可以满足大众需求。只不过除了c大的精准切片,不足之处就是还得在图片中找词条,尤其是整页版,如能在图片上加锚好了。  C0 _( S7 ]' g7 ]) U5 _: v
    当然,可靠文本最好,退而求其次,图片版也很ok。
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2020-8-10 03:02:42 | 显示全部楼层
    图片版词典并不是一无是处。它可以查看前后相关词(主要是同根词),对扩大词汇量有巨大的好处,这是文字版词典无法比拟的重大优点。而且扫描版的词典来源比文字版的多了好几个数量级了,对扫描版词典做粗略匹配的图片版MDX是最容易的,可以迅速增加手中的MDX词典拥有量。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-8 20:04 , Processed in 0.060275 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表