掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1589|回复: 16

[讨论] 文字版与图片版词典比较

[复制链接]
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2020-2-14 12:26:17 | 显示全部楼层 |阅读模式
    本帖最后由 999阿彌陀佛 于 2020-2-15 10:38 编辑
    ! ?+ ?. g) N/ p% G( m3 i- h
    # s. R! M/ H/ O- ^$ U文字版與圖片版詞典比較- A* j$ r, F! ^

    & \) y* `/ }- U6 f1 c1 y文字版:
    9 }! R8 E5 ^/ Y) O4 U% @7 C優點:體積小,可全文檢索。可複製內容。: c- q  Z! C7 [8 T6 N
    缺點:錯誤相對多一點。不夠嚴謹。  K1 L8 v( W' M. t1 \
    % F% I: K; w9 q7 e3 U' y5 ?
    圖片版) R' S, e  p# C
    優點:相對權威、可靠,準確性更高些。8 k* z: Y* D5 C" \4 |! j3 [# U: a- ^
    缺點:體積大,不能全文檢索。不能複製內容。6 Q& E8 Q) t7 Z/ f$ q" A: Q6 J

    5 Y4 d! L- [! X# _8 j我覺得 圖片版辭典 最好做成切圖的,手機能用。整頁的MDX相當於一個能檢索的PDF,手機使用不太方便。當然 檢索比PDF還是方便很多。5 B" R# n; L1 i: O' D/ R

    $ D- H% W" F5 B! E, A0 ^# I, N切圖的,切到單欄,我覺得就可以了,這樣製作難度也不大,可以接受,又保持了閱讀原書的體驗,可以上下比對閱覽。
    ; S3 s& p3 P" {! c1 D7 k* ^9 W  \4 S) M( M' g
    切詞的,能做當然也很好,只是工作量太大,製作工期太長。缺點是沒有閱讀原書的體驗,不能上下比對閱覽。3 m$ V  W7 d+ i, c7 q* o
    ; @5 Z( T4 d2 v6 \. I% g$ y0 l/ ]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:07:35 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    / G- `3 a. H: H- e* L本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    ! g' F" s4 R+ q' W3 D" `0 A
    图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,优点:
    6 q* q4 U8 }2 \7 r  [

    - ]+ T: j( M, g5 o; H1、可以同时查询很多词典,包括各种类型的词典,互相引证、对比、借鉴;
    , w4 |; @& L6 P8 f3 g$ t6 j/ e* T: R8 ~: G% }# z' H& J
    2、使用PDF,需要在使用时一个一个费时打开,容易打断思路;而使用mdx词典,则仅在首次打开词典软件时费点时间(且不说现在几乎是24小时不关机),使用则完全是流畅无摩擦的。

    8 e2 Q3 f$ _+ g) o$ O+ w# g9 T& z7 [. M) t5 N
    3、即使是最简单的mdx的
    定位,通常也比扫描版PDF的定位方便快速。
    / \/ w3 _( ?5 Y6 h: C" T& Y4 l9 x9 M; [7 ~# f8 K7 ^) @6 M1 c
      J7 }- T& q  ?0 Y- A
    制作图片版的MDict词典完全不是浪费大神们的宝贵时间,很有意义。
    7 \1 a1 t( S) W$ }

    % U* |* [" U, N& a8 {
    ) t' y" c: ], Z/ x" ]1 n4 `9 l" M* e! T3 t

    ' `4 l" w; |* Q6 F& V
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-2-14 12:53:42 | 显示全部楼层
    阿彌陀佛 兄:
    " n6 ]' ~1 `; y圖片單欄 + OCR 文字 並排0 m$ `$ k6 p7 Z0 R
  • TA的每日心情
    擦汗
    2020-1-9 13:35
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2020-2-14 12:54:32 | 显示全部楼层
    個人認為:對於漢語來說,因為有很多字比較繁瑣且不易打出來,自然,識別也很難,所以為了最大可能保證準確,切圖版要比ocr要好些,且工作量不知少多少。其次,如果有現成的網站優先爬取網站。
    3 b+ ?! r4 U* `. I9 Z" U" J, rocr<整頁<切圖<爬網站<現成app
  • TA的每日心情
    擦汗
    2024-2-8 08:54
  • 签到天数: 902 天

    [LV.10]以坛为家III

    发表于 2020-2-14 14:29:09 | 显示全部楼层
    只要制作上乘,一样值得拥有。
  • TA的每日心情
    慵懒
    2020-5-3 16:00
  • 签到天数: 207 天

    [LV.7]常住居民III

    发表于 2020-2-14 16:36:12 | 显示全部楼层
    我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是否被更改出错,文字版就难度更大了。
    6 b" m3 l0 D( M! m3 E9 n
    1 Y) e) g! ^; x6 g和willianmson的观点差不多,我觉得词典好坏排序大致如下:
    # m3 H# {0 c7 O8 D词典App文字版 / 可靠来源epub或mobi文字版 > 词典网站文字版 > 可靠来源pdf图片版(已校对OCR文字版>切图图片版>整页图片版>未校对OCR文字版)
    4 d" ~( a/ E# r  B. o; x
    6 v8 U* u6 _. k; e) K. k其实文字版如果准确性能与书本持平的话,更方面好处可以吊打图片版(无论是否切图),个人觉得至少包括一下几点:
    2 J: c9 r$ |; W) ~8 g4 S1. 文字版可以调整缩进,让阅读更方便" V' c( U. q/ Z8 u8 ^
    2. 文字版可以添加语音和图片(官方来源更佳),让内容更丰富) I. e9 f  N( P
    3. 文字版可以上色,让阅读更快速抓住重点& J, q( E  n% f) ?+ |! U1 A+ p
    4. 文字版可以演绎,让后续应用更佳丰富(比如复制节选到笔记)
    0 x3 ^1 m& r; F& ?7 ]) l2 H1 H5. 文字版可以自适应屏幕大小排版
    + T1 a8 s' Z7 V( |) V& @3 x6. 文字版可以动态折叠,比如隐藏双解的中文,让词典适配不同使用习惯3 o- p; ]6 q/ r& u; V8 v& ~/ ]
    7. 文字版可以全文搜索,让查询多一种选择! x6 [5 u3 }) z! N2 H* g& [
    8. (欢迎持续补充列表)
    # w1 S0 W, ]2 J4 n" C7 s, i3 @
  • TA的每日心情
    慵懒
    昨天 10:31
  • 签到天数: 2035 天

    [LV.Master]伴坛终老

    发表于 2020-2-14 23:43:09 | 显示全部楼层
          关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质量与格式没有必然的联系,就算是权威、严谨的图书,例如《辞海》,也无法避免差错(本人也找到过),所以甚至有“无错不成书”的说法,正式出版物的标准是差错率不能超过1/10000。因此对于Txt格式的书来说,质量要具体对待,一本经过认真校对的Txt书,差错可以低于市面上常见的扫描版Pdf书。当然有些通过OCR得到的Txt书,如果没有经过认真校对,肯定错误百出。txt格式的书优点较多:①体积小、存储简单方便,也便于传输交流,不费流量;②格式简单,许多程序都可打开,而且不会像Doc等格式,有可能中病毒;③兼容性好,不管是手机,还是电脑、平板等移动设备;无论Windows,还是苹果等,所有操作系统都可以使用;虽然它有版式简单,显示效果较差,不支持标签记录,不支持图像、音频和视频,不够生动的缺点。  ?/ D. E7 a5 n, H# a8 q
  • TA的每日心情
    慵懒
    昨天 10:31
  • 签到天数: 2035 天

    [LV.Master]伴坛终老

    发表于 2020-2-15 02:05:14 | 显示全部楼层
           本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全文搜索,而且与扫描版Pdf格式那样占存储器空间很大,由此就有一个疑问:图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,究竟有何优点?如果没有,那么制作图片版的MDict词典是不是浪费了大神们的宝贵时间,有点得不偿失,不如直接使用扫描版Pdf格式词典?/ }: h( ^0 f6 Z1 U5 m- S2 _* {+ y2 K7 d
  • TA的每日心情
    开心
    2019-10-10 05:35
  • 签到天数: 328 天

    [LV.8]以坛为家I

    发表于 2020-2-15 09:48:02 | 显示全部楼层
    C大的切图版已兼顾了切词和整页版的,可任意切换的

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:39:03 | 显示全部楼层
    yfz48516 发表于 2020-2-14 23:43
    1 w2 i' z" |" w$ j$ U9 C4 ^关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质 ...

    8 ?( V2 J' g8 x& ^校對好的TXT那是最方便了。
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:40:17 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:054 a5 M* I# h& p1 k/ ]5 t
    本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...

    6 Q1 C; {, u$ s# G: q4 D+ u; K- C圖片詞典檢索比PDF還是要方便很多
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:12:34 | 显示全部楼层
    Jiangxi 发表于 2020-2-15 09:48
    ) D) ^  I6 v3 ~# XC大的切图版已兼顾了切词和整页版的,可任意切换的

    * @3 X8 E* G' N8 [  d期待能够开源,以促进进一步改进和维护。说实话,我费劲学了很久,也没用这个办法搞出一本,中间出现问题,也没有供交流、提问的合适地方。
  • TA的每日心情
    开心
    2020-2-28 21:03
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-3-2 16:34:19 来自手机 | 显示全部楼层
    johannhuang 发表于 2020-2-14 16:36! P; n3 p- d' P% b+ J7 v
    我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是 ...

    ; @1 X% s, s5 d9 n5 O9 `( q支持,虽然我用的少,最喜欢的就是简繁体转换
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2020-3-2 16:59:41 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    # x9 k4 Y$ K' G/ r) _: c9 X. G1 X5 j% ^本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    : t/ @7 `( F& R4 t# I7 }# j" I
    扫描版PDF除了通读或背诵远比MDX强,查词方面几乎是拙劣到无法忍受。且不说用手机无鼠标的条件下去查找扫描PDF中的某个词多艰难,就是电脑有鼠标的也是奇累无比,至少不如纸质书查得快。

    该用户从未签到

    发表于 2020-3-11 08:23:52 | 显示全部楼层
    十年前,图片词典几乎没人做,也没人用。原因:! K% ^& M4 j# `. a+ T
    1 在词典制作风行之初,文本数据相对较多
    3 K- R, ~# Y9 C# K2 手机内存运存屏幕都小,图片词典装不下,打不开,看不了
    . @7 F: Y" A4 u% a0 L, m6 S% K0 i现在图片词典渐多,原因:
    : `( `  p) M9 z( X8 \/ H1 文本数据挖掘殆尽# G5 V9 S+ ?! W& X) _% g) ?
    2 电子终端越来越先进
    . Z* O: h4 B3 D2 _1 X0 z% s3 图片版制作技术越来越成熟,像佛大的切图版,像c大的切片版6 i' k9 ~$ ?, b8 D
    4 大家对词典的需求越来越多样6 t% z$ K2 M( m! O
    ; O5 ?( X4 `' L: p) M. K8 }1 u: |
    就词典而言,我觉得全文搜索意义不大,图片版基本可以满足大众需求。只不过除了c大的精准切片,不足之处就是还得在图片中找词条,尤其是整页版,如能在图片上加锚好了。
    5 B9 ]9 b1 q( k- V当然,可靠文本最好,退而求其次,图片版也很ok。
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2020-8-10 03:02:42 | 显示全部楼层
    图片版词典并不是一无是处。它可以查看前后相关词(主要是同根词),对扩大词汇量有巨大的好处,这是文字版词典无法比拟的重大优点。而且扫描版的词典来源比文字版的多了好几个数量级了,对扫描版词典做粗略匹配的图片版MDX是最容易的,可以迅速增加手中的MDX词典拥有量。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-27 02:07 , Processed in 0.021664 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表