掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2002|回复: 10

[词典讨论] 遠東英漢大辭典全文阅读及纯文本化项目[20221003]

[复制链接]

该用户从未签到

发表于 2022-10-3 23:15:40 | 显示全部楼层 |阅读模式

  D' L! n' @( Q! U项目名称:遠東英漢大辭典全文阅读及纯文本化项目
/ ?* S$ F* u7 O3 d! g项目背景:昨发帖([词典讨论] 遠東英漢大辭典已经绝版?(20221002)  https://www.pdawiki.com/forum/fo ... hread&tid=47852),感谢几位同好释疑,可以确认《遠東英漢大辭典》已经绝版。一时兴起,开启一个遠東英漢大辭典全文阅读及纯文本化项目。
; I- o5 k6 \  x+ ]
% l2 b, S: K4 T$ |5 y7 H项目地址:http://feecd.ducidian.com/,该站点暂仅会用于《遠東英漢大辭典》(FAR EAST ENGLISH-CHINESE DICTIONARY)。我已经放上去一些词条了,这里可以看到所有的词条 http://feecd.ducidian.com/index.php?title=Special:AllPages
* F' j6 T4 w! q- y3 ?& g, O. l$ `" }' F
最长的 go 条:http://feecd.ducidian.com/index.php?title=go,之前有传闻遠東英漢大辭典以 WBD 为蓝本,且看这 go 条,可比 WBD 详细多了。
- i" n" M" z; Y* l7 X) t2 L+ [" }! p: ?7 _2 P' B
道虽迩,不行不至;事虽小,不为不成。+ `. X& S3 r: |- h/ o% i+ C

+ a7 V; e6 K9 d; s* z项目原则:原则上没有原则。我自己有几条推荐原则。3 I( v+ J: v7 u
第一、繁体原文纯文本即可,不用在乎什么语义标签,不在乎加粗、斜体。我创建的词条都是纯文本 Preformatted 格式。) O/ b& e7 m' l( F* u
第二、完成比完美重要,音标我是直接舍去的。) u8 M; L  K% D2 t2 u

( W( W: q& `+ s6 S% k$ B* }, O参与方式:* D7 U) `, i# o3 W6 A( f
- 任何人都可以在 http://feecd.ducidian.com/ Create account,添加《遠東英漢大辭典》原文词条,修订站点上已有词条里的错误。& X) Y1 _: M/ [9 o
- 参与者不会有任何福利。9 a- G1 Y! g$ X0 U$ ]  Y

4 u" L: U; K! z# N遇到的困难:+ F; F( z# N/ M  u/ G- a( v( b
第一、业务上的问题,我发现遠東英漢大辭典里的一些汉字我不太熟悉,鲁鱼亥豕分不清楚,简体、繁体的录入会出现一些问题。1 f) y2 Y9 e/ m% c- _& f
第二、技术上的问题,http://feecd.ducidian.com/ 只有一些基础功能,目前全文搜索还有点问题,慢慢来吧。7 V- o) m2 V: g1 f( a$ E

6 P7 o# b! h: _$ u' P/ eFAQ
  V# I, Q$ Y3 K* B问:遠東英漢大辭典全文阅读及纯文本化项目,这个项目有何意义?) h* v8 C1 K! L8 ^, J- a1 X) x
答:没有意义。网络上我没有找到《遠東英漢大辭典》的文本,坊间传闻有人手打过一遍,但是我也没见过。从出版时间来看,有文字版的可能性微乎其微。要是在本项目进行过程中,突然出现《遠東英漢大辭典》的文本,那本项目抛砖引玉目的达到,或将即刻终止。2 Y: l5 B! J' N' X1 N0 T9 ~5 B+ V
参考阅读:2021-04-23 一本书是怎样印刷出来的?来印务中心 揭秘书籍印装全过程 http://pc.yun.jxntv.cn/p/421151.html" b$ g1 r6 D$ U) E8 ]
' i- P! k0 P3 E# F2 ^+ J9 f
问:为什么要用繁体字?& l" x2 [* u; E9 I6 V: h
答:遠東英漢大辭典没有出过简体字版,原文就是繁体的。为了体现原貌,故本项目采用繁体字。9 U; V% y5 U1 E7 q0 l

2 z" G5 `8 n7 E) |问:最终成果会共享吗?( v6 f" U, _, W/ F% W- u$ k3 y
答:所有成果就在 http://feecd.ducidian.com/ 上,该站点基于 MediaWiki,喂鸡百科就基于这套系统。' ?$ L+ ^- s, q6 q* p  N: A0 p! U

/ V, s& ~5 s4 P1 t: W6 e问:参与项目有什么好处吗?( f3 w" b# P6 H. k  o7 x' p
答:没有。所有成果即时体现在 http://feecd.ducidian.com/ 上,有任何需要讨论的,公开在 pdawiki 本帖回帖或另开新帖讨论即可。. h4 j, J1 z9 G
7 p5 ~8 g+ f( l4 Z+ x( Y! L# s
问:http://feecd.ducidian.com/ 有没有任何权限限制?
% c7 n& Q- x- J! S答:暂无限制,创建账号后即可直接创建、修改词条,后续视情况确定策略。7 ~( p0 q& y" j/ }% I/ x6 l

4 n4 [3 A! `6 ~8 m1 u& k问:能不能介绍下遠東英漢大辭典?它究竟还有什么价值?$ p1 ?. x$ G; G1 g5 |' K
答:对于现在的英语学习者而言,牛津、朗文、柯林斯、韦氏、剑桥、麦克米伦,能起的作用更大;对于语言工作者,网络词典乃至新世纪英汉大词典、英汉大词典、21世纪大英汉词典等有文字版的词典,更为实用。说到底,遠東英漢大辭典就是一本过气词典。它的价值,更多在于娱乐价值,研究它、阅读它也算一种娱乐吧。  k0 `! h# D- s

6 S% b7 C- ^- q问:有没有考虑过直接 OCR 什么的?$ U1 v& Y+ A5 M% p
答:尝试过一些 OCR 工具,甚至试过 PPOCRLabel 标注,但是过程很痛苦。期待其余大神尝试吧。目前我主要是人工 + OCR 校对。
5 U9 Y# e/ H8 k" x7 f7 `
5 M4 j2 Z. t) k# U8 y5 ?% d问:纯文本化项目依靠的原书是什么?0 c/ L; u2 }! v# _7 S* A# Q. c
答:参考 https://www.pdawiki.com/forum/fo ... hread&tid=35956 。遠東英漢大辭典版本较多,有台湾原版(我购置了一本),有大陆“内部交流”翻印本(内容无删改),还有商务印书馆版本(内容有小改),参考:[词典考据] 远东英汉台湾版与大陆版的异同 https://www.pdawiki.com/forum/fo ... hread&tid=36089 。但是内容是差不多的。+ w) q! ]" ^7 A
参考:出版説明 http://feecd.ducidian.com/index. ... 8%E8%AA%AC%E6%98%8E7 H; x$ I6 r% `0 v' f
- v1 e7 R% ?4 [* N0 z/ ^% W& X
问:本项目大概需要多长时间?
) y2 i% {) ^4 D' n2 H答:顺其自然吧。
6 K. c' h* s! U) B  d9 ]; m1 M" c9 S' f; Z/ h
问:关于本项目,您有一些想法、建议,技术上的,以及其他方面的。
# \, F# E% {  |$ j* z' L; z7 I% l答:欢迎跟帖,不过 talk is cheap,ideas are worth nothing without execution 直接开干吧。* Y- x6 |- m& o, Z' W- K; \- e6 {( `

8 c! m1 e% u: j+ G# Q) s# f问:http://feecd.ducidian.com/ 访问有点慢,有点难用啊。1 k4 }' }+ `) a+ i7 r
答:由于词典里有一些内容不会经过“技术”处理,所以 http://feecd.ducidian.com/  服务器并不在大陆。一些区域甚至存在无法访问的可能;服务器本身配置也较低,毕竟目前就我一个人在用,后续视情况而定。, _6 [. S0 }; i+ u4 N
至于 MediaWiki 的使用,稍微需要适应一下。
/ e6 @* T7 ~2 ?5 L
, T& b& R5 R5 H  ?问:怎么获取 mdx 或其他格式的离线版啊?
8 K8 X7 w( c4 ]% N/ H1 a1 R1 b答:wiki 转为 mdx 难度很低,后续等词条数量多起来了,会定期自动化转为离线版本供下载、使用。目前我是自制了 dsl 格式的,效果如图。
- W" S$ C5 w+ T% @3 O% f- T  |  o  U4 O# W3 {4 E

- K7 G/ Z& z$ ^/ @+ W$ |
* _" r( b/ z3 C. Z' e

该用户从未签到

 楼主| 发表于 2022-10-4 11:51:26 | 显示全部楼层
ucccafe 发表于 2022-10-4 04:33. K$ P; r/ G7 N0 x- F" K
與其還在ˊ這本辭典著墨,不如強烈要求出版社& d1 v# y9 V+ f! b
取得MWD, AHD授權,集合500名中英文高手,% @/ y* [4 a2 S/ k6 F- E: v& W# X8 S* U
以2年時間內推出中 ...
+ P+ T4 K. ^( g$ N$ @6 F* L

3 [2 z2 X5 V* Y' b- i韦氏大学英语词典(Merriam-Webster's Collegiate Dictionary, 11th Edition),英汉双解版,应该快出版了。这是写在《2013-2025年国家辞书编纂出版规划》里的。& V- K8 F5 w8 `
61        韦氏词典系列        庄绎传、石孝殊、章宜华        中国大百科全书出版社        图书

- Y/ y1 A2 d4 d5 W; ^" k
# [  G8 M( A$ d  t7 F) \韦氏词典的翻译,历史上也有一些尝试,英漢雙解韋氏大學字典(1923)、英汉辞海等。& F4 l2 m- x0 }0 C" D0 @% h
& Q0 g) R/ u+ s- U! C3 A* Y4 W! ~
AHD 呢,也有 [词典考据] AHD的英汉(双解版)[201502] https://www.pdawiki.com/forum/fo ... hread&tid=134487 }' C) c; u7 n2 m

# O4 w) s, _3 o+ B9 P+ S, z' S. e; u纸质词典不说 5 年后,其实在我这里, 10 年前就消亡了……. x3 c. {% p1 o" p; F2 ?
8 S1 G3 z2 Y  r; r! F' s
  • TA的每日心情
    开心
    2 小时前
  • 签到天数: 2530 天

    [LV.Master]伴坛终老

    发表于 2022-10-4 01:18:19 | 显示全部楼层
    O大,有些字有错6 p) Z7 h) v! \$ s! ]1 Z# E0 D9 Q

    4 s- a. Y, X, a$ \( k1 \6 c% ?9 T

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    多謝,圖中問題已經修復 http://feecd.ducidian.com/index.php?title=go  发表于 2022-10-4 08:33

    该用户从未签到

    发表于 2022-10-4 04:33:45 | 显示全部楼层
    與其還在ˊ這本辭典著墨,不如強烈要求出版社# a  l4 X# |( j9 u' l; j3 `: U  S+ z, q
    取得MWD, AHD授權,集合500名中英文高手,/ R, l) z8 Z1 h9 W- Z1 m
    以2年時間內推出中英雙解版& ~& o% f, T' r
    不然乾脆擺爛,直接讓書本辭典5年內消失
  • TA的每日心情
    开心
    2024-12-23 20:19
  • 签到天数: 442 天

    [LV.9]以坛为家II

    发表于 2022-10-4 06:37:07 | 显示全部楼层
    精神上支持版主,期待作品问世并流传8 _+ r1 |$ T4 O' c

    6 v+ t( M) o: O0 {% N. R( s

    该用户从未签到

     楼主| 发表于 2022-10-4 10:51:01 | 显示全部楼层

    - G) R- u- B' Z刘仁庆编著. 国宝宣纸[M]. 北京:中国铁道出版社, 2009.09.
    + @5 O  v4 A- y注:下面的文字为 OCR,未经校对。& C, n1 O0 S7 E" d3 [& B0 |
    就以宣纸的英文译名为例,过去有的译为 fine paper from Shuan-chen(地名按英, {3 S+ o, N1 b. D- q' K. c
    语拼音),其意是“宣城出产的好纸”,弄得外国人晕头转向。有的译- Q1 m, C5 I8 R2 Q
    为Chinese paper(意为中国纸),它的真正意思是竹纸,文不对题。
    0 W8 {6 a6 w# O. N8 Y还有的译为rice paper,中文译名是“稻米纸”或“米纸”,词不达0 K/ H! W: ^! M! Z) H9 I
    意。这个译名参见台湾远东图书公司1977年出版的、由梁实秋主  Q0 u4 h9 l, V. J% e) E4 ]4 a
    编的《远东英汉大辞典》第1784页,他把rice paper译为宣纸或通草
    2 A8 \. o, `  U8 y6 k纸都是不对的,但至今还有人引用(例如,有一本文房四宝杂志,仍
    9 s, G9 X* Q% _. `6 P! G, J然把宣纸译作rice paper)显然不妥。还有的译为“writing and puctu-
    7 D# A7 n! V, Y4 L( Q; F7 ]ry paper”则更是风马牛,这种“洋泾浜”的英文,是“书写和图画纸”的$ ~) g: T5 u2 n
    硬译名词,对“老外”而言,完全看不懂是啥意思。书画纸的英译名
    5 L( D9 o" U" t. ?$ _) N应当是:handmade paper for painting and calligraphy。
    * r2 |/ Q1 W2 G: i) w宣纸最简单、正确的译名是Xuan paper。《光明日报》1990年2
    4 ~- }7 F& x% l1 g* B6 P月8日第3版发表的署名文章说:“把筷子英译为chopsticks,宣纸英' s3 A$ g! f; N$ ^8 Q
    译为Xuan paper,均非常贴切,一眼就可以看出其意义。像这样的0 H- d, n& }# P1 ?
    英译不但中国人觉得好,外国人也容易理解和接受。”今后,如果对
    4 R! q8 D+ q4 Y: s& g" V$ n外宣传的口径一致了,事情便会好办些,也能较快地做出成绩来。

    ) L3 _+ K4 t! X" p4 w: J: @4 G6 c2 M
    5 _7 K: n+ v! i; D/ m5 ?8 F. Q
  • TA的每日心情
    开心
    昨天 06:15
  • 签到天数: 1399 天

    [LV.10]以坛为家III

    发表于 2022-10-4 11:07:46 | 显示全部楼层
    C兄,已做切图!!
  • TA的每日心情
    开心
    2024-3-25 11:51
  • 签到天数: 453 天

    [LV.9]以坛为家II

    发表于 2022-10-4 12:06:09 | 显示全部楼层
    支持楼主,道虽迩,不行不至;事虽小,不为不成,说得太好了

    该用户从未签到

     楼主| 发表于 2022-10-7 00:06:10 | 显示全部楼层

    $ G  l5 ^3 Y6 q/ z' Q1 Ytake 条 http://feecd.ducidian.com/index.php?title=take2 _; J# }" K  r( [$ n% v+ [) Z# |

    " X  |2 f6 R$ |2 @) @4 C
    ( i! x6 D& L0 l/ J3 ^abbey 条 http://feecd.ducidian.com/index.php?title=abbey
    * p9 s: c- V. U& z7 A
  • TA的每日心情
    开心
    2024-3-25 11:51
  • 签到天数: 453 天

    [LV.9]以坛为家II

    发表于 2022-10-7 18:21:25 | 显示全部楼层
    ' }, E! P; n# M1 `) d$ _2 z

    6 W: a! R1 r$ @  m* H6 C# l9 g太细心了,这样看原书的错误可能还有不少
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-22 06:04 , Processed in 0.024925 second(s), 27 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表