掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 725|回复: 0

[词典讨论] 词典从数据到纸版再到 app 的工艺流程[猜测][...]

[复制链接]

该用户从未签到

发表于 2017-9-8 12:35:19 | 显示全部楼层 |阅读模式
本帖最后由 Oeasy 于 2017-9-8 12:41 编辑
" h7 z9 V  P/ s# P0 ^1 S, r% c% X5 u; O6 ]
" f5 B) Y7 }7 R( h) I. k
隔行如隔山啊,以下都是我的猜测,其实也真的很希望有业内人士能科普科普。" w- W& O' J3 c( g

" W" H. S9 b  P2 |/ M# I词典从数据到纸版再到 app 的工艺流程[猜测][...]! p1 V3 T) Z; A4 T) U4 d: k
) F. x1 n  ?; I' z8 p2 C/ v
https://pdawiki.com/forum/forum. ... &fromuid=147948
- F+ u) K" Y+ U7 v0 T# O
4 X- q. f9 x1 E0 g# Q" ?' N词典从数据到印刷,中间流程我估计应该如下:
5 o  L2 a. `9 G* U
) I" i" E) g5 v6 _% m7 m词典编纂系统 XML 数据(数据①) -> Adobe InDesign 之类的排版系统排版加上页码、封面、辅文等等 (文件②)-> 打印出纸版继续校对,如果有错那就直接在排版软件、文件里面改,但是估计没有去改原始的 XML 数据 -> 打印样书,可能还要校对 -> 差不多了,排版完工,得到印前文件③印刷开卖……  q- p5 }5 i1 s" D: L0 U

$ f* r2 b$ \* Y' M% B& z校对改的是“文件②”,印刷用的“文件③”,但是拿去做 app 的却是“数据①”,二者内容有一些细微差别的。
8 T, e$ R/ e/ Q0 ?2 l. x! C9 X
, f+ R7 |: I' G* U  p“文件②/③”是有页码、封面、辅文等各种纸版特色信息的,是无法直接拿来做查询类的 app 的。 7 ~1 u2 u( O4 v( O5 ]( C5 R

' y; l/ i5 v0 D( Z$ N7 J% T朗文双解 DVD 图片版应是用“文件③”转制的,但是 app 以及授权给有道、卡西欧的,却是“数据①”。
: G- o/ Z' z8 K5 i* v4 M3 t4 |7 a  U9 B  `# N0 x
注:这里的词典指的是主流的较为现代化的词典。其实“古代”或者比较“落后”的词典,一个 word 文件就搞定了,不存在“数据①”。
" j2 [6 p% g$ a6 v. J( y) J# Z0 X! F" M5 V0 ~. P3 [: U
只要是电脑排版的词典,都是有“文件②和文件③”的,从“文件③”到结构化良好的、可查询的数据①,中间还有很长的路。当然,现在主流的词典,都是先有“数据①”,再转“文件②->③”,省了流程,但是,文件③的一些改动,可能就没有体现到“数据①”里,导致用“数据①”做的 app,内容和纸版有不一致的地方。
0 O0 l7 z4 i+ B; F( B: ^; M: F2 _
7 ~* W+ ^8 w/ e$ t) V
---& H! K# `9 ?7 C) D* b6 Z6 i3 I
- [英-汉] zt//用方正书版排《新时代英汉大词典》 https://pdawiki.com/forum/thread-12852-1-1.html. t( Z) x. O5 W1 q
- [英-汉] 【旧】辞海悦读器内置《英汉大词典》(第2版)&《辞海》(第六版)? https://pdawiki.com/forum/thread-12773-1-1.html
( S( ^: J. U/ U' m/ w  Z
二、开展《英汉大词典》(第二版)数字化基础工作
4 H! x& x9 V9 U/ R3 m  《英汉大词典》是编纂处最重要的词典产品。编纂处把对《英汉大词典》(第二版)的数据库建设和数据维护当作是一项日常工作加以落实。" B) n; {( k8 d  m1 S1 V
  《英汉大词典》主编陆谷孙教授在《英汉大词典》(第二版)的序言里说,“垒土不辍,丘山崇成。” 《英汉大词典》(第二版)从2007年出版以来已重印9次,一直在实践这一句“垒土不辍,丘山崇成”。编纂处在译文论坛上开辟了专门讨论《英汉大词典》的板块,广泛征求读者意见,收集读者有价值的反馈和建议;建立后台发布系统,把经主编确认的“硬伤”在译文网站进行在线发布;坚持在每次重印前必将已知“硬伤”挖改一部分,并为发现的各种“软硬伤”建档案,便于在《英汉大词典》(第三版)中使用。
8 i3 O0 E2 V5 @0 l1 g0 P  在校正词典内容的同时,编纂处对《英汉大词典》(第二版)的数据结构作了深入研究,积极探讨将方正排版数据转化为xml数据的可能性。2010年,集团为配合《辞海》悦读器开发,要求编纂处把《英汉大词典》(第二版)整理XML结构文档。由于有了前期的准备和对转档从宏观结构到微观处置的预先考虑,在短短两个月里,编纂处完成了《英汉大词典》(第二版)排版文件的转档工作,并做到了对《英汉大词典》所有有效字段的全标引。《英汉大词典》(第二版)全书1700万字,转档后的XML文档以A3横向6栏布局双面打印,共计纸样1万余张。编纂处参加数据转档工作的主要人员在两个月里,坚持做到工作日每天加班2.5小时、周末加班一天。一方面,组织力量对ECD转档文件的全文作了结构和内容两个层面的检查和通读;另一方面,采取一个编辑跟进一个打字员的方式,全程参与易文网的改样,以确保改样与复红一次完成,从而加快进度,并保证质量。
& M2 ]) N2 u4 ]" y
+ }! I& |9 Q# i" g  f  x

" `4 B$ G3 H1 n" {- [索引] 词典成本[...]  https://pdawiki.com/forum/thread-17114-1-1.html
. U5 u$ ?1 ~# T: {5 j, T- [德语] 世界上最大的德语词典格林词典在中国完成电子化 https://pdawiki.com/forum/thread-13474-1-1.html9 Y- H) }- L: z' z

. W& _2 p3 P2 ~  U8 X. n6 F7 F% T
0 q' n9 l& ]3 @4 O8 g' ]+ b7 H
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-4-26 02:23 , Processed in 0.019274 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表