掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: Cdasjkldjas

[讨论] 【讨论】如果要把老神仙的《英汉大词典》弄出来,XML标记怎么约定?

 关闭 [复制链接]

该用户从未签到

发表于 2014-5-15 14:29:40 | 显示全部楼层
Cdasjkldjas 发表于 2014-5-15 13:44
2 O: C. B+ l. I( k  {* f0 U( b原图在此:& p& o* U9 ?; b+ g9 c
) g: a" _& d7 C+ [$ ~0 X2 m
链接: http://pan.baidu.com/s/1bnb6GZd 密码: nz9h
! R4 X. j6 Y; H
{:5_227:} & U% Y% R! h# M  i
  X  L1 F& P4 k: D- Q: C* y
其它不说,OCR得到文本效果真是不错。希望楼主坚持下去,别人参不参加、有多少人会参加我无法预测,但我肯定是会支持你的。
" @) k* |2 N0 B  j' q9 T" A6 l. T2 S' k7 K8 d9 f  ~- z

点评

谢谢O大的鼓励和支持!  发表于 2014-5-15 15:34

该用户从未签到

 楼主| 发表于 2014-5-15 15:44:30 | 显示全部楼层
' n& ^# a: M/ i$ _  J3 D9 d, f2 C

+ F( q3 s8 o8 ~* V, ]* \扫描工作已经开始进行了!
# P6 k6 O8 N) i; I( G
" k. ^. M0 O8 g# [+ I; a, g目前已经扫完前50页,这50页正在上传。
+ @4 s+ T- d) D' @) W2 D2 P' L4 c! a# U
我期待校对工作立马跟上。
( ^0 [" m: G  z2 I# \8 C+ @$ O- W; d9 t3 `3 o* P' {" X
格式化工作紧随其后。
9 W. Z2 M) a) Y# a% U
/ L0 l& E7 q( x4 a8 F- e扫完的时候也是我们得到词典的时候,这是最美的结局。
( s2 [; K& v6 ]4 P! H6 x' M( z& k8 @) b! r' v: Q
希望各位前辈待会儿等我上传完前50页之后给出校对和标记标准规则。& L1 ?1 x9 M+ t7 z

; V! {( Q3 |% C7 h+ f" ], t! }这方面我完全没有经验,还请大家多多支持,多多探讨。
% ~* p  O" s/ R4 P& Y: d
/ G: V8 P0 ?- a- I如果能给出范例、截图想必是更加有利于讨论的。
8 K% ?# X% A& n' R. f
0 {3 O# J/ n% G2 j3 g
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2014-5-15 15:55:51 | 显示全部楼层
    本帖最后由 spoony1971 于 2014-5-15 16:47 编辑
    7 I) j: L" s9 l. _- j0 X- x; o. W! |  F, n1 n: K6 L
    Markdown 例子,词条: w3m
    1. #w3m
      - `8 t& a% P3 L0 P6 ^1 T
    2. w3m is a text-based web browser capable of displaying tables, frames and$ q9 L- R5 ^/ [! t) B7 \3 t. a
    3. inline images.
      ; P) Y3 d) J8 g' m

    4. * s3 X+ m$ g9 U2 h' ~
    5. ##Tips1 N. ^& y- A  h9 `/ J0 M8 \
    6. To display white background on transparent images change the following0 }2 }! U8 h; d" k* j
    7. setting (see README.img):
      5 O) Q, c! E7 R! }1 S0 e

    8. ; W; B# ~/ x; ]% M5 q
    9. 1.  hit 'o' to go to Settings1 ^6 P" g8 I" O, ~$ v5 s2 e
    10. 2.  Under 'Display Settings'% W7 n- e3 k. i, B9 n
    11. 3.  in 'External command to display image'
      8 [" V$ V9 g; w4 f
    12. 4.  add '-bg "#FFFFFF"
      2 Z3 ^5 R3 j. j$ m8 D7 S

    13. 1 |- Z$ m1 h; [; z
    14. Retrieved from
      / q; {* o& c6 a! b" ]7 {
    15. "https://wiki.archlinux.org/index.php?title=W3m&oldid=252649"# e3 d) ^8 ]5 ?4 ]
    16. 9 ]$ y% m7 d5 y- `% B
    17. Category:6 |- Z3 ~! `8 r" k% k

    18. 4 c& U1 v- P. {6 }$ u
    19. -   Web Browser
    复制代码
    效果见(可配备不同的css):! W; Q: r- E7 j
    https://wiki.archlinux.org/index.php/W3m

    点评

    像我组织其他人一起校对/录入, markdown明显还是不符合要求, 他们需要最简单的操作, 所以多一个标记符号都是多余. 所以...  发表于 2014-5-15 15:58
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-5-15 15:56:18 | 显示全部楼层
    效果很不错,支持楼主。
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2014-5-15 16:04:21 | 显示全部楼层
    本帖最后由 spoony1971 于 2014-5-15 16:14 编辑 5 ?- X, t& s' F( u6 B& s0 a! I
    spoony1971 发表于 2014-5-15 15:55
    9 q3 D1 x4 H$ p% eMarkdown 例子,词条: w3m效果见(可配备不同的css):
    + ~5 @% |+ ]$ \+ [/ uhttps://wiki.archlinux.org/index.php/W3m
    5 y7 c+ s" P% ~% T2 U9 P

    ; u8 C, U- Z# B& r# d6 }只应该使用两条:7 Q9 O. f- ~* P8 @) r0 V
    1。用空行表示分段
    " {0 X# @) {2 B2。词条前加'#'0 _/ @4 p2 z$ D

    . `" T# b( ^* v5 Q7 s" J9 c更简洁而且还能保持灵活性(css)应该很难了。像文本缩进,居中等等之类的应该通过css来完成,不需手工输入。/ O4 m% q. ^- s3 |/ i& O# }

    该用户从未签到

    发表于 2014-5-15 16:23:40 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2014-5-15 16:57:45 | 显示全部楼层
    ocr的效果惊人,超乎预料。{:11_324:}

    该用户从未签到

     楼主| 发表于 2014-5-15 18:22:37 | 显示全部楼层
    扫描结果每次在1楼更新,0001-0050页已经出来了

    该用户从未签到

     楼主| 发表于 2014-5-15 19:25:44 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 16:52 编辑
    ) d. o8 U) `  U8 a- T3 }: L7 Y# P. e1 c) a& ?
    Github for Windows使用图文教程:# z' ^2 [. [$ y

    ' j* f/ G) f  A: `5 S1 M7 A. thttp://www.cr173.com/html/15618_1.html- _1 O1 i% u5 n

    . M- l$ {+ G& W- s$ `0 eGitHub for Windows安装失败解决:
    0 a8 M  @6 O) ^; s; X8 F" y1 |
    - R% g& `- P5 l$ |2 H" m! }http://jingyan.baidu.com/article/fd8044fa924e8f5031137ac6.html

    该用户从未签到

     楼主| 发表于 2014-5-15 20:56:43 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 23:09 编辑 6 N- N5 d6 L9 `  z3 _
    5 R% B! e6 S$ p) W
    001-0050:
    3 |! Y# i% J3 i2 l2 R6 W  L+ t: R8 o2 ^# h/ h# p

    该用户从未签到

    发表于 2014-5-15 22:50:02 | 显示全部楼层
    感觉好强大,很清楚。

    该用户从未签到

     楼主| 发表于 2014-5-15 22:52:25 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 23:11 编辑
    & Q" r1 S& t" ]9 i; k# D/ {+ v: ]# R7 h- y
    0051-0100 上传中:* N0 v& ~8 T3 M6 P

    该用户从未签到

    发表于 2014-5-16 05:05:34 | 显示全部楼层
    本帖最后由 chigre3 于 2014-5-18 20:32 编辑
    $ {5 `$ G& ?2 E, O
    . i/ g( M3 T, ]2014.05.18更新:; B* O$ s/ {/ R1 B; X
    ECD2校对参考指南.zip' @( r0 G8 U1 p! G8 @6 O* v: `
    3 b, `& ^4 l$ g" K2 I5 ~0 X8 n
    --------------------------------------------------------
      m" B* S4 O# f2 L" k0 D7 h自定义语法高亮显示 (点击下图, 下载查看更清晰)
    $ ?8 t2 U2 d7 @4 g6 |左边: 原图片    右边: 化妆后2 u8 v$ O2 Q9 v: H4 Z& v: T

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    校对与格式化工作您来主持好不好?我集中精力于扫描上,后期再参加校对和格式化。  发表于 2014-5-16 16:08
    多点32个……  发表于 2014-5-16 15:57
    点32个赞!  发表于 2014-5-16 15:57
    点32个赞!  发表于 2014-5-16 15:56

    该用户从未签到

    发表于 2014-5-16 11:12:47 | 显示全部楼层
    chigre3 发表于 2014-5-16 05:05 & [! M' r3 l( U4 S- H
    1. 20140515_0_校对录入指南.pdf

    : W0 s  L/ F; b- |3 ]0 m9 Q- s3 J) Y/ _1 V% e# B
    4 S, S3 c' z  i0 t6 S6 @7 ?3 q$ `
    辛苦了。
    ! d3 P2 {) a2 x4 d1 q我随便一瞟,就发现几个打字错误 ,惭愧惭愧。
    - n' ]6 a* C5 l8 B
    5 v0 n6 e$ P$ g6 W  f% U第1~20页的校对和格式化就交给我了吧。
    ( c# o9 Y2 D( g
    2 Y! B! M* _$ h7 n, A7 K

    点评

    点32个赞!  发表于 2014-5-16 15:57

    该用户从未签到

    发表于 2014-5-16 18:52:41 | 显示全部楼层
    chigre3 发表于 2014-5-16 05:05
    9 m( p3 I& R. y# @4 q' W8 O1. 20140515_0_校对录入指南.pdf
    原词典中的【】直接使用[ ]
    3 S% E# ?2 K2 S4 q8 `* z
    建议【】用 {} 代替,因为原书中用方括号的有很多,大括号几乎没见到(如果有大括号就用全角)2 k: z8 C. z. {' K
    方便以后替换操作

    该用户从未签到

     楼主| 发表于 2014-5-16 19:12:23 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 23:14 编辑 & B% B; @! q  f( k9 N7 i7 R
    8 E, i4 X* T- d' J/ Z2 v' h; j
    101-200
    . Z$ {! y% ~/ @5 w/ Z* y& O8 z- q! L& c" V; C

    该用户从未签到

     楼主| 发表于 2014-5-16 19:15:59 | 显示全部楼层
    ) N0 x" N& g, ]8 B5 K# R; f
      ~  _$ A) \* T* B- u
    8 Z) f# ]! H* [+ B

    + f  o) S/ v# q# ?5 l: M
    9 J9 A& W7 U' O& G" B8 ~
    # D' u. |/ B0 }' I* ?
    5 _% K# g" R* }5 Y
    5 ^' V9 U) S! Y4 ~) p4 R" Z5 f3 i! ~/ S
    ' T, m  T6 q% b/ H6 A& S
    , ?2 G5 @9 T3 E2 c! l9 @* |

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2014-5-16 19:36:00 来自手机 | 显示全部楼层
    因为【】标签就那么几十个,替换成 [ ] 完全不影响。{}需要换档键输入  不好。  另外,图片打包压缩再上传吧。

    点评

    压缩了,没有打包,要不一个文件太大,单独需要某一页进行校对的人会很麻烦地要下载一个大大的文件,结果他/她只是要校对其中一页而已。  发表于 2014-5-16 19:53

    该用户从未签到

    发表于 2014-5-16 19:44:18 | 显示全部楼层
    Cdasjkldjas 发表于 2014-5-16 19:15
    ) i5 v/ A4 N; S0 K. E' y; w# z9 Y8 O
    咋回事这是?
    ) S& v! V" {( s# Q* @7 V, d

    点评

    我从来没有扫描过那些东西  发表于 2014-5-16 19:49

    该用户从未签到

    发表于 2014-5-16 20:11:53 来自手机 | 显示全部楼层
    边扫描边销毁 不错的想法 lol+ e0 h+ i* H/ _. Y# W4 z/ J
    我就第101-120好了 预计下个月完成

    点评

    前200页的OCR 链接: http://pan.baidu.com/s/1D27sa 密码: occa  发表于 2014-5-16 22:41
    点32个赞!  发表于 2014-5-16 20:14
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-5-16 20:33:27 | 显示全部楼层
    我校对和格式化1001~1020页。

    点评

    点0x20个赞!  发表于 2014-5-16 21:03

    该用户从未签到

     楼主| 发表于 2014-5-16 21:41:28 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 23:14 编辑
    ; W! \, \5 n1 H. |
    8 n, U  Q% H0 [& w" {201 - 3000 v: l, I' T: H& b6 u7 r1 j2 @

    该用户从未签到

     楼主| 发表于 2014-5-16 22:37:10 | 显示全部楼层
    本帖最后由 Cdasjkldjas 于 2014-5-16 23:15 编辑
    & u% X" l* q8 v, W% n! w- J6 u4 l2 ?2 p' D7 Y
    , ~5 d' `5 K. m4 _
    1 Z! m$ o  x% }5 P' Q
    我会继续扫描,但是在我考虑清楚版权问题之前不会公开。
    $ d4 E% ~) x$ E# B. R
    7 g1 M. f% X7 H9 t: N: m9 N

    9 [' k' {8 G9 o$ r9 Q- _  Z$ \* k. a2 v, y% j3 [

    该用户从未签到

    发表于 2014-5-17 10:05:40 | 显示全部楼层
    顺便提一下之前1100-1120这20页(21页)已经完成,后面领任务的不要重复了

    点评

    后期工作全部在群中展开,请加群:193804267  发表于 2014-5-17 12:36
    加Q群了吗?  发表于 2014-5-17 10:31

    该用户从未签到

     楼主| 发表于 2014-5-18 14:02:26 | 显示全部楼层

    9 W6 [  U5 U$ E  t# g8 m& b. K  k5 g9 w5 t" `0 b9 m
    经过这几天和各位朋友的探讨,我发现我之前的想法有很多不成熟的地方。5 V! i* _. D0 a; F/ v2 U8 `
    ! @9 J1 U( f" k- J
    O大的讨论帖:6 R# W9 g  |& P% k1 r

    3 r, J( t' k( t0 \4 y$ C+ j9 ]6 s8 ehttps://www.pdawiki.com/forum/fo ... &fromuid=1761071 s3 @3 r$ [$ z

    & I) a- k+ ~8 `我的本意是为社区贡献一份高清扫描版,用于制作英汉大词典的电子版。
    % x4 u2 ?3 i0 p6 w/ S1 A, P$ b2 ^6 H  O- f+ \' @" U6 k0 V( J
    但是我也反对不购买纸质版(200块钱不到你买不起我不信)就获得高清扫描。- C( {6 m4 H( |* k4 ?
    % q* q7 j) d2 F7 t
    经过和前辈们的交流,我体会到他们既成的工作模式有着非常现实、非常严肃的重要意义。
    / D: q- B6 l+ C5 e" w% |. P* l# ?2 J2 o* B  i
    所以我决定不再公开高清扫描7 T: Y- [+ ]! D
      O8 i+ O& s" S8 D3 o
    如果大家在购买了纸质版之后依然希望获得一份自用的《英汉大词典》电子版的话:
    8 ?  m! [& ?/ n' i- z- g( z$ @! n4 Y6 {
    请移步至:- C2 J: ^3 C4 p

      V- n; o- ?8 X8 `' m$ y. i《英汉大词典》(第2版)文本化专贴[20140517]》
    5 K* X2 [$ R, Z5 V! ~$ _; H
    7 f5 a, N* a+ i7 u7 R( W' H3 K3 M6 xhttps://pdawiki.com/forum/forum. ... &fromuid=176107
    9 Y/ @- F, s# M0 b: {8 b  w: ~4 Q
    6 x3 L& F9 b- u4 j* K2 A) N- U, p协调人chigre是此贴楼主:& Q4 q6 D' F4 V% m6 ?, L* I% }( z4 b$ A
    / w' g( [( B' U/ @- y; @
    《【2014.05.04】《红葡汉词典》重新校对 (葡萄牙语) [还在进行中]》
    6 U, n/ H; |5 j% v( w4 f! ]
      I* q5 W: \& Q" {# V- Rhttps://pdawiki.com/forum/forum. ... &fromuid=176107
    # I. C; W6 B1 H( @9 _1 G  E& Y! s" H6 B& h* B
    . g' T/ b: b# @! ?

    点评

    百分百支持  发表于 2014-5-18 19:02
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-9 15:19 , Processed in 0.149920 second(s), 17 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表