掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: bt4baidu

[词典校勘] 【精校人员募集】World Book Dictionary, 2015 勘误专帖

[复制链接]

该用户从未签到

 楼主| 发表于 2015-11-7 11:57:19 | 显示全部楼层
empenguin20 发表于 2015-11-7 04:05
9 i) }( @. c3 r鉴于楼上都不严格按照规定数额认领,我也来凑个热闹。认领图片文本化,65至125。
+ J6 i9 H3 }6 F. D! d0 E9 d我想问下楼主,音标为何 ...

  W& m6 p9 r! f5 t( }$ h$ l' W所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能
8 f$ ^# B) q- l. N# i$ h% t0 y$ L0 c& Q8 d# s
那个带上横杠的 ė还有i、u̇等,实在是找不到啊。。。! O2 R9 I$ D9 p0 }* A  ]2 {2 k+ S

: p' l3 u4 R. E% P用两个HTML实体字符似乎能勉强拼出来 ė̄=& #x0117;& #x0304;

该用户从未签到

 楼主| 发表于 2015-11-7 12:00:04 | 显示全部楼层
qazqwe 发表于 2015-11-7 11:52# p  D" b6 l& m, i8 H* d7 W
原本的範例裡面是用ḗ 取代e DOT MACRON,
! D  |5 x- q, p+ n9 J- a有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...

% Q% ?: M1 o+ |: }! u; ~2 W2 V完工以后可以用HTML实体字符拼
3 w, F* I$ z3 O7 F; [1 G; L9 B比如ė̄ = & #x0117;& #x0304;
+ L) z5 |! J# ]
/ t( H! D! M; P0 C5 z参考别人的写法,保持一致就行,后面可以全文替换

该用户从未签到

 楼主| 发表于 2015-11-7 12:04:21 | 显示全部楼层
dhs1001 发表于 2015-11-7 10:433 T8 s3 I. a# j3 d: x# i
把9楼empenguin20兄的下载回来看了一下,发现对于ryuya兄所提示需要对照文件名存有一些疑问。
/ P! i5 \/ R2 n7 ]2 F3 L从empen ...
8 Z, D0 O  R0 t% T
能找到对应字符的尽量用对应的字符,实在找不到的,可以先用类似字符代替,后面再想办法
: c+ w" Z2 W, r* b' j6 k

该用户从未签到

 楼主| 发表于 2015-11-7 12:08:08 | 显示全部楼层
mitkyg 发表于 2015-11-7 06:51
, I  ^8 P1 F" Y: l' v我又来了
9 P" y- r4 q, K3 C2 I$ \9 j. U" ]" v6 e' r9 a5 {  s( s0 b
认领 1、符号or插图: 11条,募集1人

2 M$ K3 t/ B: M: X' \如果能找到所有插图就完美了: s9 k1 R; O* p  D9 Z/ \
# D9 {! A  B( n0 z" \1 ~3 _6 b
只要按词头+.jpg/.png后缀命名,很容易合进去
$ p1 F3 {0 \9 Q& U# X3 l, _如果足够清晰,背景为单纯白色,还可以写程序把背景透明化

该用户从未签到

发表于 2015-11-7 12:12:31 | 显示全部楼层
bt4baidu 发表于 2015-11-7 11:571 n6 y+ \4 ^9 W
所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能
+ T9 B: y) W; N- c9 s" G$ z4 N& T6 H6 I0 D. t
那个带上横杠的 ė还有i、u̇等 ...

9 u" e* L3 ~2 b1 p7 e4 C带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

该用户从未签到

 楼主| 发表于 2015-11-7 12:23:38 | 显示全部楼层
tsiank 发表于 2015-11-7 12:125 F9 Z$ ^/ t/ Y. Q  z9 m
带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的
! T9 g. ?% w  t/ U/ d& r' G) [- X
这种不是,这些都有对应的字符,xls里已经写了
' K* ]! @: N: B$ I2 z3 |" l3 n带点+横杠的e,i,u找不到,似乎可以用两个HTML实体拼

该用户从未签到

发表于 2015-11-7 12:26:18 | 显示全部楼层
本帖最后由 mitkyg 于 2015-11-7 12:35 编辑
' g& |" r! v" n7 A9 q2 v( g* B
bt4baidu 发表于 2015-11-7 12:08
  `# u2 |* Q- U9 I1 A8 l如果能找到所有插图就完美了
" e+ G$ a. y% R0 \% j+ z# m/ z1 r+ h; K3 r) Y2 B* _( k
只要按词头+.jpg/.png后缀命名,很容易合进去
: v+ ^  N6 C1 V" q( P7 ~; S' K# H  k
! _+ T* U: i& {4 s* N. |

4 u; B0 N, L9 i  ~& {$ A/ ?radical sign 书上是这样的,, W9 r8 s0 j+ y+ `

! {7 L1 G2 J/ U) P( x% Y- G对比wbd的preview版2 h" s  I# f7 C( h! B: q2 k. ]

# r! G: ^. ]  J! t* n9 W- X" c0 v& b7 f8 S
把“根号16”也截出来替换下?后面也少了= the cube root of 27 = 3./ N+ c4 A" A* C: F
, \* b+ a5 g0 f( y% |0 o
再一个fraction, M+ _4 F( \1 B5 f
# u) f6 l3 X1 K1 j1 O9 H
书上是这样的6 ?' L# [1 j& @  f  |
, w( ?: t+ J+ H2 y/ S0 ^6 v
都截出来替换下?
5 H2 p" W0 y- |* D; v% }/ B. t$ y) }  `

' E$ a3 Q& H* ]7 ?另,图片得一张张截取,2200多页,也不知道有多少张插图,尽快完工吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2015-11-7 12:35:24 | 显示全部楼层
贡献两个特殊字母:ǡ ȱ
" n) A  u. d, Q! ]8 a) Ie的那个找没有。。。

该用户从未签到

 楼主| 发表于 2015-11-7 12:46:37 | 显示全部楼层
mitkyg 发表于 2015-11-7 12:26
" M2 d1 y+ W+ e6 U/ rradical sign 书上是这样的,+ ]9 u7 ?# B6 l* E% _
+ _4 `8 T% C8 v! E/ w
对比wbd的preview版

. a; W/ C9 R* R, M: P书还是PDF?一页一页拍照?那工作量可不小
/ s2 x3 a2 K8 i# _0 n% m' m; r, u, x2 U% d
如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

该用户从未签到

发表于 2015-11-7 13:13:27 | 显示全部楼层
ė̄ ǡ u̇̄ ý̄ ẏ̄ b̆ ȱ b̄ ṇ
5 l; |2 H* x; h7 H  l6 b' Q6 d( j暂时先改了这几个。 希望能有用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:25:21 | 显示全部楼层
    百度兄还有任务吗,我也想加入

    该用户从未签到

    发表于 2015-11-7 13:25:26 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 12:46
    7 a1 C* a; n+ m; H书还是PDF?一页一页拍照?那工作量可不小$ @; a, e9 \# }/ H5 n
    8 }' j+ d) ~5 y! H' U( {
    如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的
    8 ~' F7 s0 H/ U  v2 z* j: s+ G" r
    pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定吧,试截几张,看看图片堪用不7 C3 x- [% Z. T8 a! P7 o, i
    3 r1 o4 u$ R% u3 `  u6 [( j3 c

    7 X- p  G0 ~) {. v* T  }4 p4 O; W0 `* s! ?) Y- M
    " W- {+ q( q$ a+ M: F' i
    ( @  w9 M% W( k! a4 q5 }$ S

    & Q: F* e. T) `9 K6 f

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    图片截取后,我来做图片的优化和减小体积。还烦请私信  发表于 2015-11-9 22:30

    该用户从未签到

    发表于 2015-11-7 13:32:01 | 显示全部楼层
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    该用户从未签到

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    qazqwe 发表于 2015-11-7 11:52/ z) ?$ w+ M5 \4 a" \  U# r3 R/ c
    原本的範例裡面是用ḗ 取代e DOT MACRON, 4 k. d* u/ E& T! H
    有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
    ...ḗ 取代e DOT MACRONḗ 取代e DOT MACRON...
    # v% e  O8 O5 r# S. V, H
    商榷: 如果实在没有可以办法, 宁可留存图片。
    * i3 [1 G  [! L+ @
    ...y DOT MACRON 還有類似 ȳ́         ȳ̀ 的寫法# c  J9 t5 U( Q8 H9 g
    ' v- v7 c7 A5 b# f3 M這要統一做法還是看每個認領的人主觀認定....
    0 v& _4 M0 z6 t: s) p1 G( D
    商榷: 不存在主观认定的问题, 一切以原书/PDF内容的客观为准。
      A) r( x# Y1 e) z
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    该用户从未签到

     楼主| 发表于 2015-11-7 13:47:15 | 显示全部楼层
    mitkyg 发表于 2015-11-7 13:25
    * t3 U% U0 U' `pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...

    * E$ m$ `! U* R. N4 j  y$ _质量不错啊,辛苦啦
    ; Z' ~5 M7 N& b% J/ W1 J2 p既然人工截取,保存的时候记得文件名存为"词头.png",不然就没法一一对应了% e, f) ^$ i+ c* _
    慢慢来,不着急
  • TA的每日心情
    奋斗
    2019-11-16 20:51
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2015-11-7 13:56:34 | 显示全部楼层

    1 P' C- L2 ~8 K. k% d我来做音标文字错乱61-120,请楼主批准!!!

    该用户从未签到

     楼主| 发表于 2015-11-7 14:11:40 | 显示全部楼层
    bsqby 发表于 2015-11-7 13:323 `3 ~0 ]" s+ ~% H1 i9 U( T
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧
    8 A! p. y7 d% Y
    已分配,这个不太好改的

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:21 | 显示全部楼层
    fuxy526 发表于 2015-11-7 13:39
    " N1 G: r; h& x; O  h& n) t我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    : ^" z- p, e' d0 }0 s& ^图片文本化剩下的都归你了,具体看XLS

    点评

    OK thx  发表于 2015-11-7 14:16

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:36 | 显示全部楼层
    shakahenryqht 发表于 2015-11-7 13:56
    & h7 h2 i) m: @) f; ]$ g9 l; o我来做音标文字错乱61-120,请楼主批准!!!

      `2 F. R' r5 n) Y& m& _OK

    该用户从未签到

     楼主| 发表于 2015-11-7 14:31:28 | 显示全部楼层
    本帖最后由 bt4baidu 于 2015-11-7 14:33 编辑 1 f, P  l9 F3 L1 o3 A! S* @, @: G
    mitkyg 发表于 2015-11-7 13:25
    8 s/ R% h! z) P5 \- R( ?pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    , f1 q+ C2 C0 v4 @
    % J4 |1 c6 B! o! D, Z: E

    ) M" Z9 h2 s6 j( e" V, A$ ?1 }0 c' _. A8 ^
    只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-11-7 14:46:05 | 显示全部楼层
    本帖最后由 mitkyg 于 2015-11-7 14:53 编辑
    " L) I; u2 ?# X! I( b% \) s
    bt4baidu 发表于 2015-11-7 14:31
    - f6 \' R1 z4 F& b/ x# @) G只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    , L  u- N9 U. S$ r/ S+ t& Q% o7 \' }7 s, v& r
    好,等图都截完了,我再用美图秀秀处理一下
    $ f6 _/ ?3 h4 j0 C  z& J5 Q' k% Z. c6 ]# b! N; d6 {1 ~% \! Q
    同时我没有截“星号”,这样显得更美观些
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2015-11-7 14:49:46 | 显示全部楼层
    想报名参加,不过以前没做过词典,不知道会不会给你们拖后腿啊??

    该用户从未签到

     楼主| 发表于 2015-11-7 14:58:01 | 显示全部楼层
    mitkyg 发表于 2015-11-7 14:462 {5 u; L/ J( E7 u) a
    好,等图都截完了,我再用美图秀秀处理一下
    5 ]; q: A8 }! t  g4 W
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成
    : X/ R4 M  X2 G1 Z程序处理不了的再找你
    * E* t- a6 {+ l' p* M
    2 I* ^- m6 c6 `- z6 x" W4 l最关键的是文件名,这个不能和词头对应起来的话就只有手工了

    点评

    可以再尝试缩小图片体积,这个,到时候我来处理图片吧  发表于 2015-11-9 22:32

    该用户从未签到

    发表于 2015-11-7 15:13:24 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 14:58: o2 \& J/ D! r
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成' o3 J3 z0 t3 g+ [. m
    程序处理不了的再 ...

    + j! u% \3 n+ T我刚截了24副图,对比一下,你用工具可以尝试下
    7 E  l: ?/ p# g6 q# x
    ) o/ l) m" A& Uhttp://pan.baidu.com/s/1pJ5WYzp
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-23 22:53 , Processed in 0.021572 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表