掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1458|回复: 14

[教程] 外研社新英漢詞典 (圖片版) 的製作步驟

[复制链接]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-3-17 21:05:27 | 显示全部楼层 |阅读模式
    本帖最后由 喬治兄 于 2019-3-21 13:37 编辑 ; M: N+ d9 y) _" V. G, v+ c( Z* w4 D

    * N& P/ c8 i& t0 w  f% g" D3 l小弟並無什編程和正則表達式和 html css 等等背景知識
    4 k/ S3 D6 Z! T7 b+ y純就對 excel 有些經驗試著製作, 也就土法煉鋼之法. |% k6 U* o' Q/ `+ X2 ?
    正則表達式和 html css 均是套用$ _; M, q( T& H& s0 ?% A- `' k  y
    若教程有疏失敬請海涵也請不吝指出錯誤- Q1 d2 V0 k) g3 t: c
    外研社新英漢詞典 (圖片版) 的製作步驟如下:
    # Z, ]3 [6 C* [9 W/ W' V1. 要先預估其要製作的辭典的辭彙量, 3 N+ A/ X; Z: |; T0 M% i! h
        若能知道正確辭彙量是最好的, 但往往不知道其多少辭彙量; H( w$ @  V7 H3 W. B* R" O: k* w
        可能辭典序言上標示的辭彙量也不一定正確
    , J) b) S4 P6 y    此可利用 Excel 統計 random 的函數產生的 30 個隨機數來挑其頁數1 ?; {, v! j0 e% q
        算一下那 30 頁 每頁各多少詞頭, 然後求個平均值在乘上頁數.......就大概是那辭彙量8 v4 ?& T; P9 K
        保險一點的話在加上3個標準異差乘上頁數.......這樣辭彙量應能大概都能含概了吧
    . f( T/ O) a, D8 l* Q. D    因此關於您要用多少的辭彙量來配那本字典, 您也可選 30~40 萬的 wordlist 來配4~5 萬的辭典
    ; i2 \8 S& I) f8 j    問題是整頁都是多一堆辭典沒有的字, 也是同樣多花時間找
    ; W; t8 ?$ @7 W    p.s. 辭典詞彙量估算匹配 https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33621&extra=7 p4 k* W& h2 L& Z- G+ K% h
        已提供試算表 您可自行預估拿捏
    4 g% ^3 I0 E) Y4 f8 E8 y2. 對每頁取其左上角詞頭 OCR後再轉貼到 excel , 第1欄為單字, 第2欄為頁數, 如圖No.1
    + L/ N; R4 T) w4 H/ ]3. 如圖 No.2 第1欄是正常的單字, 第2欄 是處理過的單字==>去各種 ' ,  . -  和空格 全去掉僅留英文字元1 s. [, @( P! L' U1 h- h
       其原因請參考此帖[讨论] 索引字典詞頭的排列順序
    . z- d9 l. p5 e# S" j/ q8 h
        https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=32609&extra=
    6 m6 U* I. S. C' n& s: A" e$ f4 Z   然後選其4欄對第2欄排序若第3欄的順序有錯則表示是您第2欄的單字處理的還有問題% r6 P, c. l) M8 A. n# |7 ~
       此步驟一定要處理到依第2欄排序,但第3欄的頁數順序是無誤的
    ! B0 }, ]8 `) y# ]0 D6 H4 h   您可排序後自增一欄用後面頁數減前面頁數來看是否是 1 然後查找不是 1 直到% x5 h0 I0 x  v9 a- A/ m
       依第2欄排序,但第3欄的頁數順序是無誤的為止
    6 S( y5 c& ]6 M. p# v& ~3 n4. 然後選其 2, 3, 4 欄 整個 1~1795列 有資料的區塊在 excel 公式 \ 名稱管理員 ==> 新增一個名稱
    2 c8 E; i4 S% E) \( B$ R* i5 v  G    參考 圖 No.3 , 圖 No.4 如page 的那個名稱
    9 T4 ]3 ]3 H' V+ ^, k4 E5. 參考圖 No.5 把您要搭配的 wordlist 考到 另一 sheet 的 A 欄 單字 那欄
    & E4 v. j7 O3 F/ b    B 欄 搭配用則是 A 欄處理過的單字 處理的方法==>去各種 ' ,  . -  和空格 全去掉僅留英文字元
    , E2 J+ t! J3 k3 P. s    然後再選取 A , B 兩欄依 B 欄為準作排序4 P  \, @1 j  O  U
    6. 然後就可在 C, D 兩欄輸入vlookup 的公式了  C 欄=>參考圖 No.6
    8 e# V) K0 N1 ]8 ]1 Z" p  w   D 欄=>參考圖 No.73 h8 {8 |  j* ?) ~5 X, `, L) `
    7. 參考圖 No.8
    ( C# d$ ~8 `6 O8 b( `) l8. 參考圖 No.9 但因 concatenate 此函數無法輸入" 符號 , 所以考背好整欄後在文字處理器去加工 " 符號好後再0 w1 o: {( t0 T* e! D7 z$ D
        回貼到此欄
    9 F5 ?+ B. u2 C- ]0 |9. 把 E,F 兩欄資料複製到文字處理器作正則處理把同一頁的單字拉到同一列上 如圖 No.10
    ' m1 t1 y6 s* t/ Y) `    ^p<tab>==> ,
    + ]5 j8 @( p4 P% `' m9 ^10. 再回貼到 excel 另一 sheet 上 如圖 No.11 變成 A , B 兩欄的資料* C/ r: Q" F2 F7 q  ^  L
    11. 再以 圖 No.11  A , B 兩欄的資料再新增一個名稱 pw 如圖 No.12/ ], \$ j# u( d) H2 p! X6 b" u
         公式 \ 名稱管理員 ==> 新增一個名稱
    7 p+ S/ Y! t+ U3 l3 I# _8 O* F0 F     如此掛在每頁的單詞表已完成剩下僅是在合併翻頁和圖檔.png的合併! ~2 A% ~# J5 k  k& S& @! U
    12. 單詞表合併翻頁和圖檔.png 不太好解釋但做起來不難就純粹以 CONCATENATE 函數去把所有想要實現的功能結合掛在頁數的那個編碼號而已
    7 ?: V4 D6 e$ m$ Z      如圖 No.13 ====>結合後的結果(翻頁+單詞表+圖檔.png)在 C 欄
    * W5 X' v; u+ i1 O: T% y! i6 O13. 然後再以圖 No.13 的 B , C 兩欄
    5 U/ z1 _4 L% W0 Q; {& g     公式 \ 名稱管理員 ==> 新增一個名稱 wtp
    5 {  O9 V# A7 k7 a/ h2 I' h$ w     如圖 No.14
    6 G7 X' j- l/ y3 l* C6 \' M14. 再把前面 wordlist 配好頁數的部分考到另一空白 sheet 上 然後刪到剩下單詞和頁數兩欄 No.15 ==>No.16
    # p0 d! P9 f2 T15. 如圖 No.17 以頁數的那個編碼號為 lookup value 去拉出 wtp 的那張表對映到每個單字
    9 @; r: ^# u8 _) S5 h16. 再把圖 No.17 的 A, C 兩欄考到 文字處理器 上加工正則 highlight 的那部份 圖 No.18, 圖 No.197 h6 Z8 a/ x5 g
    17. 最後在執行可以讓單詞表內和詞條相同的那個單字 highlight 的正則替代式 圖 No.20
    5 ^  r3 x# G$ T+ G     或參考此帖
    8樓  jeanleem6  的正則替代式把 ①改為<mark>  ,   ②改為</mark>5 w7 H  g7 D% x8 S
         https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33536&extra=

    . k" {2 E7 M  Q: D2 f( N     此條 正則替代式 請在 Emeditor 上執行 UltraEdit 執行不了 .........原因不明
    ! H- j7 P; [$ r6 R' x- h# x18. 上傳容量今日已滿明日再補 excel 檔了 檔案15m 共4個............剛傳又滿上傳上限了
    * c4 |3 g6 @6 c1 E0 Z. V/ }% z: u) d: D1 j$ h2 t: H
    19. [工具] (更新)图片版mdx源文件生成工具. q2 _0 x# u0 _6 c
         tsiank 兄 已提供完美秒殺生成工具, https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33574&extra=&page=1 讚! 讚! 讚!
    " i) x( [# E+ A) E1 u/ E$ l! C
         ) r" S3 C& ~7 B& z! j" u8 ]
    . B6 ?1 A6 F& R3 ?  b) p- g
    3 x+ q6 T. u  W

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2020-11-10 14:17
  • 签到天数: 580 天

    [LV.9]以坛为家II

    发表于 2019-3-17 23:41:45 | 显示全部楼层
    vlookup可以详细解释下那四行分别是什么意思吗?谢谢了这个教程很详细
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2019-3-18 07:13:29 | 显示全部楼层
    “虽不中亦不远矣”的思路很有创见。
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-3-18 08:44:03 | 显示全部楼层
    感谢分享又一种图片词典处理方案,辛苦了!
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-18 10:20:57 | 显示全部楼层
    kriskr 发表于 2019-3-17 23:41+ D% [3 h9 X( N* o
    vlookup可以详细解释下那四行分别是什么意思吗?谢谢了这个教程很详细

    " \- Y2 P/ C; S9 q* ^: f# \" [kriskr 兄:
    * [8 S  A$ r* D/ a4 a5 b哇 ! vlookup 那個功能可能我解釋的不會比網上或書本來的清楚& X: v. Z8 G8 B' q$ A& |7 ^4 E* {
    lookup_value : 是你要以哪一欄位位址為準去參考對映到你欄位位址+ z. w6 C. g  I; {; C
    Tabble_array : 是你要對映的參考 table 的名稱
    - O) H/ Y# g6 ~; O5 j' h* p% ~- c. WCol_index_num: 是你要對映的參考 table 的欄位( f' k1 x$ ^3 y& @+ V4 X
    range_lookup : ~~~~看excel 上面的解釋7 ?7 h. b; q# w2 u. P$ C

    & L1 F- C+ d  Z- f$ Q- t1 U! z9 ]$ X( Q8 h% H# A: m$ L: V

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-18 11:35:27 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-3-18 11:44 编辑
    ( B* i$ J! z& ?# [; s" ~
    oversky 发表于 2019-3-18 07:13# Z% F. J8 d* V
    “虽不中亦不远矣”的思路很有创见。

    $ B4 @6 ~2 L) d- a. X- U3 F. M
    ! R( G7 d2 v" n! m/ X- P/ L$ q) Coversky 兄:3 l3 s( F9 [* e1 b
    其實也就純亂槍打鳥之術" M- \2 V1 G/ l  v: I* }2 J0 O2 c$ N8 B
    一般查詢輸入到3~4字元也就差不多能跳出正確那頁了; A8 S3 W3 x- E1 F! c* C
    主要是能翻到那頁能知道左欄還是右欄和大概位置為主
    ! f) F* D$ v! s1 n只是沒太多體力再去分左欄還是右欄) ]  p, v; H7 o" \
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-18 11:42:51 | 显示全部楼层
    VimVim 发表于 2019-3-18 08:44- O4 a" d( q' ?# M* l
    感谢分享又一种图片词典处理方案,辛苦了!
    2 ^3 c. Z. p1 D' `; G' Y
    VimVim 兄:
    % V& y: u1 ~0 p8 E6 `* \' d7 G& d您的 vim 自動方法真是令人眼睛為之一亮
    5 r, [( X6 E5 z只是小弟沒用過 vim; Q, `1 {, W- g$ M& A0 V. H- p
    無法參透您提供的方法
    $ s5 w. X8 n& l* U$ y
  • TA的每日心情
    开心
    2021-5-6 02:30
  • 签到天数: 154 天

    [LV.7]常住居民III

    发表于 2019-3-18 15:36:51 | 显示全部楼层
    感谢分享,辛苦啦
  • TA的每日心情
    开心
    5 小时前
  • 签到天数: 2013 天

    [LV.Master]伴坛终老

    发表于 2019-3-18 16:47:56 | 显示全部楼层
    喬治兄能力不得了!
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-20 10:08:16 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-3-20 10:26 编辑 * m8 `+ @0 P' t* |4 H; v* X" g
    skydan05 发表于 2019-3-18 16:47+ F& t; N! M' g: `% e5 F5 g- Z
    喬治兄能力不得了!

    , ^6 T& U, |, ^/ @/ N- ~# \7 @+ z- X
    2 t" a+ s; R1 y- }7 g+ A" pskydan05 兄:
    6 `8 G; R, V4 Y% A- q小弟這純瞎搞的
    5 u: T( D; M+ p. K利用字首把區間切出來, 用 vlookup 把 wordlist 去配此區間的字表而已. O' D8 h( A$ C' v3 l$ \  n" A
    在此區間內亂槍打鳥
    5 O, u( t7 l# c% h: y" ]不一定打中
    7 E  o; R6 D- T+ G6 \+ z- n! o& \最好是有此辭典的 wordlist 來配才能百發百中
    , d' y  f7 Z6 l9 ~& ]+ b當然最重要的是wordlist排序一定要和字典排序一樣
    ; v0 R' o' K. _4 P2 q& p9 E; o字首表也是一樣排序不能有誤) U- @) C. Q% i2 M5 ?4 C' f
    需按那規則排序且檢查頁碼不能於按處理過的單字排序後有誤8 A# N" x$ Y# h  g9 r
    則基本上才能配對區間, h0 t/ J4 z' L* m3 q) J  |3 [
    哈! 哈! 哈!
    % k# |% U3 C8 u! i" b9 Y$ @; P' q2 r* k
    ) }" G) T$ s9 c. |; z  c$ Y. G
      A$ g% z# q% O3 @, S
  • TA的每日心情
    开心
    2022-6-5 11:40
  • 签到天数: 814 天

    [LV.10]以坛为家III

    发表于 2019-3-20 19:13:20 | 显示全部楼层
    乔治兄:
    ( |* N- N* [4 }2 D2 Q% Z1 Z" N3 z# P9 \7 n
    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此文所述方法,特别是vlookup函数的运用,简直是醍醐灌顶,使小弟我茅塞顿开,解决了小弟长久以来的疑惑,这样编辑图片版词头就易如反掌了(前提是有比较相近的词头列表的情况下)。
      W3 K4 w+ h3 ]/ g* N
    + r2 z( l' i- E* O# X由衷得感谢和深深地致敬!

    该用户从未签到

    发表于 2019-3-20 19:20:34 | 显示全部楼层
    Budha 发表于 2019-3-20 19:13
    0 \% s  h0 v9 O+ _# e; V/ w+ m乔治兄:$ m6 f1 z8 E/ C" P
    9 ?! D7 v8 k$ M1 v3 W  L
    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此 ...

    , S  X+ x# F5 C* p3 f4 K3 ?EXCEL要好好利用!VLOOKUP等函数我常用。。。
  • TA的每日心情
    开心
    2022-6-5 11:40
  • 签到天数: 814 天

    [LV.10]以坛为家III

    发表于 2019-3-20 20:36:29 | 显示全部楼层
    chigre3 发表于 2019-3-20 19:20- M% Q5 Y/ X1 a/ w# o2 u
    EXCEL要好好利用!VLOOKUP等函数我常用。。。
    9 x+ ^" G5 C7 j  @) k3 m- c: O! i6 W
    C大所言极是!得您不吝赐教制作切图版词典的方法,至今还未做出一部成品,一直以来比较惭愧,以后若机缘合适我会尝试制作一部出来。
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-21 09:42:40 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-3-21 10:18 编辑 * I" [* e# e# Y2 J9 _
    Budha 发表于 2019-3-20 19:13  X- L, a4 d3 x  h, @
    乔治兄:
    4 ]0 E, o1 j% a/ D0 W5 X0 X" q. U2 N: }* N% g
    长久以来小弟我在自己所掌握的知识范围内苦苦思索编辑图片版词头的方法而终究不得要领。如今您此 ...
    " v" ?" E: O' X, L
    3 Z! s* s! u  M' O
    Budha 兄:
    % s+ }2 u2 D  H0 Z您過譽了
    1 }$ o0 x1 R8 v3 Q# k5 l小弟搞來搞去也就只會那幾招也教不了有什深度一點的7 R1 ?5 _2 ]# E, b" w: r
    承蒙您不棄小弟這土法煉鋼亂槍打鳥之術9 r/ Z3 t+ W  b0 G
    謝謝啦# ]4 K* C" f( N# `/ p
    [工具] (更新)图片版mdx源文件生成工具* e/ S5 }# O9 @! X+ g2 t7 A
    tsiank 兄 已提供完美秒殺生成工具, https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33574&extra=&page=1 0 P( y6 [* `0 O2 U! j9 @
    % M  V0 I0 E& ]. n" ~  T* ]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-3-21 10:00:37 | 显示全部楼层
    chigre3 发表于 2019-3-20 19:20: `$ n% u; N& Z* \! c4 p9 b: p+ x
    EXCEL要好好利用!VLOOKUP等函数我常用。。。
    9 _0 M3 g) C; \, A1 Q* F
    chigre3 兄:. p9 C& x& J6 x* L! t, ]. t! P1 O
    您那製作法才是精品之道- @* e3 e5 Y6 X' G( |
    真令小弟讚嘆卻又難以仿效
    $ v1 S; E1 w% w+ E; r, L. ?  _主要是OCR和校對太累
    ) L1 o; s/ K# I* z( u切圖詞典才是終極目標
      a# \5 S* S2 z+ Q! [. t8 O感謝chigre3 兄多次指點迷津& ^  f2 U1 u# ~9 x) O5 R: O
    解答許多製作上的疑難雜症之困惑
    % d, d4 `" |; M, z% E讓圖片式辭典在製作上更加順暢
    " {# n8 h1 l% M9 iThanks Again0 ^$ o0 e9 S/ [. _! i
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-8 12:45 , Processed in 0.084739 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表