|
发表于 2016-2-21 11:02:51
|
显示全部楼层
可以通过 Calibre 把 mobi 转成 epub、htmlz、zip 任意一种格式,然后用 7z 等解压软件解压,会得到若干 html、imgs 等等的文件,剩下的,就容易多了,不过也要靠你们自己的技术积累了。把 HTML 与图片整合成 MDX 源文件,这个暂时没有什么一劳永逸的软件解决方法(或者我没有发现类似的方便软件)。词条基本都在那个数十兆的 HTML 里面,会编程的当然难不倒你们,不会编程的就用文本编辑器里面的正则表达式工具配合查找与替换做词典吧,论坛有很多相关教程。
4 L# `9 {; T; N
$ b9 W6 E& N7 Y0 ?难点可能是大家不知道怎么把 mobi 转成 html 而已。成功案例:
. }" H+ X, B# [1 }/ B
; v- D, U2 U. K' V3 b(2016-1-16)商务《新华词典》(mobi 转)
]0 @ i2 u N) l6 u, I/ n[2016.02.07]Oxförd Dictionary of Computer Science- 2016 7th Ed.) I7 [. j" G' V3 M
. o% |7 m" B6 f2 k对于把多本 epub 整合成一个mdx,可以看这里:) e. S% x2 m7 p: r# U
& G) c) }: e6 r( g }5 mCBETA大藏經電子佛典*epub版转mdx版*CBETA大藏经电子佛典
7 x0 O; ~( e! T) T5 ]
H5 |) j) J3 |3 S0 Z下载对应的 cbeta_epub_201405.zip 电子书后,使用脚本一键式处理:
5 r0 y4 G4 V8 R7 ]7 ?) m0 z9 l0 R. A/ X
* T$ T8 w, k! c
- @+ S! t& [* H* R, X! kNOTE:3 e7 S# C! |2 R( g
+ i/ V( {& J" W) J, x l另外,不保证 Calibre 能转所有 mobi,能被 Calibre 转的基本表示这个 mobi 还算标准,可以转成质量不差的 epub 文件,提取的时候容易一些。如果不能被 Calibre 转,这个时候可以试试 Kindle 伴侣 这里提供的:
. R5 P8 }0 I' |$ d3 w) [: w, U) a$ |1 ]5 u( T4 y! u; o, ^: E
KindleUnpack:拆解 Kindle 电子书文件的利器
/ G' `5 z& S: n( g7 L4 v! |1 P1 [& J- R; X: f; w" S
但它转出来的结构标记错乱,提取修正太麻烦,有耐心的可以试试(比如网上流传的韦氏高阶的 mobi/prc),分享你们自己折腾后的经验。
5 Z' V8 u( v6 N3 O* A' c& s+ N# P
9 d' ^+ R e4 M# p1 q# B |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|