TA的每日心情 | 慵懒 昨天 14:45 |
---|
签到天数: 1734 天 [LV.Master]伴坛终老
|
发表于 2020-8-4 04:40:53
|
显示全部楼层
eeshu 发表于 2020-8-3 10:26
: L8 [2 J- r( M; b8 \7 ^已经上传链接:https://pan.baidu.com/s/1sapNgJXdDx6cRueVIKVP3g
! i7 k5 z4 r, O# R提取码:kz89,请试试你的各种法宝。 ... ~' u, B% E4 @" Z) y q/ |6 H
楼主试过的acrobat、foxit和smallpdf软件,我就没有试,我用了如下软件:Apabi Reader、Caj、SumatraPDF、Calibre、PDF2TXT、txtFormat和Wondershare PDF Converter,前三种和最后一种成功转换,Calibre、PDF2TXT和txtFormat失败——根本没有汉字!文件也是最小的三种;原文件和转换后的文本文件列于下,文本压缩包见附件。
0 Q( D6 u6 l* z; n* {3 d 从转换效果来看,Apabi Reader和SumatraPDF最好,基本与原文一致,Caj次之,Wondershare PDF Converter转换的每个汉字之间均有空格。Caj是这几个软件中唯一能正确双栏显示Pdf的,其他几个都只显示单栏;Calibre名气不小,而且支持的格式最多,但这次失败了;PDF2TXT批量转换较快,但经常有乱码。
8 K$ }: F# b7 I 另外,我在将带有表格的Htm(Html)转换为Txt文本中,试过多种方式,往往都难以保持表格对齐的格式,似乎除了很老的Netscape 4.05浏览器,现在流行的各种浏览器都不能正确地把网页存为保持表格格式的Txt文本,但Netscape上个世纪末被微软挤垮后再无踪影了, 虽然它无法支持今天的很多网页,但有这个优点,我仍然把它放在硬盘上备用。这个问题,不知各位大神有无高招?& Z) J, O; n! z! K+ g, W
' P1 X7 F3 Q" T7 Y
Yan Yu Ci Dian cut - Wei Zhi.txt 0.97M
3 c- }' o% U- P" i1 r8 p+ y) v谚语词典cut.pdf 61.11M
) w; D2 d( k3 d/ N# P' T$ ]; ]% c谚语词典cut_Apabi Reader.txt 2.98M
7 t& @/ k0 k g; j* ?! V谚语词典cut_Caj.txt 2.69M$ J1 E5 Q3 ?+ z+ h" l. `
谚语词典cut_PDF2TXT.txt 1.93M' [' W) Q9 F/ ]! h- ~
谚语词典cut_SumatraPDF.txt 1.03M
9 V1 g$ @/ k( k. [, Q$ X& _谚语词典cut_txtFormat.txt 434.37k
* H& [# w* O8 B, |9 V3 L) a) i谚语词典cut_Wondershare PDF Converter.txt 2.91M
/ X2 x3 z5 B) n- I8 S2 p% ?$ N" p7 |) w! b c+ F. P
' T) `6 R8 b+ c2 h5 E& {
( O: [- j% t! N0 B4 ?# c
2 g& l3 u9 n- [+ C3 L
& j, H- N4 O" r; \; Y0 s( \, }8 A. @' S: X8 @: ^ Y
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|