wyzh97 发表于 2018-11-8 15:35:04

[错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...

今天尝试排版汉典,结果打包的时候总是提示错误。

即使是 MdxExport.exe导出的原始txt文件-不修改,仍然提示这个错误,使用的大文件的mdxbuilder版本也是不行。看到这个帖子中提示的类似的错误,但是txt文件中并没有类似的格式错误。。。


有没有遇到的呢?


Begining loading source file...
Content is longer then 8388608 at position: 0 of the source file
Failed to load source file, process cancelled
如下图:



greatszh 发表于 2018-11-8 15:42:51

如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的都是基于旧版本的mdxbilder

han198808 发表于 2018-11-8 15:43:13

lgmcw有完美的python生成mdx脚本,你找找看他

流星冲击 发表于 2018-11-8 16:11:50

本帖最后由 流星冲击 于 2018-11-8 16:57 编辑

提供测试方案:
提取:用MdxExport3.5或者python版readMdict生成txt。
写入前:复制原始txt的全文内容到一个新建的空白文件再另存为,最后才写入。这一步是确保编码没问题。
写入:词条自动排序用mdxbuilder 3.0 beta2,词条自定义排序用python版writeMdict。

wyzh97 发表于 2018-11-8 16:18:27

greatszh 发表于 2018-11-8 15:42
如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的 ...

尝试了2.13.0(含大文件版本)4.0版本,都是出错。。。

wyzh97 发表于 2018-11-8 16:44:59

流星冲击 发表于 2018-11-8 16:11
提供测试方案:
提取:用MdxExport3.5或者python版readMdict生成txt。
写入前:复制原始txt的全文内容到一个新 ...

厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbuilder都是默认选择utf-8。
----------------------
另存txt文件为utf-8   ---搞定!!!
-----------
谢谢

喬治兄 发表于 2018-11-9 01:11:12

流星冲击 发表于 2018-11-8 16:11
提供测试方案:
提取:用MdxExport3.5或者python版readMdict生成txt。
写入前:复制原始txt的全文内容到一个新 ...

謝謝流星 兄 總是能及時的指點迷津排憂解難{:4_105:}

luzaihefan918 发表于 2019-9-19 20:27:04

Content is longer then 8388608 at position: 0 of the source file。
我也出现了这个问题,兄弟,你是怎么解决的。

shawky.nasr 发表于 2020-6-9 14:33:25

删除空格
Emeditor:

•Default Menu: Edit > Convert Selection > Remove Empty Lines

飞扬小梁 发表于 2021-4-6 21:52:41

我今天也碰到这个问题了,原因是词条内容行太长,最长的词条内容行有190万字节长,后来把词条内容行长缩到40多万字节以下就可以转了

lutts 发表于 2022-8-28 17:05:30

wyzh97 发表于 2018-11-8 16:44
厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...

我也遇到到了这个问题,虽然你的问题和我的不一样,但还是受到了启发,多谢!我出这个问题是因为文件不是Windows CR LF换行,不知道为什么存成了Unix形式的换行
页: [1]
查看完整版本: [错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...