掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3266|回复: 12

[求助] [错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...

[复制链接]
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:35:04 | 显示全部楼层 |阅读模式
    今天尝试排版汉典,结果打包的时候总是提示错误。( C5 F- X* }! b; T4 e

    6 o: M* W* r- q3 O; C2 ?即使是 MdxExport.exe导出的原始txt文件-不修改,仍然提示这个错误,使用的大文件的mdxbuilder版本也是不行。看到这个帖子中提示的类似的错误,但是txt文件中并没有类似的格式错误。。。
      a; }9 W9 K. z: z
    4 e) d& p5 H% l- [" t- V
    * e  a; E& o% S+ e5 k9 Y1 Z
    有没有遇到的呢?
    3 C8 z* Q$ q8 O: V+ `
    : e3 h& }$ Q; L8 X$ M$ o, f; G* ?' U( {, U1 y
    Begining loading source file...* Y$ o/ v& K% \: T1 E/ Q) h
    Content is longer then 8388608 at position: 0 of the source file0 q1 u6 C6 X7 u* w  k' C8 B: e8 h% Q; Z9 b
    Failed to load source file, process cancelled
    2 c" P' u4 d  T5 Z9 |如下图:
    ; Z8 R2 b7 C4 u: W1 F! Q+ L3 h# j4 Q% ?) F

    * C6 \  |# P/ b* b. o* l2 }6 Q$ e

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:44:59 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:118 v. u0 h7 E% M8 h4 [$ L, D5 L
    提供测试方案:
    0 ]+ P# y2 A" s/ w/ Z- x提取:用MdxExport3.5或者python版readMdict生成txt。
    + _) C8 c6 w+ |  f4 \# s写入前:复制原始txt的全文内容到一个新 ...

    / M. H' ?- n$ [- i厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbuilder都是默认选择utf-8。, ~2 T5 ?4 S) V
    ----------------------
    7 w; _1 b3 ~, }- \' v: Y4 c4 Q5 l* P8 z另存txt文件为utf-8   ---  搞定!!!
    % T4 o1 ~2 w" X! e$ j, v-----------
    7 n7 E( J' D  f2 h* m% c2 k谢谢
  • TA的每日心情
    奋斗
    2018-11-10 00:38
  • 签到天数: 346 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:42:51 | 显示全部楼层
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的都是基于旧版本的mdxbilder
  • TA的每日心情
    慵懒
    2023-1-18 13:13
  • 签到天数: 539 天

    [LV.9]以坛为家II

    发表于 2018-11-8 15:43:13 | 显示全部楼层
    lgmcw有完美的python生成mdx脚本,你找找看他
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2018-11-8 16:11:50 | 显示全部楼层
    本帖最后由 流星冲击 于 2018-11-8 16:57 编辑
      P( d+ t( |9 W, ~- {" C1 C1 Y3 [( R2 @* Q. {2 Y6 u7 @! T! T$ o) f
    提供测试方案:
    0 w! G8 x8 `) u: j1 b8 z1 e' M提取:用MdxExport3.5或者python版readMdict生成txt。
    & q$ N; p" E) z$ [写入前:复制原始txt的全文内容到一个新建的空白文件再另存为,最后才写入。这一步是确保编码没问题。( ]5 M! m3 d9 a8 k7 R
    写入:词条自动排序用mdxbuilder 3.0 beta2,词条自定义排序用python版writeMdict。
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:18:27 | 显示全部楼层
    greatszh 发表于 2018-11-8 15:42
    5 m0 l& z1 R" `  C如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的 ...

    # H$ a0 g$ o0 a( m# `8 n; B尝试了2.1  3.0(含大文件版本)  4.0  版本,都是出错。。。
    ! N3 K$ p" A( T% i
    ' i9 d& j* `( y* u. s: T4 v" `
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-11-9 01:11:12 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:115 e8 @4 q. ^. s* k9 S# B
    提供测试方案:
    . _5 J+ g" E* i! }+ {# l提取:用MdxExport3.5或者python版readMdict生成txt。
    5 r6 U/ r( `1 z写入前:复制原始txt的全文内容到一个新 ...

    $ S4 l# R5 w  j& P! W謝謝流星 兄 總是能及時的指點迷津排憂解難
  • TA的每日心情
    奋斗
    2020-6-15 09:00
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2019-9-19 20:27:04 | 显示全部楼层
    Content is longer then 8388608 at position: 0 of the source file。$ }2 |* k9 h( h6 c4 u" i
    我也出现了这个问题,兄弟,你是怎么解决的。
  • TA的每日心情
    郁闷
    昨天 01:09
  • 签到天数: 1421 天

    [LV.10]以坛为家III

    发表于 2020-6-9 14:33:25 | 显示全部楼层
    删除空格
    & Q+ A) p5 h# G% q% E) Q' _Emeditor:! q2 n3 P; V- \$ _0 g3 }

    * l( L3 @& W4 m* w. Q' `, c) N
    •Default Menu: Edit > Convert Selection > Remove Empty Lines
  • TA的每日心情
    郁闷
    2022-11-17 14:05
  • 签到天数: 58 天

    [LV.5]常住居民I

    发表于 2021-4-6 21:52:41 | 显示全部楼层
    我今天也碰到这个问题了,原因是词条内容行太长,最长的词条内容行有190万字节长,后来把词条内容行长缩到40多万字节以下就可以转了

    该用户从未签到

    发表于 2022-8-28 17:05:30 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:448 V$ S& u# F  T/ L/ r( ?* L  f
    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...
    : H+ P) {& Z& m" ]4 a; }
    我也遇到到了这个问题,虽然你的问题和我的不一样,但还是受到了启发,多谢!我出这个问题是因为文件不是Windows CR LF换行,不知道为什么存成了Unix形式的换行

    该用户从未签到

    发表于 2025-1-29 11:14:39 | 显示全部楼层
    MdxBuilder 中编码设成 UTF-16(Unicode),就能顺利把《汉典》从txt变成mdx
    3 K8 l  Z1 P2 z( C+ Nhttps://www.cnblogs.com/fnlingnzb-learner/p/6163205.html

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2025-1-29 11:22:09 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:44( U0 r* u5 {0 R0 S( ~3 U
    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...

    ( X# O6 V3 c! V: o( k在MdxBuilder 中编码设成 UTF-16(Unicode) 错误就没有了4 _- ]# p, y* Z" }
    https://www.cnblogs.com/fnlingnzb-learner/p/6163205.html
    % _. \3 |" @7 v……
    # v+ j+ O. Z' D) C反过来 UTF-8 也不完美,也存在一些问题:
    / n. t8 i$ @+ X7 e6 P+ R1 V文化上的不平衡——对于欧美地区一些以英语为母语的国家 UTF-8 简直是太棒了,因为它和 ASCII 一样,一个字符只占一个字节,没有任何额外的存储负担;但是对于中日韩等国家来说,UTF-8 实在是太冗余,一个字符竟然要占用 3多个字节,存储和传输的效率不但没有提升,反而下降了。所以欧美人民常常毫不犹豫的采用 UTF-8,而我们却老是要犹豫一会儿……& `( T7 V. g  P# |
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-27 16:22 , Processed in 0.021320 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表