掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2453|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑
    * p- K! j! A) O: \* |
    % {- ^$ ?* G5 C  A2 A看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:4 o$ P5 A5 j- Y' i0 x
    7 V4 R0 H% ^' h# g- ?% u: |. s1 X
    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=266456 s% R% V, n  F, A. y
    ; R2 d3 B0 S7 _/ O
    我去官网下载了最新的版本:http://binaries.html-tidy.org/+ ?' L' t: y; D6 y5 j. L. f
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题
    ! G8 n8 c* D# Y3 g6 G' [: X) F. Y1、添加了不必要的<html><head>等网页头内容,造成词条错误
    3 H+ U: Y4 ]9 J8 M/ O6 |% e2、将</>与下一个keyword行合并,造成mdx源文件格式错误
    # F; c. r1 B5 O4 g! Q% `. m3、将</>转化为可读性差的& l t ; / & g t ;  h; B$ @: D; Q7 ^) W. H

    ; E5 v+ V5 K, t5 Z0 T- p+ T
    + s* D+ M6 D# ]* k( J1 j' h. F
    : z  b! }) G( Q  G8 v4 J$ U/ i

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:
    2 V( [( i+ h; J9 p% U9 whttp://api.html-tidy.org/tidy/quickref_5.6.0.html0 U) C$ k! d; g8 a. R' F/ R' K- R& b
    # r0 L- R7 ^2 Y. O* d+ v% k
    针对上贴问题的解决:
    7 J; w9 Y) \$ z& U0 t/ r6 @! \0 YQ1:配置tidy configy.txt文件:show-body-only: yes; f( @% e! i0 j4 q$ x* m3 p  s; J
    Q2和Q3:
      L# K0 j: l2 `2 [, [3 g; e(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
    & M% n2 [$ K& M4 R( d+ ](2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword( ?8 D* x2 w0 H" c8 E0 f# T
    (3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除6 h* y0 v% J- p/ T' f, E

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-19 07:41 , Processed in 0.023507 second(s), 29 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表