掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1688|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 $ d4 ]& u% }* L0 ~- s+ |/ U0 ~
    / K3 m$ h$ D6 X7 v
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。* ^* R1 Y, t7 G" c  ?3 d
    本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。0 m0 A9 K/ c& T& X
    界面如下
    + r$ L2 h+ T* [% g6 \& K1 }5 L8 i  ?4 D" ^( w% p5 d5 N

    $ v( X1 D9 I# e/ t+ @2 U: b; ~1 e$ D
    " g; B; M% s1 H
    & f4 S! z/ F/ y* a# M感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    % L$ h; m7 }3 t" O! U! b4 G; |4 J! s; X; K, n1 i
    一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。3 l( a* `  t4 D6 Q
    ! U9 c. M( F7 s+ `' t( b6 Z3 \9 ~
    二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。
    0 U6 o7 D* S4 P+ h$ `- d# R; U, Qgithub hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi
    % u6 _6 _$ k7 D! Wgithub chaizi:https://github.com/kfcd/chaizi5 [3 i& |* P; B- ]7 D
    开放词典网拆字字典:http://kaifangcidian.com/han/chaizi7 S* p$ I9 I) _8 N0 i

    ' S; a: A4 c2 T0 Q三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。/ M2 r. n# d! I9 x: S2 J
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。* ~# V: O) u( C: L& t
    WFG博客:https://fgwang.blogspot.com/
    + g3 }' R4 [0 Z! ?$ |0 Hpdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
    ! ?( {8 X3 K8 `# s1 ~% ?9 u" G! M& M6 g1 P
    四mdict查询功能修改自readmdict.py。
    5 f& f' |4 C0 \& T, _6 ubitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis2 A# i4 e' p9 H2 ]& A
    github mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py2 B6 ~' d9 m+ T  a  j1 l7 P& M0 t8 n
    5 s$ W1 R& w: t% B9 \2 J
    五支持繁简转化和全角字符转化
    3 d, X* I4 g1 K" n" k6 q  ~+ H$ }! L; r
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。
    3 y& i) U  _( `% T& e+ ^6 P1 s
    7 F  k: {; o/ {; l5 r, s7 [建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。# \1 e. B9 |3 A5 }' G: Y5 r  Y
    # q& M$ W5 i9 ^$ @

    ; l, k# [4 O. |7 O- ~  p4 L: U, n
    / B9 l; X! N: @6 Y# Y安装:
    $ L- h8 d9 x$ q7 D* f部署比较麻烦,具体见readme.md和documentation.md。8 ?" {5 k; C/ }0 o9 G6 _

    2 }2 I( P' A- I2 c4 N. A8 I8 E, J性能:
    9 a" s: e0 Z) @& T+ Q, W, w" jwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。
    # I4 F1 y( Y# ~" b) b; E8 `! I( M
    / v9 _( X7 M! @+ T6 ]在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict
    . T( P2 _, l# @下载:
      m5 I9 X) w! @; ~链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw
    : K$ Q; ]5 {, j! g提取码:47uf ( i5 G- @7 F, o" @9 W0 P6 L3 R
    复制这段内容后打开百度网盘手机App,操作更方便哦- c- _: O) P8 A  q; t1 \$ [. n  ~
    github:https://github.com/jiangnianshun/django-mdict
    : {4 ]0 x6 ?1 r% S( p* _& ~; w0 |/ H6 x1 q, A/ f
    " v& Y( F) s6 k/ j0 ^7 y

    9 [2 ]+ W+ ?4 A/ a  b% @

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好5 {7 X1 ?0 b  k; t1 P! y; E
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
      y' u, w3 r* j$ e
    1 D7 ^+ Z, D) U# l1 Z$ l还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂
    3 B5 }' F* A* P' @! A; o7 o0 x- I- P6 C& i! L3 l
    看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?
    + ^$ K+ O- M# M8 m7 Q( d1 C/ [6 b: W. W0 K

    $ Q' A; d5 K8 [, I8 g4 h9 P' \& i1 c% E9 J$ K

      r( W1 h4 D$ O5 V' Z2 f' V" D
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:183 \8 ^2 C. E7 H* `, `0 E
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好$ z  s. N! c. v$ T/ q# V7 F
    cefpython3 怎么感觉有些鸡肋,如 ...

    - f" y: y: F. f' v' p! b5 z0 V# _对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。8 K& c# E7 W- m8 ~. Y1 y5 M
    是,分服务端和浏览器端。
    & Y8 r" d' J7 t; {8 s0 V% Xiframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2024-7-1 10:33
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:
    5 B- D0 H+ ^) l. f1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable0 E7 @( \. r" L) R1 H" l
    2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-12 05:29 , Processed in 0.021082 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表