掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1299|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 4 r5 P; q# v0 c. r* f' _" y3 F
    2 x3 S0 j, L# @2 @8 z
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。
    6 j  g4 e* k( f. l3 z, t) H本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。
    . l& b, o2 n3 _: w+ y界面如下
    + r) {* I+ k4 t  v7 a
    7 {3 L- l/ d' G
    # C. y1 Q- N+ ~& I1 O
    2 {( j) a7 t0 d  y* ?, h4 d4 I/ P7 t/ u6 i0 R  F; D
    感谢各位好心人制作的词典和工具,本工具主要做了功能集成:0 M0 d3 E- i5 n5 f- r- I" `

    & X8 Y8 f' M* @& H5 h一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。9 K0 `; i# M3 b9 M

    # D7 X. r7 h0 g: t二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。
    ' k( x/ {4 R$ O1 R% B4 igithub hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi/ m0 P; y7 \' K
    github chaizi:https://github.com/kfcd/chaizi
    7 J( W8 i0 O# [1 P开放词典网拆字字典:http://kaifangcidian.com/han/chaizi
    & [  \4 O7 s& E2 d" K: }5 q+ Z2 S' Y- \" u  W1 x0 n
    三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。  }  |' v# j" y; A" R
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。
    2 E" Y- S9 `3 G5 mWFG博客:https://fgwang.blogspot.com/
    & g2 x6 o, y( K8 b& Y- y1 V6 @% O( N( Mpdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
    # T+ r5 {9 [/ o' R* r/ i. D# }8 ?6 }0 X& D3 Z: M! J, k
    四mdict查询功能修改自readmdict.py。+ [( P& M, Q# z3 `( [9 |/ T& q
    bitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis
    9 e! S2 ^( d$ y' r3 Lgithub mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py6 Y7 G5 ~0 R0 S: D/ e8 t, b

    % f) I8 u$ A$ q9 y5 w$ Y) g五支持繁简转化和全角字符转化
    5 a; g- M* Z. R) B4 @" d; m( m: @/ d2 N
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。  ]% Y) h) r, [1 d/ o

    ' P; V  j- P% I4 f' t+ o0 ]( B+ w建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。
    , I7 T. O2 f  F
    & s; `2 }; f2 s" f
    9 |. j- r0 P# y1 B
    ) `0 m; [9 d' y: @- x安装:6 k. I$ h1 `9 w# |
    部署比较麻烦,具体见readme.md和documentation.md。4 {3 v9 |2 ?4 L8 f

    % Q$ [+ j' [1 S% r* G  B性能:
    0 F9 p2 U: w- Z+ }2 T  dwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。, P% ?) }4 n4 n

    - M& G( _" e( G. H3 N2 z7 T* e) ^在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict
    " B, r4 w/ V( f7 D: q; B; Z- a下载:% E. Q9 m* c4 r6 P( A
    链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw
    # L6 K5 {. n/ v( a0 H" |! N提取码:47uf
    % q% W5 K7 q; O3 H# b复制这段内容后打开百度网盘手机App,操作更方便哦) a2 t7 _9 r( `* V9 S+ ~! ]
    github:https://github.com/jiangnianshun/django-mdict
    % t- Z# @; k+ a1 d- ]5 C& f$ S* Z

    ( `& l  j- q4 F5 }0 k! a; I" J! v. z# ~4 P) `& I$ ]. R3 h

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好- M+ T2 w# _7 u9 w  Z
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    " K7 J; W* W, ^1 Q0 @0 W, r& E& L% ?8 I' f2 h. y+ T' q
    还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂9 k8 w0 Q: l! x
    ' m$ J3 N* m/ O$ v) W
    看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?
    $ x- M: X6 ?0 j
    $ v$ c1 V+ m' o6 h4 x
    ( E4 n& m! T2 @- z, c
    . U- l  Z/ n8 g2 ?% W/ [3 z1 Q( L1 u4 L  ~+ N2 ~1 J" o
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18# S5 H+ {7 _( Q4 t$ r# N* h5 e: P
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好
    9 f+ |( Q( k( v2 ccefpython3 怎么感觉有些鸡肋,如 ...
    6 m6 j: q6 v8 N* l" A  L  c' N: D
    对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。9 ~1 j; x- i$ R3 u4 y& s
    是,分服务端和浏览器端。
    . J, y, _; f  w/ u' `+ Ciframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:
    ; u, q9 s2 ?  R1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable* H5 G# W' u- i" w) E
    2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-28 21:12 , Processed in 0.099433 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表