掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1354|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 3 {+ _5 \# e. f# g& d3 o
      K! K$ D+ u0 `3 A3 `& ^& @
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。
    ; {0 @! g6 u8 p) J; S) \) {! y本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。8 o( i4 j6 Q' j& W
    界面如下! W. ^- L, h+ H3 Z9 u
    ) Y- ?' j3 ]5 k5 j5 s% G
    4 G! X: f% J, P  ]
    & f  T* C) W9 r/ z# Y" w
    . Q, ~% B! }) Y4 ], c9 t- y
    感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    ; h4 w  T$ G2 }' o% R4 e4 u& E3 T3 O. M" {9 }
    一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。
    2 T& L. u3 {8 t" a0 u8 Q
    0 D4 ?5 c/ k& y4 D! p$ l6 r二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。; M3 n9 R; O, o5 o1 h
    github hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi; p3 Q: N- H5 s4 r
    github chaizi:https://github.com/kfcd/chaizi: X# B, A0 J$ ~
    开放词典网拆字字典:http://kaifangcidian.com/han/chaizi
    - G" L4 |# `- v
    # t; N+ i9 O* [: _0 |, f, [三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。: l/ ~4 }! W8 k7 e
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。
    9 Y0 A' y' ?) u3 y2 o3 bWFG博客:https://fgwang.blogspot.com/
    - R. f  Y) a  G& b0 [: x( @pdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A21 b% C. E8 s3 ^( H. |  K
    ' L% l" K& e1 y' j* M, h
    四mdict查询功能修改自readmdict.py。' \9 `! p- m5 _/ r" O5 G7 E
    bitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis
    $ t6 G* x; e, s3 x) U; z% sgithub mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py
    ) [2 E8 d# Z4 @: w  a8 |, V) r5 c( D' d& G
    五支持繁简转化和全角字符转化
    $ k; m. Q( t% w4 {$ s7 u* |" }- D% j- L" K; `) a9 n& ~: u; E$ z" g9 j
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。+ l9 c. A3 A7 ?& [) l6 R4 M
    1 h; e+ P" e0 [1 o/ d/ n( Z
    建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。
    : j9 Y/ b- m% M6 M& x- _: T% f+ f& V! o  {, i

    & x' ]( s4 e1 L* x+ g+ a- O3 N. b; V7 g) b8 u. E9 i
    安装:# g, J7 `3 Q7 E: E$ s
    部署比较麻烦,具体见readme.md和documentation.md。, k) N. z1 e5 }2 _
    9 r- S2 u, ]; J; ]' {& h  P
    性能:
    2 w/ K* u/ G8 {9 ^, [& B  i% C, q2 vwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。. l0 t. A1 E% f; }
    2 A' _, K7 C) i4 p6 g3 W+ O
    在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict/ A7 m' j: r( b, ~; i  \
    下载:5 n( D; U$ S) P1 e# `" [1 T
    链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw
    * L4 X4 `5 C7 a( n. @1 m5 h% \提取码:47uf 2 ?' Y: {1 }6 s5 Z
    复制这段内容后打开百度网盘手机App,操作更方便哦2 x3 u' f, d) }+ H0 f
    github:https://github.com/jiangnianshun/django-mdict: T9 @$ l3 R) Y

    / V0 u$ U' R, c
    2 B, F" T- _  J6 \  U! Z2 w8 k# W+ |/ I7 ?$ Y- ^7 T/ z

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好) B" E; N; Y/ y2 z4 N
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?) ^. f  P- n) A
    , o( {3 M! Z3 I! m; G  \
    还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂3 ^" l$ T$ @0 {$ h# [  K$ |4 D" }+ k( G8 K

    + s7 d1 \# P& F: F8 L- l& N! U看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?% `" @8 A5 D. x1 K- X
    5 o0 c3 L& o& H9 C) x
    4 @) K( O. w& e
    3 W2 U* p/ _$ Q+ D& b8 S8 W1 v1 [

    ( A% f  s) h& c8 ^
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18
    . T" v+ ]! ]# |& Y; Atesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好
    + M/ `: [6 q$ X1 Q2 R, R6 ecefpython3 怎么感觉有些鸡肋,如 ...

    . p( s% c2 x. O% \" d- L对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。, r9 p& j. L: S, C, L" [7 D
    是,分服务端和浏览器端。
    - j) r! I2 _4 u! s; w0 Xiframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:" r2 G2 S$ m( t8 Q8 Z
    1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable4 A( D$ I" y+ {. X+ |8 ^2 m
    2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-6-7 11:15 , Processed in 0.053137 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表