掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1324|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑
    # D/ h2 t' ^/ n/ p4 z( h* s
    - M, M: ]7 K! Pdjango-mdict是django实现的mdict词典查询工具。django是python的网站框架。
    * c4 p5 ^( F  G8 V& H4 B本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。8 ?0 T1 _- _% m8 u/ d. I; Z2 s3 I
    界面如下
    - X: t7 w* ?* v! K5 C+ F' W, E5 h- r, r! A5 _
    ! }! D% @. [8 Q3 J8 K8 _. r+ |9 R" G" `

      I8 B; \/ _( H) s4 G) ]* e# r& |8 M% g
    感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    # Q9 V" o6 M4 N5 t/ D7 o8 y
    ) i3 [- I3 s& w" D6 H( q一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。$ T* X% {6 s6 E) [- }
    5 d0 M$ I( b( N
    二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。
    8 z( ]$ w! |% w  M$ d( I7 Fgithub hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi
    ; H# @; T% r9 D7 V. _github chaizi:https://github.com/kfcd/chaizi
    0 w" y- C5 a9 u% @- |' j1 h* V  B1 f开放词典网拆字字典:http://kaifangcidian.com/han/chaizi6 j/ J  i2 G$ z
    : O( c/ U& h/ y2 J& O6 c  `: t' _/ m
    三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。
    6 c- d, e2 E; E' g' O全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。$ f0 \+ A' B: M, c; x  _
    WFG博客:https://fgwang.blogspot.com/
    3 D$ t: Q4 ^2 q8 Dpdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
    ; Z% ?* q5 E+ Y" C. v1 w* _* M6 R6 @1 r# h3 q+ g  ?# N
    四mdict查询功能修改自readmdict.py。
    % Y5 i  }2 K% B) j! Ebitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis
    * T5 b2 S" @9 l. r0 C  egithub mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py
    ( Z* F8 l. @  L! m. F9 S# @5 T
    4 N& A$ l, J* u2 m) n' z  T五支持繁简转化和全角字符转化" ^, A3 `% n3 {  K
    8 c/ ?( h9 a5 J' D3 R) t( w
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。
    : E/ p0 G+ |$ x7 ^" }0 R6 g( U! n: |1 P4 M4 Y8 B
    建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。5 ^# j# e* [8 @7 E; G- D% ^
    $ }. v. P# @' D' `

    4 W5 [# j# r  w# f8 T1 n, X2 a
    " h4 Y: Q* N- b2 p安装:. H8 w; ?$ f5 s6 w! F- m
    部署比较麻烦,具体见readme.md和documentation.md。& q* ]# }3 R& ]" N
    8 `% Y* F4 A! o- g  p* l6 q- p
    性能:! C5 L% g9 f9 D+ f+ ^2 d
    windows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。. G" u4 l) D" ]

      F8 W- ?) P8 v3 U' @在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict/ ~5 X9 _8 I% p2 M
    下载:
    2 F$ {& Q6 }, k$ ~% d( }链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw ' ]$ \- H5 [" c. o, r
    提取码:47uf 9 K% m% i3 j; m' z" _) M& L
    复制这段内容后打开百度网盘手机App,操作更方便哦7 V$ k: b, ~0 @
    github:https://github.com/jiangnianshun/django-mdict+ R" H1 I2 N+ B; b

    . \0 h' G2 ]) L) [8 a  I/ M  O! T% z# v2 V

    , _$ X1 i2 P9 h; \4 K- [1 x& j

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好  d' l# I$ e" p0 H( s- u
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    8 q8 b4 M& D6 m# S) B$ y! K$ \/ F( W' k6 `& _$ q" N
    还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂
    9 n% M! C5 ]7 g/ Q5 j
    5 V0 z% B2 z+ n% w: p' [看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?$ h3 J4 g3 p6 z( R1 j3 `. n, [

    ' m4 [# m: p1 B# ]& a; m4 S; M6 l" D  P: y# A6 \, q4 O" t
    . A1 S, C# ~0 j* U3 z5 Q

    % C* t7 n; ?6 `- Z
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18
    " l0 R) q4 {: J; M. z; Utesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好
    * J/ O  V2 W' e0 @7 M( Ucefpython3 怎么感觉有些鸡肋,如 ...

      t8 O4 y* ~0 I% p& r9 Z; c1 i# X对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。4 U. w9 ~$ j6 j9 n+ a
    是,分服务端和浏览器端。
    ) ]! Q5 k: }, A9 [2 W) w1 _iframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:
    % [7 G* u! ]2 k8 Q" I1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable
    - j% [4 o. V4 y8 R, n$ X2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-13 09:18 , Processed in 0.063555 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表