掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1300|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 0 }' D4 ^6 b2 b

    ; M! Y1 Q3 D. Y" D! \* Adjango-mdict是django实现的mdict词典查询工具。django是python的网站框架。+ H, {/ o6 @" C% p
    本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。
      [. Z; e7 z% B# _8 N  l界面如下
    0 a& f5 I. K; I" T
    . ]4 y& |5 B& E# R# y+ P, Y
    ) |4 l' |! _7 f6 L9 `0 Y, X8 D2 s1 q  i4 H
    ; k  M; z- q# m9 ?+ ~% T4 U
    感谢各位好心人制作的词典和工具,本工具主要做了功能集成:' W( O- _: h& i1 W9 u
    ; q: A4 E# `' p  y, Y3 i
    一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。
    9 ^# S4 k6 P6 G2 [
    7 s6 j. B- o; k  _; i+ Q二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。
    ( @8 K5 B& J: s! Rgithub hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi/ j! {# k/ Z6 X# \3 i; R1 u: i
    github chaizi:https://github.com/kfcd/chaizi
    - T* f0 i5 f6 H- w( V( g开放词典网拆字字典:http://kaifangcidian.com/han/chaizi% K, G7 Z8 y, s' h

    # P; H+ ]& J6 ?5 ~三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。4 b4 x7 f3 }  l# F+ j4 `: j1 p
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。. H' M- f, }* G  o
    WFG博客:https://fgwang.blogspot.com/' [7 R+ G- D! J3 T3 [: \8 e: e4 V3 h
    pdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A25 I; \5 Y4 P. \1 q, i- H+ u

    9 x0 M5 S$ L* ]; P四mdict查询功能修改自readmdict.py。
    1 b! p2 y9 Y8 @, c8 W* ~- R- Nbitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis# o; y8 R. z. p! q! x, x$ e5 o
    github mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py
    6 F) G  f; M( ~; I% y9 H$ U$ P
    ' x2 u+ U, i0 m1 L5 X! Z# W% N五支持繁简转化和全角字符转化+ p( M% @8 F- `' ^/ V
    9 t: U' u3 X' k6 G# Q/ x9 Q
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。
    ( A8 x  S- ?( ]
    ) {' t+ `' j9 [. w& C2 n建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。8 _2 Z) m8 x( |8 v
    ; R/ i9 t* ]4 C3 q

    4 D- N. W! D! M* o2 A& l4 a
    - c4 s  \1 j4 v3 \( g安装:! Y; M0 `6 T; `- ^
    部署比较麻烦,具体见readme.md和documentation.md。2 A& U5 O: V, t2 x0 `% r3 P

    ' k4 l( Y. ]0 d7 G, C  b& ^性能:
    7 ~2 a* g% a% F' N  i- w2 hwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。
    ; \6 K% a9 ~2 ?/ U, A3 t2 t0 t$ U; H0 ?# K2 O0 p# v
    在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict
    7 ~/ F" W+ N. v6 f! r; A. C3 r) S4 Y下载:
    - G. g: I: n  f链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw 5 g" R% Y3 l: N, {6 y2 E
    提取码:47uf
      a9 D5 o! H0 t' p5 a+ C, L; c复制这段内容后打开百度网盘手机App,操作更方便哦
    $ b; {. L7 `1 x0 \" k. F5 }github:https://github.com/jiangnianshun/django-mdict
    6 T) d% b5 v* M' [- ~: u2 B; T; S; H. L

    . O. M5 }- L& r6 M2 L+ G6 K4 l* e& P6 J4 |, M, T+ E

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好2 O+ e0 E3 C: ]( E2 r
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    $ ^* n& Q7 E: o! D7 T
    8 c! G2 q" C/ V6 A还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂* J0 X2 G% O% y- P# A

    ( k: s8 i9 l; Z5 \; X: r看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?
    $ {0 @# w3 v: l7 O: d: S. |6 }. z5 h
    / g7 i9 i% {! Z! k
    & b1 q6 K6 h3 X9 q7 y2 Z

    ' e! \; e  w+ S3 T
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18& }3 G& w+ U9 T8 Y0 Q
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好; C$ |; L3 R3 f# ?5 P( U
    cefpython3 怎么感觉有些鸡肋,如 ...
    ( o) [& S; b* U) [' z( L, W  n2 D  e
    对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。" ?9 l4 m7 P7 P: J
    是,分服务端和浏览器端。) N, U$ S2 y# n5 Y5 E; a' K( ]
    iframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:' l6 ]! x' ~" {, F7 k
    1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable
    5 }8 x8 u- M# y6 z0 C2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-29 02:34 , Processed in 0.044748 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表