noword2k 发表于 2020-2-28 10:10:04

写了个抓取特定单词,生成html或pdf的小工具 MdxConverter v0.0.4

本帖最后由 noword2k 于 2020-3-9 09:00 编辑

**** Hidden Message *****
exe下载地址:
**** Hidden Message *****

一个用来从 mdx 字典中抓取所需的单词,并生成 html 或 pdf 文件的小工具。
学新单词的时候,一次生成所需的单词解释、例句。
输入支持xls, xlsx, json, txt,输出支持html和pdf。
这个工具没有GUI界面,我也没兴趣做一个GUI界面,不会用命令行的同学就忘了这个吧。

关于怎么使用:
比方说你希望收集以下单词
Lesson 1:hello world
Lesson 2:this is a test
Lesson 3: .....

你可以编辑一个txt,一个单词一行,课程名称用#开头,格式如下:
#Lesson 1
hello
world
#Lesson 2
this
is
a
test
#Lesson 3
....

也可以编辑一个excel表格,一个sheet就是一个课程,sheet名称就是课程名称,单词排列在第一列上
也可以编辑一个json文件,不再赘述。

然后在命令行下运行
MdxConverter 【mdx字典名称】 【输入的文件名】 【输出的文件名(后缀为.html或.pdf)】

注意:如果有mdx词典中不存在的单词,程序会显示报警信息,默认动作是收集到invalid_words.txt中。你可以设置运行参数
--invalid 0 立即退出
--invalid 1 输出警告信息到html/pdf中

用法usage: MdxConverter.exe [-h] [--type [{pdf,html}]] [--invalid {0,1,2}]
                        mdx_name input_name
positional arguments:
mdx_name
input_name
output_name
optional arguments:
-h, --help         show this help message and exit
--type [{pdf,html}]
--invalid {0,1,2}    action for meeting invalid words
                     0: exit immediately
                     1: output warnning message
                     2: collect them to invalid_words.txt (default)                        

例如:MdxConverter 某某词典.mdx input.xlsx output.pdf

输入
txt 示例#Lesson 1
hello
world

#Lesson 2
python
is
awesome
json 示例
[
    {
      "name": "Lesson 1",
      "words": [
            "hello",
            "world"
      ]
    },
    {
      "name": "Lesson 2",
      "words": [
            "python",
            "is",
            "awesome"
      ]
    }
]
excel 示例


输出
(图片怎么弄都出不出来,我放弃了)
HTML

PDF





noword2k 发表于 2020-2-29 08:11:44

johannhuang 发表于 2020-2-29 05:33
但你这样一没有就退出 我觉得改词表会改到怀疑人生何苦 不如用Python 讽刺 ...

可能是你选的词典词不够全。
反正开源的,你觉得怎么样好,可以自己改。
这就是一个我给自己家熊孩子写的,让她学新单词时用的的小工具,做好后顺便放出来,现在已经满足我的预期要求了。

喬治兄 发表于 2020-3-22 16:12:31

本帖最后由 喬治兄 于 2020-3-22 16:32 编辑

noword2k 兄:
html 說明圖沒顯示出來.....
1. 起問是否一個 headword 生成一個 html 檔案 or 多個的 html 檔案根據 headwords 多少個就多少個 html
2. 若想生成全部的 headwords 該如何使用.....
3. filename可否和 headword 相同來生成
可否再請仁兄指點迷津解惑一下.....
Thanks a lot

noword2k 发表于 2020-2-28 17:54:45

johannhuang 发表于 2020-2-28 15:29
热情很棒 不过出错就重新编辑的逻辑有点不好哦 建议加try...catch

可以判断返回的结果是不是为空,为空的话输出警告信息什么的。
但是就怕用户不仔细看输出信息,从而漏了单词,干脆出错强制退出。
不喜欢用try..catch,太丑,开销太大。

elusty 发表于 2020-2-28 10:34:18

谢谢!下载了.exe后,怎么用?

neilzhu 发表于 2020-2-28 11:11:18

这个程序挺实用的,可惜不会python。正在下载exe,不知道有没有比较好的说明书之类的,希望能会用

yuqinghuaz1 发表于 2020-2-28 11:28:32

谢谢分享   好羡慕楼主能自己写自己需要的程序

noword2k 发表于 2020-2-28 11:48:36

elusty 发表于 2020-2-28 10:34
谢谢!下载了.exe后,怎么用?

更新了一下帖子,增加了简单说明

noword2k 发表于 2020-2-28 11:48:50

neilzhu 发表于 2020-2-28 11:11
这个程序挺实用的,可惜不会python。正在下载exe,不知道有没有比较好的说明书之类的,希望能会用 ...

更新了一下帖子,增加了简单说明

bbsknock 发表于 2020-2-28 11:49:46

太棒了!支持楼主!

johannhuang 发表于 2020-2-28 15:29:25

热情很棒 不过出错就重新编辑的逻辑有点不好哦 建议加try...catch

johannhuang 发表于 2020-2-29 05:33:01

noword2k 发表于 2020-2-28 17:54
可以判断返回的结果是不是为空,为空的话输出警告信息什么的。
但是就怕用户不仔细看输出信息,从而漏了 ...

但你这样一没有就退出 我觉得改词表会改到怀疑人生何苦 不如用Python 讽刺

noword2k 发表于 2020-2-29 08:45:05

johannhuang 发表于 2020-2-29 05:33
但你这样一没有就退出 我觉得改词表会改到怀疑人生何苦 不如用Python 讽刺 ...

想了一下,还是从善如流,反正是举手之劳。
新版的遇到没查到的单词,会显示警告信息,然后继续。

neilzhu 发表于 2020-2-29 10:17:15

已经试用了昨天的exe版,新版的正在下载。昨天的那个版本基本能用起来,但经常报错,可能是查不到所列的单词。所以不知能否实现:把能找到的单词全输出来,找不到的单词列在输出文件的最前或最后。多谢!

noword2k 发表于 2020-2-29 10:31:18

neilzhu 发表于 2020-2-29 10:17
已经试用了昨天的exe版,新版的正在下载。昨天的那个版本基本能用起来,但经常报错,可能是查不到所列的单 ...

现在是找不到的单词,在html或pdf中显示 warning 信息。
考虑统一放在最后,单独一组invalid words。
等有空再搞。

lemonlab 发表于 2020-2-29 11:53:31

没有的单词跳过,另存一个文本格式单词表吧,谢谢不断更新,持续围观

lemonlab 发表于 2020-3-3 01:11:57

给力又热情,高风亮节啊,高兄

haoduodianying 发表于 2020-3-9 03:10:49

支持楼主!

yfz48516 发表于 2020-3-9 03:20:40

       谢谢楼主的辛勤劳动与奉献分享,小工具挺实用。

alanpoon 发表于 2020-3-11 14:34:44

太方便了,如果可以用exe有执行界面就好了。

gohome 发表于 2020-3-13 16:33:11

谢谢分享!

yru 发表于 2020-3-14 12:06:04

非常感谢!

cwrcbmm 发表于 2020-3-16 15:45:29

Mac能用不,下载试试

kstan1122 发表于 2020-3-17 16:26:43

太棒了! 多谢!楼主!

charlestsang 发表于 2020-3-22 16:34:57

楼主太给力了 赞赞赞
页: [1] 2 3
查看完整版本: 写了个抓取特定单词,生成html或pdf的小工具 MdxConverter v0.0.4