掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2036|回复: 6

[求助] 如何从txt文本中提取同等学力大纲词汇范围内的词条?

[复制链接]

该用户从未签到

发表于 2013-2-3 16:28:09 | 显示全部楼层 |阅读模式
各位大侠,高手:& a/ c" ]( k/ H5 [$ v# t) m- r

* W2 }# {- h* o* C# n5 m5 y我有了牛津双解词典的txt格式的源文件,想做一个专门学习同等学力词汇的词典。所以想提取同等学力大纲词汇范围内的大概5-6千词汇。请问,如何做呢?有什么技巧和软件可以较快速的实现啊?!不要让我一条条查找复制啊!工作量太大了!$ ]' A, {# z1 ^" H

9 k/ f. V6 W5 E  q5 T1 ?$ Y此贴的前世是:https://pdawiki.com/forum/thread-10470-1-1.html( 如何从《牛津英汉双解词典》中提取“同等学力大纲词汇“做成专用词库?!)

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2013-2-4 11:07:25 | 显示全部楼层
    有好多方法可以一次性提取所需文本,可以使用cygwin也可以使用powergrep等,效率就是几秒钟的事。加油!

    该用户从未签到

     楼主| 发表于 2013-2-6 05:29:22 | 显示全部楼层
    有好多方法可以一次性提取所需文本,可以使用cygwin也可以使用powergrep等,效率就是几秒钟的事。加油!
    1 v' x) v( m' N7 Mmenglongma 发表于 2013-2-4 11:07
    . k" c: r6 A% E: k* u, o
    能不能再具体一点点,上次有位大侠说cygwin可以,询问了度娘,可惜没找到有用信息啊!那位大侠说的也不很具体!我还是新手啊,摸索的不容易啊,玉口良言,多说几句啊,对我等求知路上帮助无限啊!公德无量啊,阿弥陀佛!

    该用户从未签到

     楼主| 发表于 2013-2-6 05:36:52 | 显示全部楼层
    本帖最后由 humoryou 于 2013-2-6 05:38 编辑 * Q0 f$ [# m* X) r
    能不能再具体一点点,上次有位大侠说cygwin可以,询问了度娘,可惜没找到有用信息啊!那位大侠说的也不很具体!我还是新手啊,摸索的不容易啊,玉口良言,多说几句啊,对我等求知路上帮助无限啊!公德无量啊,阿弥 ...* t- p; P5 G1 l$ [- n6 p  Z
    humoryou 发表于 2013-2-6 05:29
    2 q) k4 q& j/ z6 r9 }
    menglongma,原来再另一个帖子里回答的也是你!;-)谢谢!您就再多说两句吧!

    该用户从未签到

    发表于 2013-3-21 21:22:04 | 显示全部楼层
    我知道怎么弄,前提是你要有你的那个同等学历大纲的词汇表。) ~, w' q9 E; e; H* d
    我和你的情况比较像,我想背GRE词汇,发现新牛津双解词典比较好,解释精准,且有词源阐述,帮助记忆,于是从网上找了一个GRE红宝书的词汇txt,把新牛津双解词典用工具反编译,得到词典的txt文本,然后写一个python脚本,这个脚本从GRE词汇的txt里读取第一个词汇,然后以这个词汇去词典txt里找这个词的解释,找到后把这个词条写入一个文件,如此反复,直到把GRE词汇txt里的所有词汇都从词典里找出并写入到一个单独的文件里,同时这个脚本会每写到100个词汇就从新开一个文件,这样就形成了很多个单词list,每个list里100个词汇,最后用epub工具制作成epub格式的电子书,然后放到手机里,用多看阅读打开,就可以随时随地用手机背牛津版的GRE词汇啦!
  • TA的每日心情
    开心
    2018-5-11 06:17
  • 签到天数: 208 天

    [LV.7]常住居民III

    发表于 2014-3-27 14:55:42 | 显示全部楼层
    这个不错啊,有实用性。

    该用户从未签到

    发表于 2014-3-27 21:10:19 | 显示全部楼层
    jungshin 发表于 2013-3-21 21:22
    " n) C2 w1 M  a" b$ w# ]8 t& ^我知道怎么弄,前提是你要有你的那个同等学历大纲的词汇表。
    3 z% F. ?5 Z" m; h我和你的情况比较像,我想背GRE词汇,发现新牛 ...

    : F3 F7 s; M# z1 |能分享您的脚本吗?谢谢。我的邮箱:[email protected]
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-27 15:00 , Processed in 0.022549 second(s), 25 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表