|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑
0 t. p6 w! r1 B, }6 F/ X# q$ s7 ]! \. K3 w" D! z/ d: q
如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可- s8 q; X/ \) |8 f9 @
3 J/ J/ Q/ s5 p, f如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去
/ K5 B( b0 ^- y9 j8 I! V/ D
) d i, |! B) g1 @! Y至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情
$ _. h8 A$ G0 g: @: Q7 o2 F或者用CED的单词表和新作差分后,再去轰一下也未尝不可
+ @+ U' X; d+ ~7 O7 L
$ I( T4 o" L. @& K3 K' t只提供思路,英汉词典,本人是不会出手的 |
|