|
8 ?: s: E5 }7 P3 g' e首先要感谢 tsiank 和 bt4baidu 两位的精彩作品。2 h0 n+ C, a* ?& m+ `$ n
这里 https://pdawiki.com/forum/forum. ... &fromuid=147948
! J* A0 [3 R$ Q/ Q坛友提到
/ \, B6 ?2 j$ x7 ?! W这个dictionary和thesaurus的词条数加起来为什么只有12万多?我对比了tsiank基于premium的移动版制作的dictionary,光这个dictionary就有15万多,那个thesaurus有4万多。 ! _6 u7 W& S# S% n1 Q
我也好奇地研究了下。2 o# x% i9 n. F8 I: S
[数据来自 http://www.merriam-webster.com/ 2015] bt4baidu [英-英] 【合集】MərrïamーWeßstër's Super Deluxe Bundle, 2015 https://pdawiki.com/forum/forum.php?mod=viewthread&tid=14138
" ~; A; g Z( L9 S[数据来自 Android APP ] tsiank [英-英] [0520updated]ODE2015 and MW2014 https://pdawiki.com/forum/forum.php?mod=viewthread&tid=13665 [Merriam-Webster's Collegiate Dictionary and theasaurus 2014 based on M-W-Dictionary-Premium v.3.1.1.apk]
2 @, p" G( c& o1 mDictionary + Thesaurus % n" h% j! a0 p! j* b1 B/ U. r" s4 k
tsiank 版 keywords 数目去重后是 155607 。! f$ Q+ U$ P$ u# j6 [
bt4baidu 版 keywords 数目去重后是 120417 。
& z' m# H6 J2 R; {2 Y) j" M
1 B& @) z1 {6 g( f原因其实很简单,tsiank 版本提取自 APP ,keywords 包含了构词法,比如单复数、比较级、过去式完成时等,还有特殊字符转为一般字符方便查询的情况。7 T% m5 b2 z/ r3 q- r
bt4baidu 版本则来自在线版本,keywords 来自 http://www.merriam-webster.com/browse/dictionary/a.htm ,并没有包含上述各类变形情况。0 r8 @9 r3 G3 d' n" z
比如,查 books 、 booked , tsiank 版给出 book 的内容,而 bt4baidu 版则没有结果。, K. A7 w- y$ q% G
但是,查 cowy、 crampy , tsiank 版则没有结果, bt4baidu 版给出 cow、cramp 条。" ^/ A3 v: U( F/ [& }& n
也就是说, bt4baidu 的词头索引 keywords 是包含了 derivatives 但没有包含 inflections ,而 tsiank 版包含了 inflections 却没有包含 derivatives 。7 u+ ?1 V+ k: B" D; y
附上 keywords 。+ }; }: `* F/ L
! Y5 n U! U; l
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|