TA的每日心情 | 衰 2018-6-17 08:57 |
---|
签到天数: 49 天 [LV.5]常住居民I
|
本帖最后由 mahuangyihao 于 2021-4-28 11:12 编辑
j- r! g5 a6 Z2 H: ?: L! w: Z- m% y( C
首先感谢yikelee的各种重磅,anki是个好东西,但也得有好内容。好马配好鞍!在当今纸质书日渐走低的情况下,说实话,大多数人买了词典基本就是积灰。anki+词典的模式,可以说是词典的第二春了。! h. i9 e8 k3 h" Z7 X: c
. r5 ^9 i0 w' ~$ H2 ]- Kyikelee大的记忆库从收词角度讲,基本分3类
) Q; R8 O# o( |$ H初级:朗文3000 y9 e) A& E' E
高级:牛津5000+朗文9000(排除词组,只剩单词,去重后约8000)。这个级别托福、雅思基本够了% a2 E3 N% P, }# _ x' s- ^7 i
词典级: 中阶词典2w+,高阶词典3w+。主要面向英语专业人士了
6 a8 F0 ^+ _9 k, ~. s
* u& P% m% I$ v6 A0 c另外有个超级大包子,把 口语13500,牛津5000, 朗文9000,麦克米伦7000,柯林斯星级,合并去重,一共是15737个卡片。
* j7 q9 O+ ?* Z c- U x7 f5 J/ y8 [1 g
现在很多词典都标注了词频) f" a0 A& r: n
朗文9000:分3级,每级3000。总量虽有9000,但去重后为8000
' i( M& ]) b/ ]0 r! K7 E! N8 U8 ]* R R. _: J
牛津5000:牛10按照CEFR的A1~C2进行了标注,但只标了5000词
- |, V. I/ A2 O+ C' Y2 {* ^0 kA级 1700$ h! I/ ?! V- U- `
B级 1300; }# ~- A8 X9 K5 o
C级 2000" M7 U+ P4 R/ V/ }% e" w1 p8 K$ ~
+ J" `& m* C7 M# }) {* Q
麦克米伦6800:分了3级. U8 a9 J7 Y7 h7 j
3星 2000+ C' j S8 R7 K2 l& O! q' }2 |
2星 2300
7 N$ w, i( c" |* a6 M1星 2500. M& Q K; q0 S0 s6 ]0 f+ f
: j, L8 g' Y" r( X
剑桥(或CEFR)9700:完全按照CEFR的A1~C2标注,注意这里是包含了词组的,去掉词组,则只有6500
% t y h, H+ zA级 1700
$ }1 }1 S1 C( K% l# z/ w! uB级 5000, F2 k3 D' m( ]* b, L9 {, g c0 G
C级 3000
S: }7 r2 B! H$ n+ q5 Z5 }$ u2 t' U' o; v: i, V' ?
柯林斯:柯林斯3把单词分成5级,总共标了1.6w,其中5星~2星共计8000,是最有用的。后续版本简化为3级,而且只标了3千左右,基本没啥用。但柯林斯这个分级个人感觉一般,很多不太常用的词也标了3星或2星。7 h2 S: U$ }* y+ J+ w
5星 1300
* [4 r" {3 Z: \7 k$ D4 D5 ~3 l! T4星 1400. A* W3 S' b4 X. g; o0 h7 c
3星 1800
8 X& w4 z$ A4 \ M2星 3400
9 Y$ i4 z# T2 @( p2 L& P1星 8200 Q$ E2 Q* S/ a' l1 C
' W# M) ?( S' @2 c' L$ n; l. i0 {! @3 e) s" w/ B: H2 n' E
由以上统计,个人有些建议. |. q2 g% q4 p
1、初级收词量 \' c* o4 o2 R) d
朗文3000+麦克米伦3星+剑桥A级+柯林斯5星4星,我算了下,除去词组,总量3200
" D& M/ y$ G* `
5 @0 r! k( s2 {" C2 {% v
3 V0 ~2 M( y2 I: F+ ~: O2、高级收词量6 s& e; U9 c6 ~
这里需要说下牛10的词频标注,总量5000,比较尴尬,可以说是个历史遗留的问题。当初朗文异军突起,搞出个定义不出3000词,获得市场的欢迎。牛津就比较尴尬,跟风吧,放不下架子,不跟吧,市场又有需求,最后拖了几个版本,弄出个自己的5000释义词。但5000出来之后,朗文已经标注了9000词,对门剑桥也弄出了一个CEFR标准(涵盖1w词左右),这么搞基本就是把事情做绝的节奏了,因为1w词以上,统计上标注意义已经不大了。这牛津就2次尴尬了,这个在牛10上体现出来,就弄了个四不像的东西出来。
! z% D7 u5 z" @1 p: q4 Z对于高阶词汇,我的建议是朗文9000+麦克米伦6800+剑桥9700,除去词组,总量9000+* F( [8 ?% k8 r
; A) Z5 X% ^1 z. w1 L, Z3 @3、词典级; G+ W5 V: t1 | {: H
卡片主要还是背,整部词典感觉还是查询的场景多些。另一个场景是英语专业人士,这些人词汇量应该在1.5w或2w的样子,yikelee大做了COCA和Ngram的2w的记忆库,基本就是这个体量。
& j2 c$ ?- `7 T2 [- D/ T" C我的建议是,用中阶词典的收词范围,用高阶词典的释义。就像开头说的,中阶词典收词基本在2w左右。出版社在决定不同级别词典的收词范围时,应该是有考量的,后面已经有了原始词频统计和人工筛选的工作,这个做出来一定很棒。
4 y" S1 q3 ~) N _3 o9 q
6 r: X l) y2 F; c5 C6 ~( Z; u做过词典的应该有体会——特殊情况特别多。无论你程序编的多完善,总有特殊情况,需要迭代很多次。提取首词也是这样,我在提取剑桥A1~C2单词的时候就遇到很多问题。收词量参考多部词典可以避免这种情况。
: S' @7 J2 l( C7 V+ s2 v
; Y0 d9 _( B1 H& \) o以上提到的所有词典及其收词星级等,如果yikelee大有意做的话,我可以免费分享。! U' o; Q* `+ I9 y; R" T
4 _% ~, O: N m+ T5 U2 i) r
本人现在用的是LONGMAN 9000 (ldoce5++) 双样式,感谢yikelee大的辛苦制作。# @4 W6 C2 E, e2 Y7 d! Q
9 F( O" z# R, s, u4 s4 [anki区已经有牛9的作品,期待楼主朗文6的大作!! }& r8 D# N4 h# v1 Q5 O
_# n' G) o* b. b+ H a) q3 r
, M6 G" s. L& N1 e8 X* i% u. @6 d. m; ~
- p- }' m2 b4 h |
|