掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 979|回复: 8

[词典科普] 教大家怎么给大型词典,比如OED,找最早书证

[复制链接]

该用户从未签到

发表于 2020-9-29 13:01:11 | 显示全部楼层 |阅读模式
本帖最后由 klwo2 于 2020-9-29 13:01 编辑 / J/ T; Q1 `3 o) [8 d
. I4 C3 O, B- e
读过天才、疯子、大词典家教授与疯子这个故事的朋友都知道,牛津英语词典/OED最早走的是「人多力量大」的路线,众人拾柴火焰高,大家一起找书证。
/ _+ G2 G8 c, M  S: Y
) e$ c% N- j7 k4 @7 \: s找书证算不上特别难,难的是书证一定要找最早的。追根溯源,穷源竟委,这股风气是OED带起来的,影响了西学东渐以来的中国知识分子,编纂《辞源》《辞海》《汉语大词典》这些大型辞书的时候,不管编纂条件多么寒酸,大家多多少少都希望自己能实现跟OED一样的目标,平起平坐。
, ?. q) C) A* G& q/ U1 ^: _4 d——————————————————————————————. g+ n# }2 r# Z( y$ ~  ?& W6 {5 p

$ Q% K9 }. E; ^4 X- M2 h最近一阵子,OED编者发起了一个活动,让大家帮着提前最早书证,如果你发现OED记录的某个词的最早用例还不够早,欢迎告诉编者。这是怎么回事呢?
* ^( L' {) Q" `* k; F% T' u' j6 v
) I# W% L; l6 B* b- j: C原来,OED3刚开始修订的时候,数据库还是稀罕事,编者就在这样的条件下修订了M-R之间的单词
8 q: V: m# v0 v1 k/ t
  d' H; T& p9 @" m9 I) O时光荏苒,转眼间数据库资料库遍地开花,新修订的部分自然是充分利用了这些利器,可是老的怎么办?编者已经没有功夫把M-R之间的词再逐个过一遍了,于是这么一个拾柴活动上线啦~/ X$ V) |" ^' i! L

4 k2 L) V: P0 O教程超简单,我来演示一遍:$ F, _7 P; M( V2 {5 O# U
1 F, v% T6 s3 ^6 j
1)找下手对象。OED说了,下手对象是M-R之间的任意单词。其他单词不参与本次活动喔
/ C' U- ~+ v0 P7 e& X2)在数据库里面搜一下,比如下面这些数据库:" P& k7 ^2 n; H
0 c( g* T, y' x# P7 A6 A
Early English Books Online (EEBO)
, G$ T5 b' n: HEighteenth-Century Collections Online (ECCO)
% e  ]: M$ ?" \0 f' K0 K6 xGoogle Books
. R$ E$ J- I) t9 H5 T0 u2 HAny substantial historical newspaper database that features facsimiles of original pages (there are many suppliers of these, including Gale, NewspaperArchive, ProQuest, and Trove).
, X& |1 r& J( O, n2 ~9 [9 J0 ^
有的免费,有的需要大学、机构账号登录。. H2 }/ A1 A' s- j4 j

4 b) \2 Z: B) O; B3 |! w$ B5 Z, B比如说,我看上了masculinity/男性 这个单词,打开第一个Early English Books Online (EEBO)( f- Y* Q3 L  V: p5 N$ Y

& A) u6 T% m6 _: }2 G! A& X' g% J; B9 W

; P/ ^2 T+ B1 O; P3 B然后把masculinity填进去搜:& G  P( U5 v. x$ e1 `0 G" Q
& ^" ^1 A* }) Y! G

! O2 [6 {$ o2 M
: E4 `$ Z8 B9 u  o/ o" ~看年份,咦,好像比OED条目里面写的最早书证早唷,那就点一下「Results details」:; a5 w2 M; w9 h; w: h
  A# H& Z2 A) C4 p
/ b/ ~" C& @- O; e& q8 ~/ k

/ p' H9 F6 B8 M9 Z7 S* x* R7 D) S# @这里要小心一点,说不定句子里的意思不是我想的那个意思呢?不过masculinity本身意义比较单一,这里Masculinity 跟Feminity并列,明摆着就是我们想的那个意思嘛!一点儿错也没有
/ i# ]1 G! y$ w
& Q$ a9 g2 X/ B( Q3 n那还愣着干什么,麻溜地给人家填表去呀,网址在这里
, J+ N/ j% K2 |0 E! H/ @
! E, z( S9 d$ _7 c% @; y$ |4 O- p要填词语、年份、数据库名、整个句子、句子所在的书名。0 H8 V0 U; P) Q  J
/ b7 j' ~! K, @% K8 X$ w& J* o
还有一个办法就是上Twitter,发#oedantedatings 报告书证。反正流程就这么简单,演示一遍,走完啦。
% O4 A# o% u9 a' t1 `$ g& G4 @/ P0 f0 b. l/ O- a* y
当当当当!
  ?2 K/ ?& m/ q( h
" k' D' @7 J$ O7 o: ~. i- g" ^8 t; I8 }& _1 N) j$ i; o4 o9 b
6 _3 d2 b5 x' X
看,现在OED网站上,masculinity的最早年代提到了1571年。例子就是我们刚刚演示的Early English Books Online (EEBO)里的那句话,是不是很有意思呢,喜滋滋……
4 B; Z# b9 _; T7 B' [
8 O1 Y; @# k) \OED修订者说:. L# {3 V3 c6 N
% V) j. c* h, u% ^( n' n, s
masculinity: antedated from 1748 to 1571: C+ \0 F+ W2 Y5 ?! {  p7 K2 U
Munro-bagger (a climber who ‘collects’ the high peaks known as Munros): antedated from 1956 to 1910
; I: h4 y0 l7 S" V% }: p) s$ z! imonkess (a nun): antedated from 1729 to 1602 (a contribution from former OED researcher Christian Munk, who clearly misses his old job – he’s sent in numerous monk-related antedatings!)
8 @/ e. M  j3 m  f. [Macaronesia (a region including the Canary Islands): antedated from 1917 to 1878- Y, D1 Q8 D7 ]& z
macular (referring to maculae or sunspots): antedated from 1826 to 1686
3 Y: `/ J. [  e: }meaningless: antedated from 1796 to 1728
mendacity: antedated from 1646 to 1540 using EEBO; likewise moonbeam (to 1535 from 1600), multiplication table (1657 from 1662)& {* M, r7 p4 _5 I# k0 N
masonic: antedated from 1786 to 1761 using ECCO; likewise moonlit (to 1783 from 1817)
3 s- p: X- |1 }$ Wmenopause: antedated from 1872 to 1858 using Google Books; likewise melodramatically (to 1820 from 1836)
, s$ A$ |5 T4 m0 gmeanie: antedated from 1927 to 1902 using NewspaperArchive; likewise mellophone (to 1901 from 1913)
4 |9 F* D0 y$ ]4 M$ M/ Vmom: antedated from 1894 to 1846 using newspaper databases on ProQuest

; I: a4 h$ |' e6 B你看,虽说大家都喜欢书证提个几百年什么的,显得进步大,不过以人家的标准,最早书证提前十年二十年的也叫「提」,完全不嫌弃啊。天底下那么多闲人,不用浪费了。- c- j: o! m& ]. y2 O& f! T( x; x

" i" q, M1 ^6 h5 f有人问,那咱学英语的人参与这个有没有啥好处?这个问题我这么看:# L% Q# q" a! L  _( X3 i1 i
- T+ R) j% Q- g; u& b6 U8 R
1)横竖就是个活动,图个轻松、快乐、乐呵,玩一玩不是坏事儿3 w& p! @+ Q2 b
2)如果是抱有雄心壮志,要给人家贡献一大片,那大约是误会了。OED修订慢着呢,复杂着呢,帮忙找个最早书证算是拧个螺丝 —— 天天拧也拧不出航空母舰呀6 [/ l8 \! |- I" U
& x& |. y- o3 Q
以现在这个进度,OED完整翻新一遍还要二十年(据说2037年完工),当前的OED在线版,老内容仍然占大多数 —— 2000年开工的,时间才走完一半+ C0 x$ k0 G9 f# [% K; |* t
————————————————————————————————————————, o( l5 m# Z0 F  g& W1 S$ @+ y
下面说一说,假如说《汉语大词典》也搞这样的活动,该怎么玩呢?6 G3 u, b) ]1 [# L5 W7 \; c; n
1 K% \' x$ Z5 X* E0 i2 t
声明一句,我说「假如」,我可没有替人家编纂人员发言的意思,不要看错咯。* R" \* M4 g( T& }6 D  X
+ y- Q5 n9 J7 W* s3 U
我估摸着,这活动会有几点不一样:
: v7 @" h9 q$ l) c$ H
! W/ U6 g1 y& V) ^3 Z' m" Q7 J5 e1. 大多数古书没有确切年份,有好些书具体年代、朝代都不甚清楚。所以要参与古代词的部分,不能指望大家伙个个都清楚谁比谁早。
- R- g0 J5 x. r. v2. 古书有断句、标点问题,还有好些古籍没有整理过。这都是难题。不过话说回来,参与这个,绝对能提高古文水平、古代文化认识水平,能催出多少篇论文来那更是不用想像~汉语的历史毕竟比英语长一大截呢!, i" o6 R8 v) w2 K' p
; k9 A* B0 }- L$ }4 k  q
要解决这俩问题,我没什么高招。不过我倒是建议啊,《汉语大词典》第二版完全没必要出什么纸书了,效仿OED,搞在线版得了。在线版完全不用担心篇幅问题,不需要考虑省纸、省墨、印刷成本。
: u3 P8 A$ L$ c9 t$ j
6 X; x0 X. o8 @以在线版的形式广撒网,征集例句,不需要读者定年代。好比某某词收集了30个例句,刨掉重复的、不合格的,剩下20句,这20句里头有5句不是很典型,语境不太好,再剩下15句挺好,各个朝代的都有。
$ R! h- b; w$ |2 T
) @6 o) q% i. A: e2 q请问纸书能把15句都印出来嘛?当然不能了,这样的话成本盖不住,必然要取舍,「舍」掉那些不是一级棒的例句。这么一来,辛辛苦苦给你贡献例句的读者苦等几年后收到书,发现自己找来的例句完全不在里头,什么心情?还会继续贡献不?——虽说编者可能也是割了爱了,可是这份心情读者看不见呀。: j+ t' P/ ]+ I5 L; r

( e, v( r8 T* W' d, g只留在线版,编者读者都可以尽情放飞自我,不用顾忌篇幅。纸书留给专书、专著,比如Historical Thesaurus什么的。
' i5 T# R7 B( v: l! I6 w, q% `; D& U3 M  g4 Y
留在线版还有个好处,汉语不分词,某些说法到底算不算一个词语,争论不休。「带孩子」是不是一个「词」呢,《国语辞典》说是,带孩子=带着孩子、照顾孩子。可是《现代汉语词典》《汉语大词典》大概觉得带孩子=带+孩子,是字面组合,就不收录。可是「带三个孩子出门」跟「离婚带三个孩子」不一样,能拒绝承认嘛?「带娃」不是词。可是「带娃儿的」「带娃娃的」指奶妈、保姆(漢語方言大詞典),你不解释,人家以为指的是当妈的,这能行嘛?
+ c' ~1 H" @' \- J6 F, M7 ]; x/ h! B4 z
与其在这种问题上反复纠缠,编词典的跑去掺和语法学家的事儿,床头吵架床尾接着吵,不如统一放宽标准,大不了在释义里头写:「带孩子,带10+孩子的字面组合;带12+孩子的字面组合」嘛(《现代汉语词典》「带」第10个义项:引导;领。第12个义项:照看孩子),太过分的短语拒收就行了。多省事儿?编者开心读者也开心,反正不用担心篇幅!
: n4 P0 _  ^) I5 D1 B
9 d0 I5 A0 z1 S4 b0 `————————————————————————————————————————- f& x5 c& B& r5 B
( v7 ?" r+ H* Q/ V! m  V" Y
言归正传,说回怎么参与活动的问题。我给大家举浅显一点的近现代例子:! L0 e  n% \, y3 f- r1 T7 n( T

1 ^, E; r* p: I3 S; I《汉语大词典》「男性」:" S+ g( c, ?. Z/ \

+ J5 K% Y% H6 ]. {% \* k7 D2 ?$ o. T, n+ G! m) [

' X2 @4 D  M+ D3 {. ~& n: B《汉语大词典》「男性」的书证是1990年的?这是在调戏人吗?
& e) t- O8 [/ w7 Z% V; A
8 f/ d: w+ Z$ z8 M当然不是调戏人了,这是《汉语大词典》收录方针的问题,当初《汉语大词典》收近现代词,就没有追到最早的书证。+ Y1 s2 b2 b& a; F% k# X
* A& }1 q. v8 y0 Q5 |  A8 p6 k. k
换一本看看,最近刚出的《近现代辞源》:0 ]- D9 W: Y, h' t9 e) k. V7 y

2 ]: ~* Y8 D. J
: {. j9 ?# \+ G& x* y0 I& C  p( x2 P! j

# \+ J9 v* e. Y' O7 h2 N* i4 ~「男性」「女性」追溯到了梁启超的时代。; O# {6 I& m. q0 D: D
6 {+ b( N2 D  i+ I# K
要不要找这个?说实话,我有点没兴致。不瞒大家说,我偷偷地看上了同一页的这个词「女朋友」:. o" D5 o* V$ k

4 a% P* Q* T# _) ?6 P( F
( M% Q5 h# d7 S  i) q, v) K
: r/ A0 \  q' u7 H$ A9 W「恋爱中的女友」,这个意义最早书证在1934年,《新生周刊》。这我有点不信 —— 《新生周刊》是上海刊物,刚创刊就用上了「女朋友」?不太像是最早的。+ G, o9 W7 ?2 d, S( J: o- }
" y# O# p1 F) R4 Z
哎,我怎么觉得「女朋友」像是西洋girlfriend翻过来的呢?最早应该是洋气的人先说的吧?
% _: ]: I7 U0 J( l! a2 M% B
1 T* C& u7 Z2 ?这就上晚清民国的数据库看看,我这里选的《申报》数据库:
8 A, I( I4 P8 K% U2 G1 H# i6 {) m' Q+ \) F" ^% P1 `! o

+ x# i8 M  u  b. g, z8 W8 m+ h: F; M% _, F- m9 h
果然有更早的句子。不过好像不太牢靠,不能证明这里的「女朋友」就是「恋爱中的女友」——尤其是那个「女人自有女朋友」,听着意思应该是:「女人自有女性朋友,咱们不用替人操心」……" d( n7 @/ y5 s  [8 O" Y( N
. P) a$ s3 ~  T& }
" D% D/ \4 ], i8 ^8 ^9 Z
9 s$ u; U, j  G( U- n5 w9 F" }3 A
这个1921年的看着挺合适唷。一起看一看瞧一瞧——  P& S% Y! U3 K" [8 }3 ]& k' l, v

: Q( Z% i! _" z  S  A
上所述之海外姻緣,除重婚外,本無不正當,且世界大同,欲謀世界眞正之和平,此種婚姻乃爲必要之利器。
6 V* [1 X4 }3 S% l6 L
& _( n, ^. `. \# t普通之學生有種種原因,故不抱此種婚姻思想,然同校中不乏女學生,爲交换智識起見,結交一二女同學,亦理之所宜,惟在英國學生,秉守此處學生之習氣,與女學生通信者有之;與女學生在校中談話者有之;然校外之校際,則尚付缺如。一則中國學生大半以結交女朋友爲不可彰揚之事。一則亦無人爲之創耳。有時或有人請一二女同學在中國飯館小叙,不二日則凡中國學生無一不知之矣。此等處亦不得不嘆中國學生見解之小,同學間之酬酢,何所用其大驚小怪耶。
& w9 H$ s% }. m$ a* v
文章题目《留英法學生瑣談(五)》,刊于申报1921-12-10。讲的是留学英法的中国男生结婚谈恋爱、结交女朋友的事情。女同学能跟女同学结交,在英国的男同学你们也要动起来啊,老守着故土的风气干什么,光会在校内交际,校外呢?「结交女朋友」有什么不可张扬的啊?! c0 l2 O2 e& l6 _

" v6 Y0 s! D# D% _! i# O8 i这回是「恋爱中的女友」没跑儿了。
$ r. L2 g& w6 s" B2 U4 D9 v) O# k5 b2 \* A$ E. U) X8 i4 i
1934年——>1921年,提前了13年,还是不错的哟。4 z! n2 ?* X9 A( @- ~

$ B& {5 S6 B5 |6 L' Q0 zOED grilfriend条:
; ]8 D* U5 O, X3 _- `% o6 C
7 d& G( k8 J: V: N: K
2. A female with whom a person has a romantic or sexual relationship; a female partner or lover.
4 l/ P% l1 Z& n" m  {& v! SUsed of a female member of an unmarried couple, in some contexts esp. a young couple whose relationship is conducted on a relatively casual basis.( g3 L1 |( b2 j1 P& A+ _
1892   F. J. Furnivall Hoccleve's Minor Poems Ded. p. iv   To the memory of Teena Rochfort Smith my much-respected and deeply-regretted girl-friend.4 h4 z7 q  s# w# m" w2 d
1928   R. Macaulay Keeping up Appearances xi. 118   Daphne seems quite to have become Raymond's girl friend again.

. e! C8 u5 l1 a$ P# i2 s! d! H比照一下晚清留学生的年代,这两个词年代确实差不多。! ^( @1 _" a  s. H1 h: C) d

, M; A2 n0 y% h+ C- }怎么样,还是有点意思的吧。接下来的工作就是填表或者@人家微博账号啦' M' m1 A- l. C3 i& |
/ L) O$ k1 j" Y' w# w3 r
——————————————————————————————————————————————6 ?3 q- t: z3 V* f
OED收词60万,汉语大词典第一版约40万,还是很相似的。期待在不远的未来,大家都能一起玩上「众人拾柴火焰高」,省得一说学语言,大家就联想到背单词,背完牛津背朗文,背完朗文背柯林斯,背完柯林斯?我要背OED!一说学古文,就是背古文观止背唐诗三百首背四书五经国学私塾幼教……能不能有点新意呢?
. ^# ?* r- l' c7 p' x& E' L! v3 m- o/ H/ Q

$ v3 p! W1 M& ?' z
% y8 [" }1 w5 f# z- n- H( y
, k4 a0 L8 m, e( ^# H* C& o( [. o5 L! ~( _, t7 m) z( I3 q

评分

1

查看全部评分

  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2020-9-29 16:18:57 | 显示全部楼层
    「女性朋友」3 M; n" E# `4 g6 [. D
    0 n% H+ m/ r0 k3 g4 k+ r: N
    官場現形記 1903~1905; \9 L& f& c6 Q, Y
    https://ctext.org/wiki.pl?if=gb&chapter=538720
    4 j) F2 j% {* a6 Z
    此時寶小姐聲氣廣通,交游開闊,省城裡除了藩台、糧道兩家太太之外,所有的太太一齊同他來往。他們這般女朋友竟比男朋友來得還要熱鬧:今天東家吃酒,明天西家抹牌;一齊坐著四人大轎,點著官銜燈籠,親兵隨從簇擁著,出出進進,好不威武。就這裡頭說差使,托人情,在湖北省城裏賽如開了一爿大字號一樣。
  • TA的每日心情
    开心
    2019-8-21 19:27
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2020-9-29 15:00:50 | 显示全部楼层
    OED 快的话,是不是再来个 10 年就能完整修一遍
    # a, _6 K& ?& _) Q; a! w6 i
    ( z  c6 C; p# g

    该用户从未签到

     楼主| 发表于 2020-9-29 17:37:00 | 显示全部楼层
    Mandolin 发表于 2020-9-29 15:00
    ) w- J$ L+ Z5 r, O2 J. F+ R3 NOED 快的话,是不是再来个 10 年就能完整修一遍

    ! b( a" }( z. J" n* d6 X+ q  o你这个算盘打得很精嘛,可是:+ h6 H1 R3 V' ?% p$ d

    : J& i" e9 ~# @1 a37%乘以2是74%,不是100%
    : V2 s# ?* o. |5 k; I- r/ L! p37%乘以3是111%,又超了
      A# X6 _4 j2 u/ A+ [5 f2 P
    ' f' c6 V! ^' f" L( k保险的说法是还剩10年-20年,这跟「据说2037年完工」差距不大嘛, d4 H4 N' z: [4 S3 g9 `

    9 ?5 v5 I& H& F* Y9 LOED会不会越修越快?这很难讲,今年人家就因为COVID19,多出了计划外的事情。牛津不靠OED赚钱,赚不了钱。想要快,就得添置人手,不划算。
    ) y/ j2 X( l+ ^" t
    0 X7 ^. `7 ~) |; bOED的目标是描写语言的全貌,和我们学英语,优先掌握常用词不一样,OED并不因为某个词常用就优先修,它是照着字母表顺序来的,碰到常用词,用法太多,还会拖慢速度

    该用户从未签到

    发表于 2020-9-29 23:35:13 | 显示全部楼层
    真爱。我估计我国的芯片研究人员缺的就是这种认真专研的精神。
  • TA的每日心情
    慵懒
    2021-8-25 10:07
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-9-30 08:10:23 | 显示全部楼层
    普通之學生有種種原因,故不抱此種婚姻思想,然同校中不乏女學生,爲交换智識起見,結交一二女同學,亦理之所宜,惟在英國學生,秉守此處學生之習氣,與女學生通信者有之;與女學生在校中談話者有之;然校外之校際,則尚付缺如。一則中國學生大半以結交女朋友爲不可彰揚之事。一則亦無人爲之創耳。有時或有人請一二女同學在中國飯館小叙,不二日則凡中國學生無一不知之矣。此等處亦不得不嘆中國學生見解之小,同學間之酬酢,何所用其大驚小怪耶。
    6 Q+ \" v- l2 N/ Z6 ^; ^4 I4 c
    这段仔细看看,感觉说的还是“女性朋友”,并非“恋爱关系中的女友”
  • TA的每日心情
    擦汗
    2020-12-9 08:35
  • 签到天数: 108 天

    [LV.6]常住居民II

    发表于 2020-9-30 08:58:25 | 显示全部楼层
    这个看起来挺有意思

    该用户从未签到

     楼主| 发表于 2020-9-30 11:05:38 | 显示全部楼层
    大橙子 发表于 2020-9-30 08:101 W2 I  c  x; |- @( l: v" `
    这段仔细看看,感觉说的还是“女性朋友”,并非“恋爱关系中的女友”
    * }5 X" R& X; c# A
    没看见上头反复强调的「婚姻」么,通向婚姻的女性朋友不是恋爱是什么,难不成是柏拉图式的……?% B- G: ]. v- x2 E& O3 U% w0 v

    ; K& Z% t! c1 a6 o. \
  • TA的每日心情
    擦汗
    2023-2-15 04:29
  • 签到天数: 72 天

    [LV.6]常住居民II

    发表于 2020-11-19 23:28:04 | 显示全部楼层
    googlebooks的年代标注真的错得非常多,很难想象一个大公司这方面会做得这么差
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-24 02:09 , Processed in 0.024439 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表