掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 847|回复: 7

[求助] 请教,怎么从一篇文章中提取词组?

[复制链接]
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

    发表于 2017-12-22 13:33:05 | 显示全部楼层 |阅读模式
    英文是天然分词,但词组怎么弄呢。
    " m* S! U, r4 O- e
    9 X- M  O& _2 m3 _9 K现在有成熟的方法能从文章中把词组都提取出来吗?
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:32:56 | 显示全部楼层
    比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词& l. w" u% q. @/ E
    那么英语要分词组也是一样的 首先需要英文词组的切割算法(算法模型)然后在需要有软件- T: R1 c  s/ C, \# c. J4 g
    不过目前只看到过中文分词软件 没见过英文分词组的软件(可能词组不如词语那么好判断)
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:46:34 | 显示全部楼层
    blkserene 发表于 2018-3-15 10:32+ {+ e: |) s+ D( [' I9 Y1 F
    比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词
    . ?3 P* p! r, O% Q& }+ P那么英语要分词组也是一样的 首先需要英文 ...

    ( l- E" L7 S8 E) n/ K# G听说过python 的NLTK,但没细研究过,这应该是很完善的库了。不知道这里有没有
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:47:51 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:36
    ) _% J1 m( f& ?  U; v用ANTCONC

    1 f' S1 v3 k! e1 G8 M) n# vantconc 只是语料库分析软件 他自己没法切割词组。。
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:50:53 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:363 Y  |( i. t& j: s5 w: D
    用ANTCONC

      v: R, K. h0 X9 a: w0 o( a! I非常感谢,看了下文档,貌似Collocates Tool是我想要的
  • TA的每日心情
    开心
    2018-3-16 06:15
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2018-3-16 15:58:53 | 显示全部楼层
    mahuangyihao 发表于 2018-3-15 10:50
    ; {5 N9 ~: k$ F( Y非常感谢,看了下文档,貌似Collocates Tool是我想要的
    ) U' P1 B) k& d; k  u. @
    RT

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-3-20 22:20:24 | 显示全部楼层
    谢谢,好像对我也有用。研究一下。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-6-28 05:14 , Processed in 0.035856 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表