掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 846|回复: 7

[求助] 请教,怎么从一篇文章中提取词组?

[复制链接]
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

    发表于 2017-12-22 13:33:05 | 显示全部楼层 |阅读模式
    英文是天然分词,但词组怎么弄呢。/ L, O  O' U. y: K
    ( H7 r5 X5 y# x' L3 L
    现在有成熟的方法能从文章中把词组都提取出来吗?
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:32:56 | 显示全部楼层
    比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词$ s& ~% o5 ^4 P8 b
    那么英语要分词组也是一样的 首先需要英文词组的切割算法(算法模型)然后在需要有软件
    5 {' b$ F6 h' ~不过目前只看到过中文分词软件 没见过英文分词组的软件(可能词组不如词语那么好判断)
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:46:34 | 显示全部楼层
    blkserene 发表于 2018-3-15 10:32
    5 f( U. ^- l- H) C比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词& F8 X* Q6 F" J# }" _' n+ ^
    那么英语要分词组也是一样的 首先需要英文 ...

    ( f& g. ^7 c8 J6 b& s听说过python 的NLTK,但没细研究过,这应该是很完善的库了。不知道这里有没有
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:47:51 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:366 c* e% N% _6 p" ~7 X/ O* f# j9 c6 A
    用ANTCONC
    % r; B+ y. H4 k9 L
    antconc 只是语料库分析软件 他自己没法切割词组。。
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:50:53 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:36' f( M9 V% B9 H% h
    用ANTCONC
    & o  p2 t0 R9 U6 v1 H
    非常感谢,看了下文档,貌似Collocates Tool是我想要的
  • TA的每日心情
    开心
    2018-3-16 06:15
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2018-3-16 15:58:53 | 显示全部楼层
    mahuangyihao 发表于 2018-3-15 10:500 j* [! j! b3 h' `
    非常感谢,看了下文档,貌似Collocates Tool是我想要的

    3 b  o$ _+ M' ?8 r  cRT

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-3-20 22:20:24 | 显示全部楼层
    谢谢,好像对我也有用。研究一下。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-6-28 05:14 , Processed in 0.041340 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表