请教一个打标签模型

foxknox
3爷 07月24日 字数 130

给定一篇文章,抽取摘要后,并给文章打上标签。如“科技文献”“综述”“产业新闻”等。

不知道有无现成的模型,如有开源供研究更好。多谢。

NLP 自然语言处理
9 个回复
zhuxf
言乍古月 07月25日

既然能抽取到摘要,为啥不抽取关键词呢?

【 在 foxknox (3爷) 的大作中提到: 】

: 给定一篇文章,抽取摘要后,并给文章打上标签。如“科技文献”“综述”“产业新闻”等。

: 不知道有无现成的模型,如有开源供研究更好。多谢。

foxknox
3爷 07月25日

主要有些关键词不一样和需要打的标签名称一致。。。

【 在 zhuxf 的大作中提到: 】

: 既然能抽取到摘要,为啥不抽取关键词呢?

zhuxf
言乍古月 07月25日

非主题词也要作为标签出现?

【 在 foxknox 的大作中提到: 】

: 主要有些关键词不一样和需要打的标签名称一致。。。

foxknox
3爷 07月25日

比如一篇文章(新闻类或者普通的文章类)就是泛泛的加了物联网的技术基础理论,想把它标记为“综述”这个类型。可能通篇文章都没有出现“综述”这个词。

【 在 zhuxf 的大作中提到: 】

: 非主题词也要作为标签出现?

: :

zhuxf
言乍古月 07月26日

我从直觉上判断,人工主观都不太好判定,更别说机器了

【 在 foxknox 的大作中提到: 】

: 比如一篇文章(新闻类或者普通的文章类)就是泛泛的加了物联网的技术基础理论,想把它标记为“综述”这个类型。可能通篇文章都没有出现“综述”这个词。

foxknox
3爷 07月26日

嗯,本来想通过一定量的同类文章搞个模型,但是觉得过于复杂,想通过多篇的关键词抽取后,再聚合会不会有共性的呢?

【 在 zhuxf 的大作中提到: 】

: 我从直觉上判断,人工主观都不太好判定,更别说机器了

: :

yourgf2
yourgf死了,我是二代 08月07日

你有没有现成的语料库?

如果有语料库的话,有很多种文本分类算法可以用

【 在 foxknox 的大作中提到: 】

: 嗯,本来想通过一定量的同类文章搞个模型,但是觉得过于复杂,想通过多篇的关键词抽取后,再聚合会不会有共性的呢?

foxknox
3爷 08月07日

没有?

想一边自主学习一边完成打标签。或者已有模型直接打标签

【 在 yourgf2 的大作中提到: 】

: 你有没有现成的语料库?

: 如果有语料库的话,有很多种文本分类算法可以用

gloria2011
gloria 08月20日

人工标注,文本分类模型

【 在 foxknox 的大作中提到: 】

: 给定一篇文章,抽取摘要后,并给文章打上标签。如“科技文献”“综述”“产业新闻”等。

: 不知道有无现成的模型,如有开源供研究更好。多谢。