定个小目标,发它一个亿条微博语料
2019最新的微博语料,可用于预训练语言模型Weibo-BERT词向量等。由于比较时新,对网络流行语的建模可能很有帮助。每个压缩包都有两千多万条,一共5个。大家下载之后也算是有一个亿身家的人了,激动吧。感兴趣的同学要不要训练个Weibo-B […]
文章来源:
Author:hankcs
link:http://www.hankcs.com/nlp/corpus/1-hundred-million-weibo-corpora.html
下一篇:简单有效的多标准中文分词
上一篇:依存句法分析在深度学习中的应用