定个小目标,发它一个亿条微博语料

2019最新的微博语料,可用于预训练语言模型Weibo-BERT词向量等。由于比较时新,对网络流行语的建模可能很有帮助。每个压缩包都有两千多万条,一共5个。大家下载之后也算是有一个亿身家的人了,激动吧。感兴趣的同学要不要训练个Weibo-B […]

文章来源:

Author:hankcs
link:http://www.hankcs.com/nlp/corpus/1-hundred-million-weibo-corpora.html