知乎百度爬了三百多条“为什么博德之门3这么好玩”的帖子和评论,用LDA主题模型和改进PMI的文本共现网络做NLP和语义分析。时间问题数据库不大,所以不是很准确,以后说不定可以展开做做。 LDA选取了5个主题,展现每个主题词频最高的10个名词,共现网络取了100个节点,具体过程就省略了。