知乎百度爬了三百多條“為什麼博德之門3這麼好玩”的帖子和評論,用LDA主題模型和改進PMI的文本共現網絡做NLP和語義分析。時間問題數據庫不大,所以不是很準確,以後說不定可以展開做做。 LDA選取了5個主題,展現每個主題詞頻最高的10個名詞,共現網絡取了100個節點,具體過程就省略了。