工具
本研究中使用的具体处理工具是Python下的pyLDAvis工具包。
原理简介
基于多维尺度分析MDS,使得LDA主题在此空间的距离和在高维空间中的LDA主题之间的相似性尽可能的保持一致,可以用这种方式来可视化LDA主题的内容及其相互关系。
使用简介
主要可以分为左右两个部分,左边是基于MDS算法将LDA主题可视化展示在2维空间中,圆点表示主题(圆点中的数字为LDA主题识别结果序号),圆点的大小由主题对应文档多少决定;右边为主题对应的词项,按照生成概率大小排序,该图利用web前端工具生成,具有良好的交互式可视化效果。