考虑模糊时间序列的高维大数据挖掘方法研究

Computer Simulation(2023)

引用 0|浏览2
暂无评分
摘要
高维空间的大数据维数越高,其高维索引结构的性能越差,无法通过数据之间的相似性度量完成挖掘.为此,提出基于模糊时间序列预测的高维大数据挖掘方法.对初始的高维大数据集求取各维度数据的属性信息熵,根据信息熵筛选数据,通过主成分分析备选集合中的数据属性,结合成分协方差与特征值,降低数据维度.采用K均值聚类算法二分聚类处理降维数据,取得粗聚类结果.利用支持向量机的最优超平面与决策树作细化分类.基于时间序列上的数据极值,明确数据集的论域个数与范围,根据模糊化处理的模糊集序数,建立模糊逻辑关系,建立模糊时间序列预测模型,对大数据去模糊化处理,完成高维大数据挖掘.选用UCI大数据库作为样本集设计对比测试实验.实验结果验证了研究方法的大数据挖掘精度更高,数据挖掘加速比高达0.9以上,说明所提方法的实时性较强,具备更好的应用性能.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要