来源: 最后更新:22-08-06 07:10:39
数据预处理常见的几种方法是:
1、墓于粗糙集( Rough Set)理论的约简方法,粗糙集理论是一种研究不精确、不确定性知识的数学工具。现在受到了KDD的广泛重视,利用粗糙集理论对数据进行处理是一种十分有效的精简数据维数的方法。
2、基于概念树的数据浓缩方法,在数据库中,许多属性都是可以进行数据归类,各属性值和概念依据抽象程度不同可以构成一个层次结构,概念的这种层次结构通常称为概念树。概念树一般由领域专家提供,它将各个层次的概念按一般到特殊的顺序排列。
3、信息论思想和普化知识发现,特征知识和分类知识是普化知识的两种主要形式,其算法基本上可以分为两类:数据立方方法和面向属性归纳方法。
4、基于统计分析的属性选取方法,可以采用统计分析中的一些算法来进行特征属性的选取,比如主成分分析、逐步回归分析、公共因素模型分析等。这些方法的共同特征是,用少量的特征元组去描述高维的原始知识基。
5、遗传算法(GA,Genetic Algo}thrn),遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法。遗传算法的基本思想是:将问题的可能解按某种形式进行编码,形成染色体。随机选取N个染色体构成初始种群。再根据预定的评价函数对每个染色体计算适应值。选择适应值高的染色体进行复制,通过遗传运算(选择、交叉、变异)来产生一群新的更适应环境的染色体,形成新的种群。
熊孩子这一举动刮花奔驰,车主索赔3500元,家长竟然嫌贵?网友热议
炸裂!马斯克睡了好友华裔妻再被实锤!两人K粉一夜缠绵,惊人细节曝光
中国驻波黑使馆发言人就联合国大会通过设立 “斯雷布雷尼察种族灭绝国际日”决议答记者问
商丘柘城县多方辟谣“大量警车开道迎新领导上任”:实为开展夏季治安打防专项行动
美经济学家动歪脑筋:盯着中国桌布没意义,应对中国造苹果手表下手
“借债升官”李再勇,25年受贿超4亿元!33岁就当上县委书记,主政“江南煤都”3年,当地债务暴增1500亿元
支持巴勒斯坦受罚(支持巴勒斯坦国家)
雁归西窗月什么时候杀青 雁归西窗月剧情怎么样
如果爱还在你心中没有离开是什么歌(如果爱还在你心中没有离开是什么歌原唱)
法院推翻自己判决、被告不执行不上诉,一份胜诉判决书“沉睡”9年
商丘柘城县多方辟谣“大量警车开道迎新领导上任”:实为开展夏季治安打防专项行动
支持巴勒斯坦受罚(支持巴勒斯坦国家)哈佛剥夺13名支持巴勒斯坦毕业生学位
清落电视剧2021年几月份播出 清落电视剧更新日历 2024端午节高速免费吗?(2o21年端午节高速免费) 国家汽车以旧换新补贴 国家汽车以旧换新补贴标准2024 15年来美国首迎非洲领导人国事访问,肯尼亚将成美“非北约主要盟友”