题名:
基于机器学习算法的分类知识发现及其在文本分析中的应用   / 祁瑞华著 ,
ISBN:
978-7-302-41576-3 价格: 46.8
语种:
chi
载体形态:
178页 23cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2015.12
内容提要:
本书随着数据获取技术的不断发展和电子商务的广泛应用,各种信息正以前所未有的速度日益积累,高效率地分析信息海洋中的大量数据已经成为商业领域、工程领域和科学领域的共同需要。文本挖掘是数据挖掘领域的一个分支,与数据挖掘假设数据源是结构化数据集相比,文本挖掘的对象是非结构化或是半结构化的文本集合,需要从以文件形式存储的文本中提取和分析特征。不完整数据处理是现实世界中分类知识挖掘必须认真考虑和对待的重要问题。本书探讨了不完整数据分类算法的改进及其在文体风格识别中的应用,并基于缺失补偿策略最大熵模型对文本分类算法改进进行了探索性的研究。 
中图分类法:
TP274 版次: