机器学习
大约 3 分钟
机器学习
什么是机器学习
机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径之一,即以机器学习为手段,解决人工智能中的部分问题。机器学习在近30多年已发展为一门多领域科际整合,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。
机器学习类型
- 分类(Classification)
- 回归(Regression)(预测)
机器学习主流算法
监督学习
1. 线性回归 (Linear Regression)
- 描述:通过线性关系建模,用于预测连续值。
- 应用:房价预测、销售预测等。
2. 支持向量机 (Support Vector Machines, SVM)
- 描述:寻找一个决策边界,使得样本点离该边界最远,用于分类和回归。
- 应用:图像分类、文本分类等。
3. 决策树 (Decision Trees)
- 描述:基于树状结构进行决策,通过对特征的递归分割来进行分类。
- 应用:医学诊断、金融风险评估等。
4. 随机森林 (Random Forest)
- 描述:集成学习方法,由多个决策树组成,通过投票进行分类或回归。
- 应用:图像识别、信用评分等。
5. K近邻算法 (K-Nearest Neighbors, KNN)
- 描述:根据邻近样本进行分类,即样本的类别由其最近邻居的多数类别决定。
- 应用:手写数字识别、推荐系统等。
6. 朴素贝叶斯 (Naive Bayes)
- 描述:基于贝叶斯定理,假设特征之间相互独立,用于分类问题。
- 应用:垃圾邮件过滤、情感分析等。
7. 神经网络 (Neural Networks)
- 描述:通过多层神经元组成的网络进行学习,用于复杂模式识别。
- 应用:图像识别、语音识别等。
无监督学习
1. K均值聚类 (K-Means Clustering)
- 描述:将样本分为K个簇,使得每个样本都属于离它最近的簇。
- 应用:图像分割、客户分群等。
2. 层次聚类 (Hierarchical Clustering)
- 描述:通过构建树形结构进行聚类,直到所有样本都属于一个簇。
- 应用:生物学分类、文档聚类等。
3. 主成分分析 (Principal Component Analysis, PCA)
- 描述:降维技术,通过找到数据中的主要成分来减少维度。
- 应用:数据可视化、特征提取等。
4. t-分布邻域嵌入 (t-Distributed Stochastic Neighbor Embedding, t-SNE)
- 描述:降维方法,用于可视化高维数据。
- 应用:可视化聚类结果、图像嵌入等。
5. 自编码器 (Autoencoder)
- 描述:通过学习数据的压缩表示,用于降维和特征学习。
- 应用:异常检测、图像去噪等。
6. 关联规则学习 (Association Rule Learning)
- 描述:发现数据中的关联规则,如频繁出现的项集。
- 应用:购物篮分析、交叉销售推荐等。
7. 高斯混合模型 (Gaussian Mixture Model, GMM)
- 描述:假设数据是由多个高斯分布混合而成,用于密度估计和聚类。
- 应用:图像分割、异常检测等。