一句话核心(必背)Voting = 多个不同模型,对同一条数据“投票 / 平均”Voting 是怎么做的?Step 1:训练多个 不同的模型Logistic RegressionDecision TreeKNNSVM👉 模型结构不同Step 2:每个模型给出预测Classification:预测一个 class 或 probabilityRegression:预测一个数值Step 3:Aggregation(投票或平均)🔹 Hard Voting每个模型投一个 class多数票胜出🔹 Soft Voting(更常用)每个模型给 probability对 probability 取平均选平均概率最大的 classVoting 解决什么问题?不知道 哪个模型最好单一模型不稳定希望用 “集体智慧”优缺点总结✅ 优点简单易理解快速提升稳定性❌ 缺点不能解决高 variance 的单模型问题模型之间如果高度相关 → 提升有限典型使用场景baseline ensemble快速提升 performance不追求极致 performance,但追求稳