平均
最佳答案
-
Telcontar120
主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年
独角兽
嗨,萨拉,你的问题我不太清楚。也许您可以提供一个示例过程或数据文件。但一般来说,如果平均值包含了来自其他样本的信息这些样本不是你训练集的一部分那么你可能会有信息泄漏这会使你的模型产生偏差使它看起来比实际更强。5
| 0评论 | 0的讨论 | 0成员 | 0在线 |
Telcontar120
主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年
独角兽
答案
谢谢你的回答。在这种情况下,如何为数据创建标签呢?(不要用“平均”,你建议用什么作为标签?)
对不起,数据不是我的,我不能分享。
问候
莎拉
如果希望预测分类问题而不是数值,还可以定义一个阈值,然后创建一个标称属性来指定属性是高于还是低于该阈值。例如,如果价值是销售额,那么您可以定义“高价值”交易的阈值,例如1000美元,然后根据该阈值将单个示例分类为高价值或不高价值。但是,您可能需要咨询领域专家的数据,以确定这样的阈值。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
我有一个标签,就像你提到的那样,它很有用,但与平均值非常相似,因为我取了一个平均值属性,或多或少就是我的标签。因此,仍然带来了数据的相关性,结果准确率在95%以上。
无论如何,谢谢你的回答
莎拉