如何填写缺失的值,基于我的数据集中的其他记录?
最佳答案
-
MarcoBarradas
管理员,员工,RapidMiner认证分析师,会员职位:263
独角兽
嗨@sebasvog您可以通过使用替换缺失值(系列)操作符来完成,因为您正在处理日期。如我的示例中所示,将替换类型date time配置为选项next值。
您还可以使用Order和您感兴趣的日期创建一个数据集,然后将它们与原始数据集连接起来
- 选择属性:顺序和日期
- 过滤器示例:不遗漏您想要的日期
- 删除重复:以防万一你有一些
- Join:通过Order Id连接上一个数据集
<?xml version="1.0" encoding="UTF-8"?><进程版本="9.7.002">
<参数key="logverbosity" value="init"/> <参数key="random_seed" value="2001"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="30"/> <参数key="encoding" value="SYSTEM"/> <进程expanded="true"> <参数key="keep_old_attribute" value="false"/> class="time_series:replace_missing_values" compatibility="9.8.000-SNAPSHOT" expanded="true" height="68" name="Replace Missing Values (Series)" width="90" x="581" y="85"> <参数key="attribute_filter_type" value="single"/> <参数key="attribute" value="Date"/> <参数key="attributes" value="" "/> <参数key="use_except_expression" value="false"/> <参数key="value_type"Value ="attribute_value"/><参数key="keep_old_attribute" value="false"/>
5

新手
