

近年来,随着订阅服务逐渐占据主导地位,各家公司越来越意识到有必要弄清楚哪些客户会流失。机器学习,凭借其处理大量数据的能力和提取人类大脑不明显的洞见的能力,一直是帮助预测客户流失的首选工具。
问题解决了!未来就是现在,人工智能已经解决了我们所有的问题!
等等,你说没那么简单是什么意思?
实际上,识别和预防客户流失比乍看之下要困难得多。在这篇文章中,我将分解组织在开始使用机器学习进行流失时遇到的四个最常见的挑战,以及如何解决它们,以确保通过流失预测工作产生真正的业务价值。
为什么价值对机器学习至关重要
在RapidMiner,我们经常谈论机器学习和分析的价值。除非数据科学的工作能够证明其真正的价值并乐鱼平台进入对组织的底线产生影响,否则它对业务是没有好处的。
因此,当我们考虑使用机器学习来解决商业问题时,我们总是希望把它与它所产生的价值联系起来。事实上,我们甚至写了一份白皮书讨论价值-关于如何计算机器学习模型在客户分析领域的价值。如果你通读了这篇指南,你很快就会明白为什么流动率是一个如此有趣的用例:它与来自客户的收入成正比,从而与公司的总收入成正比。
如果流失是如此有趣,并且是如此常见的用例,为什么我们不在《Talking Value》中使用它作为例子呢?因为用户流失率有一些额外的复杂性,这使得我们很难将其简化为一个通用的例子——这也是我们写这篇博文的原因。把这篇文章看作是《谈话价值》的一个附录;阅读白皮书和这篇博客文章将帮助您理解如何使用白皮书中的思想来解决客户流失,而不会成为最常见挑战的受害者。
流失建模的四大挑战
当企业开始考虑预测客户流失以及如何解决这些问题时,他们会遇到以下四大挑战。
挑战1:睡眠者
用户流失检测和预防的第一个常见问题是,企业从长期使用您的服务的用户那里获得了非常有利可图的合同——他们注册后从未寻找过其他选择。这些人通常被称为睡眠如果你开始联系他们,你可能会吵醒一只睡着的狮子。主动联系可能会促使这些沉睡者转向竞争对手,甚至取消他们与你的会员关系。
从机器学习的角度来看,我们认为这是假阳性的成本:给一个忠诚的客户贴上可能流失的标签会带来什么成本?如果你联系他们,有多少潜伏者会离开?
在许多企业中,忠实客户的数量远远高于搅动者的数量,因此假阳性的成本可能也很高——你要冒着吵醒许多“正在沉睡”的忠实用户的风险,他们本来不会取消订阅,但现在会取消,因为你提醒了他们。
解决方案:做一个价值评估。你可以使用《Talking Value》中的材料作为指导,但从本质上来说,你想要尝试并计算出如果你用折扣来叫醒他们,有多少假阳性会离开。这样,你就可以把损失的收入考虑到你的价值计算中,来决定是否值得唤醒这些客户。
如果这看起来很难弄清楚,你没有错。事实上,这让我们面临下一个流失挑战。
挑战2:用户流失可能无法从数据中预测
流失通常是一个多方面的问题。没有一个单一的原因可以解释为什么所有的人都决定离开;相反,人们取消订阅的动机是多种多样的。这可能是所有的事情,从转移到竞争对手的产品到削减账单。根据你所拥有的数据,你可能无法检测到用户流失的特定模式或动机。
让我们以我的手机合同为例。当我还是学生的时候,我选择了低成本的预付费计划。网络质量不是很好,也不包括漫游功能,但很便宜,这正是我当时需要的。
当我进入商业生活后,我的需求增加了,因为我有能力支付更昂贵的计划。作为一个经常去美国旅行的欧洲人,我需要漫游,我很容易负担得起更好的网络质量。
所以我放弃学生时代购买的保险的原因是我的生活发生了改变。我的移动运营商怎么可能从他的数据中知道这一点?也许他们就是做不到?如果你的数据中没有模式,你可以不去预测它。
解决方案:在你开始之前和你的领域专家谈谈。你不是第一个思考用户流失问题的人。和往常一样,您希望包括领域专家,甚至允许他们自己研究可能的ML解决方案,以便弄清楚您可以和可能不能从您拥有的数据中预测什么。
挑战3:部署通常需要人类的信任
处理数据的人常常忘记了业务中的人的组成部分。在开始用户流失检测项目之前,你应该问自己如何使用用户流失评分。它会触发自动邮件或短信吗?这些信息会被用来通知本地代理采取行动吗?
要求其他人根据您的模型采取行动需要一些超出您的数据和控制能力的东西:人类信任。如果您的分数不被认真对待,或者如果人类对特定的数据点吹毛求疵,而不是信任模型,那么您的模型将永远不会成功。
解决方案:你有两个选择。第一个是通过告诉最终用户模型能做什么和不能做什么,以及您为什么信任它们,从而使他们能够使用。你有效地将他们转变为数据公民,他们信任你不是因为他们必须信任你,而是因为他们想信任你。事实上,你甚至可以教给他们足够的知识,让他们开始为自己的工作建立一些模型。
另一个有帮助的选择是可解释的AI。您可以使用像LIME或SHAP这样的算法,不仅给出一个预测,而且给出算法为什么会做出这样的决定的原因。这增加了人们对模型预测的信任。我在这里要小心一点,因为如果这些算法给出的推理与人们预期的相反,这也可能适得其反。尽管如此,这可能是让您的模型得到认可的一个很好的步骤。
挑战4:预测流失不是问题所在
这可能是最重要的一点,这也是为什么我把它放在最后。你并不想预测用户流失率。你要做的是防止生产通过这种方式,你得到了比你什么都不做时更多的收益。
假设,当我终止手机合同时,我的供应商有一个100%正确的指标来判断我即将流失。他们可以给我打电话,发邮件告诉我他们想要的所有折扣。问题是,我对折扣!我需要一个好的商业计划,而不是一个便宜的、打折的计划。在这种情况下,很明显提供商没有一个好的“下一最佳行动”模型来采取适当的行动来挽救客户。
他们应该做的是为我提供其他更适合我需求的计划,也许还包括对现有客户的小额折扣。这将为我留下提供更多的动力增加公司每个月从我这里获得的收入,而不是完全失去。
解决方案:最好的流失模型不只是预测谁会流失,而且还规定了尝试和防止流失的行动。因为只有防止了流失才能产生价值。
这里有两个选择。首先,你可以建立单独的模型来预测不同的流失原因,比如“价格太高”和“服务不好”模型。然后,您可以使用不同模型的业务规则来提供有针对性的报价。第二种方法是使用两个模型。一个预测流失,另一个预测或规定下一个最佳行动,即,最能减少流失可能性的行动。这将是一个转换模型。
所以,流失是一个糟糕的用例?
不!正如我们在一开始所说的,随着越来越多的企业转向基于订阅的收入模式,能够预测并防止流失可能是最具影响力的机器学习用例之一。
但为了产生这种影响,你需要确保你的流失预测和预防是正确的。这意味着:
- 权衡叫醒睡眠者的成本和收益
- 确保你可以从数据中预测流失
- 从参与过程的其他人那里获得支持
- 为潜在的搅局者提供正确的挽留动机
在这些要点上加上关键的信息讨论价值-你需要理解你将要采取的任何行动对收入的影响,包括假报这样的事情——你已经准备好使用机器学习来建立一个流失模型,它不仅可以预测人们何时会流失,还可以为你提供适当的行动来帮助他们留住客户。
准备好开始证明你的机器学习项目的价值了吗?我们的白皮书,讨论价值,涵盖了如何获得购买在四个简单的步骤!