

当涉及到数据科学时,它不是关于你学乐鱼平台进入到什么。这是关于你能够用你所学到的东西建立什么。
领域的乐鱼平台进入一直在快速增长,特别是在最近几年。我们看到令人兴奋的新工具和方法一直在出现。虽然这些都很好,但我觉得这些也会引起一些困惑。为什么?因为它们让数据专业人员思考错误的问题。
问错误的问题
问错误的问题是什么意思?
错误的问题有:
- 有哪些最酷的新工具值得尝试?
- 当今最令人兴奋的数据科学问题是什么?乐鱼平台进入
- 我们如何将这些应用到我们的业务中(进行试验)?
相反,我们想问更好的问题,比如:
- 我们现在有什么业务问题(或机会)?
- 数据如何帮助解决这个问题?
- 我们的数据项目为什么以及如何对公司有用?
- 我应该学习什么来开始建立它?
在数据科学领域乐鱼平台进入,每当新的机器学习算法发布时,都会有大量关于新工具的宣传。或者有新的基于云的解决方案可用。或者为这种或那种编程语言实现一个新的模块。等等。
但这些新工具难道不重要吗?嗯,是的,但是……
工具很重要,但要注意一点
让我们考虑一个来自cook的例子。没有勺子就不能煮汤。但喝汤的时候,很少有人会说:“嗯,你的木勺很不错。”相反,大多数人会说:“好吃,这食物真好吃!”
那是因为,在一天结束的时候,工具只是工具。你必须学会如何使用它们……
但这不是完整的句子。而:
你必须学会如何使用它们所以你可以用它们建造有用的东西……
这还不是全部。
你必须学会如何使用它们,这样你才能用它们构建有用的东西这将对你的业务底线产生积极的影响。
也许写下来听起来很明显。如果是你,那就太好了。但我看到许多数据专业人士选择专注于花哨的数据科学解决方案,而不是他们实际需要的数据科学解决方案。乐鱼平台进入然后他们就碰壁了。
不受欢迎的观点:大多数数据科学家不需要了解深度学习
让我举一个例子:深度学习.
我管理着一个乐鱼平台进入数据科学博客我在那里为有抱负的数据科学家发布教程,主题包括Python的基本知识或者SQL的基础知识,等等。
每周都有人问我这个问题:“你们什么时候出版深度学习的教程?”
答案总是一样的:从来没有.
好吧,我必须承认,我曾想过快速起草一篇关于这个主题的介绍性文章,但它之所以吸引人只有一个原因:我知道我的文章会获得很多点击。
大多数人想了解深度学习只是因为它很受欢迎。为什么它受欢迎?因为它被用于很酷的东西,比如自动驾驶汽车特斯拉因此,它得到了媒体的大量关注。这让人们感到兴奋,突然之间,每个人都想在自己的项目中应用深度学习。
但(至少在我看来)情况并非如此!一个乐鱼平台进入数据科学项目应该总是从定义您想要解决的问题开始。一旦你有了这些,你就可以选择最好的工具来完成工作!
赤裸裸的现实是,在大多数乐鱼平台进入数据科学项目,对更传统的工具的需求要高得多,比如:
- 描述性分析和报告
- 数据清理和数据整理
- 自动化流程
- 简单的预测和预测
- 简单的分类方法
我知道,一开始,这些听起来没有深度学习那么酷,但相信我,当你在做一个真正的项目时,它们同样令人兴奋(如果不是更令人兴奋的话)!为什么?因为它们能更快地为你提供有用的信息,而不是用深度学习等复杂的方法来解决一个项目。
数据科学家工作的现实
别误会我的意思!我对深度学习并不生气——对深度学习教程也不生气……(也许只是对它现在有点被过度炒作的事实生气)。我选择它作为一个随机的例子,只是为了演示我关于选择和学习正确工具的一般观点。
说实话:就其本身而言,我也觉得深度学习很吸引人,我知道它有很多潜力。我希望当我遇到一个真正需要使用它的项目时,我将有机会更多地了解它。
事实上,这就是我的观点!
我坚信——至少在数据科学中——正确的方法是:乐鱼平台进入当你需要用一种工具构建有用的东西时,就学习它。而不是像很多人那样相反:“我学习这个工具是因为它很花哨,现在我知道了它,我也会找一个项目在现实生活中使用它。”
我们不要再讨论深度学习了。我可以列举更多的例子工具不如结果重要:
- 作为一个电影流媒体公司的数据科学家,没有人会在意你是否知道所有的特征sklearn的RandomForestClassifier.他们会关心你是否能为用户列出最好的电影推荐。
- 作为小型电子商务商店的数据科学家,没有人会关心您在SQL脚本中是使用join还是子查询(或两者都使用)。他们会关心你是否能在明年的营销活动中找到一件他们应该做得不同的大事来吸引更多的顾客。
- 作为金融科技初创公司的数据科学家,没有人会在意你是否使用numpy、pandas等。他们会关心你是否能实时发现信用卡欺诈。
等等……
那么接下来要学什么呢?
如果您正在阅读本文,那么您很有可能已经了解并在日常工作中使用了一些数据工具。太好了!
问题是你下一步应该学什么以及为什么学。当我遇到这个问题时,我遵循以下4步简单的计划:
- 定义业务问题!你想要达到什么目的?为什么它很重要?为什么它有用?等等)。
- 你能用现在使用的工具完成这项工作吗?如果没有,为什么?缺失的是什么?(性能?特征吗?与其他工具集成?等等)。
- 如果您需要学习一个新的工具,选择一个可以填补您当前工具集空白的工具并学习它。
- 在选择一个新工具时,选择一个最能产生价值的工具。不要只专注于一个问题,要考虑业务中出现的其他类型的问题,以及新工具如何帮助您解决这些问题。
一个例子
如果你使用Excel,但它不能处理你的数据大小,也许你应该考虑学习和使用SQL。它是同样的二维数据库系统,只是为更大的数据集设计。
如果您在数据科学项目中使用Java,但原型设计阶段乐鱼平台进入变得非常缓慢(因为工程时间)和混乱(因为不同团队成员的不同技能),那么也许您应该尝试像RapidMiner这样的工具,它优先考虑协作和多样化的团队。
等等等等。
结论
我希望我在这篇文章中能够足够清楚地阐明我的观点。关于数据科学中的许多工具的宣传铺天盖地,但数据科学家应该更清楚,不要上当受骗乐鱼平台进入!你不应该仅仅为了学习花哨的东西而去学习它们;你应该学习你需要用到的东西。
换句话说,当涉及到数据科学时:学习东西,这样你就可以构建东西。乐鱼平台进入
除了工具之外,任何成功的数据科学策略的关键部分都是强大的团队。乐鱼平台进入下载一份构建完美的AI团队今天就开始学习如何组装你的!
这篇博客是由Tomi Mester的嘉宾撰写的data36.com.Tomi Mester自2012年以来一直是一名执业数据分析师和研究员。他曾在Prezi、iZettle和几家较小的公司担任分析师/顾问。他是Data36博客的作者,每周在该博客上撰写关于数据科学、编码、统计等方面的文章和教程。乐鱼平台进入