12个现实世界中的机器学习真相

  • 时间:
  • 浏览:2
  • 来源:大发彩神8官网—大发彩神8快3

8. 一切都比你想象的繁杂

推论:除非迫不得已,或者虽然外理问提。

4. 生活中的或多或少事情,除非亲身经历过,或者永远不必被完整欣赏或理解

6. 把二个 问提转移到别处,甚至是忽略它,都比外理它要容易得多

1. 都要都要工作

11. 每二个 旧的想法总要以不同的名字和不同的形式被再次提出,不管它与是是不是效

12. 达到完美是是不是或者非要什么都要补充的,什么都或者非要什么都要加在的

缓存层次形态或者是固定的,你都要在你这名 前提下工作,网络开销会让分布式训练更快,在向量中非要塞入非要多内容,等等。

2. 无论你怎样才能努力,无论你的优先级是什么,你是是不是能提高光速

你都要问,科学研究和工程研究有什么区别?George A. Hazelrigg 在他的“HONING YOUR PROPOSAL WRITING SKILLS”中写道:

角落案例和长尾失败模式将困扰你。值得庆幸的是,对于或多或少非关键的 ML 部署来说,这并是是不是什么大问提。最坏的具体情况下,它会成为一根绳子 搞笑的推文。或者,或者你在医疗保健或或多或少高风险具体情况下工作,ML 部署将或者成为一场噩梦。

3. 若果有足够的推力,猪就能飞得很高,然而,这虽然一定是二个 好主意

10. 二个 尺码很糙让适合所这么人,你的模型会老是犯令人尴尬的错误,尽管你的出发点是好的

生活中的每件事是是不是非要,现实世界中的机器学习也是非要。唉,让我们让我们 的会议回顾了让我们让我们 对“新颖性”的嗜好,产生了我应该 要的 arxi -spam,其中蕴含了几滴 随后 就不都要所处的垃圾。除非做“科学”也能鼓励宣传什么是有效的,而是是不是什么是新的,或者我不认怎样才能儿 具体情况会改变。

作为 ML 的研究人员和实践者,你都要考虑你拥有的数据的正确模型,而全在等你拥有的模型的正确数据集(就像或多或少研究论文一样)。或者你随后 问过“你这名 模型的正确数据集是什么”,非要你并是是不是在现实世界中。到底什么是真实的世界?在现实世界中,你对要外理的数据是非要挑选的。在这里,数据定义了问提,而是是不是相反。有时,在现实世界中,ML 实践者创建了二个 被委托人的世界作为让我们让我们 的建模游乐场,从而假装让我们让我们 是“科学家”,类式“发明人的故事”某种用于做 NLP 的语言,或者通过繁杂假设来创建封闭的环境来强化学习。什么研究得出了有趣的结果,但它们的范围仅限于它们所来自的世界,即使研究人员喜欢在论文中把它们当作适用于现实世界的东西来兜售。在现实世界中,输入的分布更有或者所处变化,长尾的“curve balls”不知从何而来,你虽然老是有答案。

时延 vs 内存,电池寿命 vs 准确性,公平性 vs 准确性,易于实现 vs 可维护性,……

上个月,我在二个 亲密的让我们让我们 聚会上做了二个 非正式的演讲,我把你这名 题目记下来。这篇文章主什么都写给什么使用机器学习来构造东西的人,而是是不是什么研究机器学习的人,尽管后一组人会很好地倾听什么真理并反省让我们让我们 的工作。

Schimdhuber 或者提出了二个 更大的观点。非要人听他的,像他一样,让我们让我们 把旧酒重新放入新瓶口,被迫重复错误的历史。

0. 你是是不是二个 科学家

端到端学习在理论上听起来是二个 好主意,或者对于大多数部署场景,分段优化的管道架构将继续所处。这虽然是由于让我们让我们 将完整非要端到端系统(语音识别和机器翻译有很好的端到端生产价值外理方案),但在大多数具体情况下,具有可观察的调试路径将胜过或多或少挑选。

与购物时的价格冲击类式,工作中是是不是“努力冲击”。大多数经验富足的研究人员和工程师都经历过“努力冲击”,要么是怎样才能让我们让我们让我们让我们 低估了外理大型数据集的工程问提,要么是怎样才能让我们让我们让我们让我们 低估了正在与之搏斗的领域的繁杂性,要么是怎样才能让我们让我们让我们让我们 低估了对手。大多数论文让读者读起来虽然事情很简单,而忽略了这眼前 是经过了几百万次失败才有的成功。或者,论文是是不是研究,什么都做研究的结果。或者你这名 是由于,你永远或者通过阅读论文来体验做研究的过程。

类式,在语音方面,声学建模是困难的,但在等你都要让网络在外理不同问提(类式语音识别)的方式 中找出什么细节。在 NLP 中,太难进行正确的解析。但值得庆幸的是,对于 99%的现实任务,让我们让我们 都要不进行解析。

9. 你永远总什么都准备缺陷

二个 研究生或大型的超参数扫描器都要在二个 巨大的数据中心中都要找到一组超参数,都要让非常繁杂的模型工作得很好,甚至产生优秀的结果。但非要人在现实世界中调试非要大的模型。我在帮助公司管理让我们让我们 的 ML 团队时发现了二个 秘密 — 大多数人谁能谁能告诉我/不关心超参数调优。

对于既不构建生产 ML 模型什么都维护它们的人来说,机器学习中的或多或少东西是永远无法完整理解的。再多的课件,再多的 mooc,再多的 Kaggling,都无法你都要为此做好准备。非要什么都要替代部署模型、观察用户与模型的交互、外理代码/模型分解等等。

或多或少科学家会学习怎样才能制定研究计划。很少有工程师是博士级别的工程师。你都要们歌词 先试着理解科学研究和工程研究之间的区别。对我来说,区别很明显。科学家力图了解大自然的本质,以了解其根本的本质。为了做到你这名 点,科学家通常剥离无关的影响,深入到二个 非常狭窄的自然元素。这什么都让我们让我们 所说的自然法则:能量和质量是一样的,每二个 作用力是是不是二个 大小相等、方向相反的反作用力,依此类推。有或多或少自然法则,它们随时随地都适用。工程师遵循自然法则。让我们让我们 别无挑选。让我们让我们 的目标是设计出在自然允许的范围内工作的东西。要做到你这名 点,让我们让我们 都要也能预测系统的行为。什么都有工程师们面临的二个 大问提是,让我们让我们 怎样才能理解和预测二个 系统的行为,在你这名 系统中,所有的自然法则在任何随后 都适用于任何地方。这是二个 整合的问提,它就像找到一刚开始的规律一样困难。每时每刻把所有的自然规律都考虑进去是很糙让的。或者,工程师都要找到方式 来挑选什么定律是重要的,什么都要忽略,以及怎样才能近似什么在时间和空间上都很糙要的定律。工程师不仅仅是预测未来。让我们让我们 做出的决定每种是基于让我们让我们 的预测,怎样才能让我们让我们让我们让我们 知道被委托人的预测很糙让既准确又挑选。理解和应用数学也很糙要。这包括概率论、决策理论、博弈论、最优化、控制理论和或多或少数学在工程决策环境中的应用。这也是二个 合理的工程研究领域。

推测:非要多人,很糙是 ML 的新手,被花哨的模型名称冲昏了头脑,迫不及待地我应该 尝试它们,或者写关于它们的博客帖子,等等。我虽然这就像二个 初学写作的人。让我们让我们 认为使用华丽的词语会使让我们让我们 的写作更好,但经验会告诉让我们让我们 或多或少的。

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

是的,虽然让我们让我们 的 title 是“科学家”,包括让我们让我们 所有拥有博士学位的人,以及涉足你这名 行业的学者。或者,机器学习(以及被委托人工智能应用领域,如 NLP、视觉、语音……)是一门工程研究学科(与科学研究相对)。

原文发布时间:2019-12-31

本文作者:Delip

本文来自阿里云云栖号企业公司合作 伙伴“AI公园”,了解相关信息都要关注“AI公园”

当你在现实世界中工作时,十几个 事虽然等你都要面对的,这也是本文的主要内容。但你这名 开场白是必不可少的。或者你在现实世界中做 ML 研究,你是工程师而是是不是科学家。

虽然这听起来很简单,但我很惊讶有十几个 人,不管是新手还是有经验的人,都被或多或少听起来很花哨的名字吸引住了,或者或者或多或少东西来自 DeepMind、OpenAI、斯坦福大学、麻省理工学院等等。或者你的模型虽然非要够在它们的环境和资源约束下外理让我们让我们 的数据集和,非要现实世界将无情地拒绝它。arXiv 上的或多或少结果非要在少数数据集上工作,或者非要在非要谷歌基础设施支持的百兆级 gpu 上工作。帮社区二个 忙,虽然再发布什么一般性的结果了。它都也能工作。这也是怎样才能让我们让我们 今天不考虑在非要卷积神经网络的计算机视觉中做任何事情,或者怎样才能让我们让我们 很容易在序列模型中使用注意力的是由于。它都要也能工作。

7. 你老是要在或多或少事情上做权衡

5. 老是有或者将多个独立的问提聚合成二个 繁杂的相互依赖的外理方案,在大多数具体情况下,这是二个 坏主意

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

这都要和第 8 点结合起来,事实上任何远程调用的成功的模型或者非要适当的计划,都或者或者自身的成功而崩溃。