Image title

为什么 AI 项目失败

在考虑启动 AI 项目时,您可能会感到兴奋和担忧。哇,这太神奇了所有的成功案例、销售增长、收入增长…这么多的机会!但另一方面,如果它出错呢?你如何减少在根本不可行的事情上浪费时间和金钱的风险?有这么多的问题,有这么多的希望,和(希望)有一个计划。我们未来是光明的,对吗?文思海辉科技最近发布的白皮书指出,85% 的 AI 项目失败。哎呀。

“但它不会是我” – 你可能会说。它不会,或者它会,现在没有办法告诉。你可以希望最好的,但没有什么可以免除你的战略思维。消息灵通,做好准备,广告。

您可能还喜欢:
我们到了吗?AI 项目中的力向估算

有很多方法可以搞砸

而不是一个单一的理由说它更温和。AI 提供了一些令人敬畏的可能性和大量的事情,您可以做错事。数据策略、业务/技术协调、人为因素,都可能出错,这还不全是。不过,我不是想吓唬你。这是一个怪异的万圣节季节,所以我们将讲述鬼故事——只有AI失败——这样你以后可以更加谨慎和注意。你知道,在它伤害你之前吸取教训。

为什么 AI 项目失败 – 常见问题:大永远不够大

大数据是一个流行语,但它也相当神秘。”大”有多大?您需要多少数据?是的,数据是个问题。不仅仅是因为没有足够的标签——尽管有时有自然的——还因为标签、训练数据等问题。因为 AI 系统只能与它提供的数据一样好,因此如果没有数据,则不能产生任何实际结果。那么数据有什么问题呢?那么,我们从哪里开始…

首先,可能没有足够的。如果您运行的业务规模较小,且数据集有限,您必须与经验丰富的 AI 顾问或数据科学家仔细讨论您的期望和数据集的当前状态。多少数据就足够了?看,这是一个棘手的问题,因为这要视情况而定。这取决于用例、数据类型和预期结果。然而,我们经常可以听到”越多越好”。好像在数据科学项目中,更多的是,周期。

做我,机器人

我们倾向于期望AI系统像我们一样执行智力任务——或者更好。这是一件合理的事,因为我们都知道”AI在越来越多的任务中表现优于人类”。是的。它甚至击败了围棋冠军。然而,我们的头脑比AI系统更灵活。

考虑建议:您在创业活动中遇到一个有趣的人John 喜欢与您交谈,并欣赏您对商业和技术的了解,他要求推荐一本书,以帮助他获得更多有关这些事情的知识。你很快地浏览了你头脑中的所有标题。有书A,B,C,D,E…好的,约翰,我拿到了您应该阅读(在此处插入标题)。你怎么知道你应该向约翰推荐什么?

你的大脑扫描了你迄今为止收集到的信息——约翰知道什么,他和你谈话时对什么感兴趣,他的风格是什么——来评估哪本书最适合他,尽管你不知道他的实际书品味。你有一种感觉,他喜欢它,你可能是对的。

现在,让我们来看看一个”满足”约翰的AI系统。约翰进入一家在线书店的网站,他立即受到畅销书名单的欢迎。没什么有趣的,他不停地点击”下一个”。AI 与 John 没有上下文 – 它处于”冷启动”状态,因为它无法生成个性化建议,因为它没有关于 John 的信息。但约翰点击搜索栏,寻找”启动”。哦,有名单他正在浏览和点击一些标题。在这一点上,AI指出,”初创公司”是约翰喜欢的,并推荐有关这个主题的内容。它不太了解 John,但它使用的数据有关浏览(或购买)书籍”启动”的其他用户喜欢什么。但是,如果没有其他人寻找创业书籍,会发生什么?John 不会获得相关建议,因为系统没有任何数据可以学习。

你和AI最终可能会为约翰推荐不同的书。你们两个都是对的,你们两个都是错的,或者你们中的一个会成为赢家。然而,你的大脑从来没有说”数据不足”——只是临时的。人工智能不能做到这一点。作为AI的”雇主”,我们不能指望它完美地反映人脑的运作和复杂。

我以为标签是通行证*

给人贴上标签——当然。在数据上贴上标签 – 从不。数据不仅必须存在,而且必须加以标记,因此它也有其含义。如果数据组织不当,人类必须把时间花在标记数据这一繁琐的任务上。数据标签是麻烦的,但不知何故,许多公司只是根本不考虑它。在 AWS 博客上发表的一篇文章中,詹妮弗·普伦斯基写道:

房间里有一头大象,即使是一些最精明的科技公司似乎也忽略了或选择忽略——数据标签的问题。

对于许多以监督方式(监督学习)训练的机器学习模型,数据标记至关重要。模型只需要对数据进行标记,否则它们就没有意义了。由于数据标签是个大问题,数据科学家通常选择使用已标记的数据。让我们以图像为例。有多种高质量的图像可供选择,但许多机器视觉项目都依赖于 ImageNet,这是包含大约 1400 万张图像的最大标记图像数据集。此外,每天创建的数据也越来越多。每天约有 50 TB 的数据上传到 Facebook。Facebook并不是唯一的数据源。有了所有数据,我们实际上已经到达了地球上没有足够的人来标记所有数据的点。

有这么多的数据,它不可能是正确的

这也许不对。你可能有这种感觉,你有你需要的所有数据,你只是杀死它!可能有很多数据,但它的数据是否正确?如果您是电子商务,您可能有很多关于您的客户的信息 – 他们的姓名、地址、账单信息,或许还有信用卡信息你知道他们浏览什么。您也知道他们何时与您联系,以及通过什么渠道联系您。

现在,需要什么数据?在解决不同问题时,您将查看不同的信息。因此,当您实施推荐系统时,您可能不需要所有的人口统计数据,但购买历史记录是必须的。但是,当您要预测流失时,将扮演不同的因素。

所以,你可能拥有世界上的所有数据(实际上,这是不可能的),但它是你需要的数据吗?收集所有数据是很有诱惑力的,但没有必要。关键是得到它的权利,而不是收集它的所有,它不是一个可收藏的项目。

算法与正义

2017年,麻省理工学院研究员、算法正义联盟创始人乔伊·博拉姆维尼(JoyBoulamwini)就打击算法偏见进行了TED演讲。她的演示从她对软件的”实验”开始:

“嗨,相机。我有一张脸你能看见我的脸吗?没有眼镜的脸?你可以看到她的脸我的脸呢?我有面具你能看到我的面具吗?

因此,相机不能检测到乔伊的脸。它看到她的同事,它看到一个白色的面具,但不是乔伊的脸。这不是第一次发生。当乔伊是佐治亚理工学院的本科生时,她与社会机器人合作,并负责教它玩游戏。机器人看不见她乔伊”借”了她的室友的脸,让它走。但在香港的一次创业竞赛中,这种情况又发生了。当时,一家初创公司正在展示他们的社交机器人。它使用相同的通用面部识别软件 – 它没有看到乔伊。

怎么会这样?乔伊接着解释道:

“计算机视觉使用机器学习技术进行面部识别。因此,这是如何工作,你创建一个训练集与人脸的例子。这是一张脸。这是一张脸。这不是一张脸。随着时间的推移,你可以教电脑如何识别其他面孔。但是,如果训练集没有真正多样化,任何偏离既定规范的面孔都将更难察觉,这就是我所遭遇的。

但是,你可能会问,这怎么有问题?算法中的偏差传播迅速而广泛,这不仅仅是人脸识别。当然,这是一个极端而危险的例子——由于面部识别错误而误认少数民族可能导致不公平的逮捕,因为美国警方正计划使用这种软件来识别嫌疑人。如果机器出错怎么办?

既然我们在谈论司法系统,我们又提出COMPAS怎么样?我已经在一篇关于信任AI的文章中描述了COMPAS,一种在美国用来通过预测再次犯罪的可能性来指导判决的算法。该算法从历史数据中学习,认定黑人被告的累犯风险较高。

哦,还有臭名昭著的亚马逊AI招聘人员,青睐男性 – 因为大多数劳动力是男性,所以这是合乎逻辑的…

AI 中什么是偏见?

AI 偏见或算法偏见描述了计算机系统中产生不公平结果的系统错误和可重复错误,例如表现出看似性别歧视、种族主义或其他歧视性的特征。虽然这个名字暗示了AI的过错,如上所述,它确实是所有关于人。

卡西·科日尔科夫,谷歌首席决策科学家,偏见通常对您的业务不利。无论您是在研究机器视觉、招聘工具还是其他方法,都会使您的运营不公平、不道德或极端情况下都是非法的。不幸的是,这不是AI的错——这是我们的错。是带有偏见的人,散布成见的人,害怕不同的东西’,但是要发展公平和负责的AI,你必须能够超越你的信仰和观点,并确保你的训练数据集是多样化和公平的。听起来很简单,但并不容易。不过,这是值得的。

AI 实施面临的挑战之一是,高级管理层可能看不到新兴技术的价值,或者可能不愿意对此类技术进行投资。或者,您要使用 AI 扩充的部门并非全部加入。这是可以理解的。AI 仍被视为一项风险业务,是一种昂贵的工具,难以衡量,难以维护。这是一个流行语。但是,使用正确的方法(包括从人工智能可以解决的业务问题开始,并设计数据策略)时,您应该跟踪适当的指标和 ROI,让您的团队为使用系统做好准备,并建立成功和失败标准。

正如您注意到的,我在提到 AI 任务时使用术语”增强”,这是因为 AI 的主要工作是增加人工工作并支持数据驱动的决策,而不是在工作场所取代人工。当然,有些企业的目标是尽可能的自动化,但一般来说,这真的不是AI的一杯茶。它更融入团队合作。此外,还发现AI和人类联合能产生更好的结果。在《哈佛商业评论》的一篇文章中,作者H.詹姆斯·威尔逊和保罗·多尔蒂写道:

在涉及 1,500 家公司的研究中,我们发现,当人和机器协同工作时,公司实现了最显著的性能改进。

但是,作为领导者,您在 AI 项目中的工作是帮助您的员工了解您为什么引入人工智能,以及他们应该如何使用模型提供的见解。没有它,你只是有花哨的,但无用的分析。

为了说明为什么这很重要,我们来看一下CIO杂志描述的示例。一家名为 Cooper 先生的公司为其客户服务引入了一个推荐系统,以为客户问题提供解决方案。系统启动并运行后,公司花了9个月才意识到员工没有使用它,另外6个月才明白原因。事实证明,这些建议并不相关,因为培训数据包括以技术方式描述问题的内部文档,因此模型无法理解客户用他们自己的语言描述的问题,而不是技术术语。

此示例显示了员工了解他们为什么和如何使用 AI 的重要性,以及他们被允许质疑系统的性能和报告问题,以及可靠的培训数据的重要性。

过早故障

在开始之前,您甚至可以使用 AI 失败。是的,真的。当您在拥有所有必要的资源 (即数据、预算、团队和战略) 之前跳槽时,就会发生这种情况因此,我们强调战略方法的重要性:确保您准备好进行人工智能、确定适当的业务用例、概述合适的数据策略以及确定目标。没有这种战略,开始是困难和危险的。

您希望您的 AI 项目(尤其是第一个项目)朝着更大的目标前进,同时也能在前进的道路上取得一些快速胜利。这样,它证明了它的可行性,并减轻了你浪费公司的钱在无用的工具的风险。第一个 AI 项目不应是全公司范围的 AI 实现,而是使整个组织习惯于新常态的概念证明。

随着时间的推移,AI 和您的公司都将增长:您的系统将变得越来越好,您的团队将更加受数据驱动和高效。如果你一步一步地去做,而不是忽视你的目标,那对所有人都是胜利。AI 是一种工具,它可以帮助您实现目标,而不是目标本身。

如何在 AI 中不失败

你不必失败。好消息是,在 AI 中已经失败的众多组织,您可以从他们的错误中吸取教训,避免在公司中做出相同的错误。观察市场是一个很好的做法,不仅在直接竞争中,而且在科技领域。这样,您就会知道您可以现实地期待什么,哪些用例是有希望的,哪些是需要考虑的限制。如果您想了解如何为自己和您的组织准备一个精心策划的 AI 采用,请阅读:在业务中实施 AI 之前必须考虑哪些事项?

进一步阅读

排名前 12 位的 AI 工具、库和平台

简介”项目:包装盒中的机器学习”

Comments are closed.