当大多数人想到人工智能(AI)的日益成熟时,他们倾向于将重点放在算法的改进,计算能力的提高或技术人员的突破上。
尽管这些是取得进展的基础,但经常被遗忘的是需要收集和存储大量数据。如果没有当代数据捕获和存储解决方案,我们将再也见不到Google的AlphaGo击败Go大师Lee Se-dol或Facebook的扑克机器人,成为世界上一些顶级德州扑克玩家中最好的。
数据是推动AI创新的基本资源和实用工具,其进步与有效存储数据的能力密不可分。人工智能在无数应用中的价值及其节省的成本将推动更大的采用率。
根据一项研究,人工智能的发展将为联邦,州和地方政府节省超过400亿美元的劳动力。而且,一旦将其应用于私营行业,我们希望每年节省超过5万亿美元。
这无疑是一个令人兴奋的前景,但是如果行业要按自己的意愿迅速突破,就必须有一种方法来捕获和利用所有这些数据。
诸如Facebook和Google之类的公司处于这种新兴技术的最前沿是有原因的。是的,部分是因为他们有能力吸引最优秀的人才并负担得起最新工具,但最重要的是因为他们的数据集庞大。
Google每年收到惊人的2万亿次搜索,而Facebook每秒从其22亿活跃用户中收集并整理多个数据点。人工智能使用这些数据库来“学习”并找到模式,随着它消化越来越多的数据而变得越来越智能。
就像摩天大楼需要水泥,人的心灵需要书籍一样,人工智能也需要数据才能发挥作用。我们正处于一个临界点,一旦我们开始降低与存储数据相关的成本,我们将看到该技术以惊人的速度发展。
汽车行业是AI形成最相关的例子之一。随着无人驾驶汽车(AVs)开始成为现实,它正在经历着巨大的变化。特斯拉(Tesla)和Google X等公司一直在引领其发展,但是传统的老牌公司也开始对该技术进行大量投资,例如 宝马最近与戴姆勒(Daimler)达成的一项协议, 将其业务推向无人驾驶汽车。
Waymo等无人驾驶车辆每天产生超过11 TB的数据,尽管它们目前仅使用有限容量的AI。数据不足是阻碍进度的原因之一,而不是工程团队本身的问题。
如今,无人驾驶车辆接受了从周围环境中收集目标数据的培训。这是为了节省有限的存储空间,这意味着算法仅收集AV上下文的子集。
这不是训练AI的理想方法。在AV中训练AI的最佳方法与训练人类驾驶的方法相同:全面捕获环境中可用的所有信息。但是,这样做意味着将需要收集存储的数据急剧增加,从每天11 TB增加到每天200 TB。
实际上,这意味着单辆车每年将需要存储73 PB的数据,要在云中存储大约要花费2100万美元。
这对于少数旗舰或概念验证汽车可能是可行的,但无法在数百万辆汽车上扩展。如果我们可以减少与云存储相关的成本,那么我们可以有效地将自动驾驶汽车推向市场。
我们看到AI和机器学习解决方案出现在无数行业中–媒体的后期制作提供了另一个很好的例子。
一旦实施了AI驱动的工具,工作室和制作团队的可能性似乎将变得无限。例如,基于特定场景,说出的单词甚至是字符来搜索整个内容库的能力将是即时的。生产团队将能够在不同的位置实时协作处理内容,从而促进动态的开发过程并使生产过程更加高效。
为了实现实现此目标所需的更快的数据流,该行业正越来越多地从本地存储转移到云。目前,在此空间中的云中存储了5,000 PB,但是到2021年,这一数字预计将增长到130,000 PB。为了促进大量数据的涌入,迁移到云上是不费吹灰之力的。
人工智能具有破坏几乎每个行业的能力和潜力。无论我们讨论的是哪个行业,实现它所需的数据激增以及对更快,更便宜地访问它的需求才是真正的推动力。这就解释了为什么使数据存储民主化的云存储服务对于任何希望在技术上迈出下一步的公司都至关重要。
好消息是,云存储作为一个行业正在爆炸式增长,并且近年来出现了许多解决方案,这些解决方案的成本效益比历史上与之相关的公司更高。像我们这样的专业云存储提供商,正在通过大大降低与存储数据相关的成本来解决可伸缩性问题。
如果我们想专注于算法突破并推动AI领域的创新,我们正在研究数据,数据和更多数据。对于学习如何利用这些数据以便可以对其进行有效捕获和分析的公司而言,迁移到云实际上是唯一可行的选择。对于那些了解这一点的人来说,有很多收获。