通过本章学习,你需要掌握和了解以下问题:
1. 大数据的优点;
2. 大数据带来的问题;
3. 绿色人工智能的概念;
4. 绿色人工智能的发展前景。
什么是大数据?
所谓“大数据(big data)”,乃是指在利用常规软件工具的前提下无法在可承受的时间内捕捉、管理和处理的数据集合。而所谓“大数据技术”,自然就是指那些利用非常规的软件工具对上述数据集合进行捕捉、管理与处理的技术。
与传统的统计学技术相比,“大数据技术”的特点便在于:研究者不对研究对象进行随机抽样以获取相对可控的样本空间,而是直接将全部研究对象都作为样本空间。在他们看来,之所以这样做乃是可能的,乃是因为计算机科学在硬件方面的突飞猛进式的进展,已为大数据的存储与计算提供了极大的便利;而之所以这样做同时又是必要的,则是因为数据科学家发现:在算法不变的情况下,数据量本身的增长就足以大大提高预测的准确度了。同时,互联网的广泛使用所导致的海量数据的出现,也使得“大数据分析机器”的运作所需要的“弹药”似永无枯竭之可能。
面对传统人工智能,大数据技术的拥趸者何来自信?
如果将概而言之,作为大数据技术的潜在竞争对象,传统人工智能技术的核心关涉乃在于:如何通过对于人类认知架构或思维进程的算法化抽象来模拟人类智能,以图解决人类在生产实践中所出现的种种技术问题。至于为何人工智能的研究要以“人类的认知架构或思维进程”为参考对象,则是基于下面这番素朴的哲学见解:既然人类智能乃是我们迄今为止所知道的关于“智能”的最佳体现者,那么,本着“见贤思齐”的原则,人工的智能系统就应当至少“在某些方面”与人类智能具有相似性。
而在大数据技术的拥趸者看来,人工智能的上述解题思路看似合理,实则过于“昂贵”。
简言之,很多人工智能技术所能够做的事情,大数据技术也能够做,而且似乎做得更快,更好,也更少耗资源(无论是在人力方面还是在时间方面)。两相比较,大数据技术的确大有“胜出”之势。
但是,从更深的角度看,这种“胜出”只是一种假象。从上面的分析不难看出,对于互联网的利用乃是大数据技术得以成功的秘诀——而这种所说的“互联网”不仅仅包括网络本身,而且也包括广大网络用户的自身的智力投入(如对于字迹的辨认工作以及对于外语的翻译工作,等等)。这也就是说,大数据技术是通过互联网这一管道大肆“剥削”了既已存在的人类智能,借以在与传统人工智能的竞争中占据先机的。换句话说,这种“胜利”其实是带有很大的水分的。