数据库的未来发展前景怎么样?
除了存储的数据量和速度明显增大之外,数据库在应用程序中的使用方式以及它们所部署的硬件类型也将发生重大变化。在未来的50年里,就像之前一样,我们将看到数据库领域的重大变化。很难预测该领域的主要范式转变是什么,预测哪些数据库公司和产品仍然可用也是不现实的。
将来会有越来越多的应用程序更自然地将数据存储在数组或矩阵中。这是因为组织需要分析大量的非结构化信息,尤其是视频。我们将掌握将所有非结构化数据转换成半结构化格式的能力,这种格式在DBMS中更容易组织和索引。作为其中的一部分,时效性也将变得重要,因为它关系到信息如何随时间的变化。目前的系统无法解释这一点,因为在一个时间序列中存储提取的每个视频帧的信息的开销很大。
对于新的硬件,更灵活和可编程的制程将更普遍。DBMS将把程序的关键部分(例如锁管理器)编译到一个硬件加速器中。我们还将看到易失性和非易失性内存之间的二分法的消失。DBMS将假定所有内存都是快速和持久的,不需要维护变化无常的缓存。这种新存储器将比今天可用的存储器大几个数量级。因此,DBMS将在预先计算的物化视图中存储其数据的多个副本,以便快速响应任何可能的查询。
数据库管理员的角色将不复存在。这些未来的系统太复杂了,人类无法推理。DBMS最终将完全自治和自修复。同样,编程框架和DBMS之间的紧密耦合将支持系统在组织数据、提供资源和优化执行方面做出比人工生成计划更好的决策。我们将看到星际设备(如太空探测器)数据库事务的增长。在这种情况下,在这些容器上运行的DBMS彼此之间的距离将比在地球上运行的系统要远得多,并且会导致明显较长的延迟(即延迟时间,分钟或小时)。这意味着在今天基于web的应用程序中使用的弱一致性技术和实践将被应用到这些星际系统中。
关系模型仍将主导大多数应用程序,但开发人员将不再需要过于担心其应用程序使用的数据模型。编程框架和DBMS之间的耦合将更加紧密,这样所有的数据库交互都将是透明的(并且是最佳的)。同样,SQL(或它的某种方言)将仍然是与DBMS交互的实际语言,但人类真实上永远不会编写SQL。相反,他们会用自然语言询问有关数据的问题。这些变化将导致我们编写程序的方式发生重大转变;开发人员以一种最容易被人类理解的方式对其数据进行建模,然后框架(与DBMS一起)将自动为其生成最佳存储方案。所有程序都将使用强一致的ACID事务执行。也就是说,在当今基于Web的应用程序中使用的最终一致性方法将避免增加管理的复杂性。在网络通信、并发控制和资源管理方面将会有重大的改进,这将使用ACID事务变得更好并具有可伸缩性。
无处不在的“物联网”将意味着每台设备都能够收集有关其环境的数据。这将包括从小型嵌入式传感器到大型自主机器人。小型设备将使用片上DBMS,就像手机现在包含片上视频解码器一样。所有这些系统的数据库将完全可以通过一些标准API(可能是SQL)进行组合和简易的联合。这意味着DBMS将以零配置彼此通信。你只需将两个DBMS相互指向对方,它们就会立即传递它们的信息,并确保它们是同步的。某些管理器服务将能够根据需要跨设备分发查询执行。人们将不需要手动配置提取-转换-加载实用程序或其他工具来保持不同系统上的数据一致。以这种方式使所有不同的DBMS可组合和可互操作将是一项重要的工程工作。因此,将会有一个使用人工智能或机器学习的工具包来自动地将不同的DBMS变体映射到彼此以进行相同的操作。