探索财经奥秘,指引财富未来

DuckDB承诺通过1.0发布更大的稳定性

Lindsay Clark 2024-06-06 03:35:37

DuckDB的1.

0版本已经成为一个成熟的数据库版本,承诺提供一个新的数据模型和更大的稳定性,以增强向后兼容性.

自2022年9月发布0.5.0版本以来,进程中分析数据库管理系统每月下载超过100万次.

DuckDB联合开发人员兼支持公司DuckDB Labs Hannes Mühleisen告诉注册中心,DuckDB实验室的联合开发人员兼创始人告诉注册中心,1.

0版本更多的是关于稳定性而不是新功能.

首先,有一种新的存储格式.

每次我们发布DuckDB…的主要版本时您必须将数据重新加载到系统中,因为格式将以不兼容的方式更改,因为我们已经进行了大量更改.

但现在,我们保证了与存储格式的向后兼容性和有限的向前兼容性,这意味着如果您将数据写入DuckDB数据库格式,现在,您仍然可以在10年后读取该文件.

他说,这是一个很大的变化.

他说,新的文件格式填补了市场上的一个利基市场,因为用户可以在一个文件中创建多个表,并对这些文件进行高效和压缩的事务更新.

DuckDB诞生于阿姆斯特丹的Centrum Wiskunde&Informatica数学和理论计算研究中心,Mühleisen是该中心的一名教授.

该数据库嵌入到主机进程中,不需要安装、更新或维护DBMS服务器软件.

例如,DuckDB Python包可以在不导入或复制数据的情况下直接对Python软件库Pandas中的数据运行查询.

DuckDB是用C 编写的,在麻省理工学院的许可下是免费和开源的.

前Google BigQuery工程师Jordan Tigani指出,DuckDB逆着基于云的横向扩展数据仓库的趋势,并利用了更强大的笔记本电脑.

他是这样一个粉丝,他与人共同创立了MotherDuck,一家为DuckDB提供后端扩展的公司.

另一方面,Amalgam Insights的首席执行官兼首席分析师Hyoun Park表示,他认为DuckDB是一匹独一无二的小马,其诀窍是用有限的资源进行高性能分析和文件转换.

他说:“文件转换功能对于将拼花或其他非结构化格式的非结构化数据转换为内存数据库中的性能很有用.

此外,该数据库还可用于在边缘环境或远程环境中进行高性能分析,这将越来越有助于分流分析处理,“他说.

Park告诉我们,DuckDB也非常易于部署和支持.

Mühleisen表示,第三方技术公司正在根据麻省理工学院的许可采用DuckDB,以及越来越多的单一使用案例,”数据科学家在他们的笔记本电脑上“.

他说,例如,DuckDB实验室正在与FiveTran合作,帮助其在其ApacheIceberg表格格式实现中使用数据库.

“这在一开始是不存在的--人们只需要抓取DuckDB并将其作为组件放入他们的管道中-但这真的是非常强劲的增长,”Mühleisen说.

协作分析公司Coginiti的首席技术官Matthew Mullins说:“作为工具建造者,我们对DuckDB与Apache Arrow社区的密切合作感到最兴奋,因为它使我们能够构建利用列式数据格式的新一代高性能数据分析工具.

这种集成不仅提高了性能,还简化了数据交换过程,实现了更高效、更可扩展的数据操作.

用户喜欢它更友好的SQL.

它已成为最受欢迎的有效处理CSV和拼图文件,无论它们驻留在哪里.

此外,直接连接到PostgreSQL和MySQL数据库进行零ETL分析的能力简化了数据工作流程,降低了移动数据的成本.卢金斯.Mühleisen表示,该团队希望开发一个平台,让人们可以上传、共享和下载DuckDB插件以实现连接,或支持新的纯量函数或索引类型. .