BuntDB是一个用纯Go语言编写的低级内存键值存储。它能持久化到磁盘，符合ACID原则，并使用锁机制支持多个读取器和单个写入器。它支持自定义索引和地理空间数据。对于需要可靠数据库并且偏好速度而非数据大小的项目来说，它是理想的选择。

特性

内存数据库，实现快速读写
可嵌入，具有简单的API
支持多达20个维度的空间索引；适用于地理空间数据
索引JSON文档内的字段
使用可选的collate包实现国际化排序索引
为任何数据类型创建自定义索引
支持多值索引；类似于SQL的多列索引
内置类型易于上手使用；包括String、Uint、Int、Float
灵活的数据迭代方式；支持升序、降序和范围查询
使用仅追加文件格式实现持久化
可选的通过过期时间TTL淘汰旧项
符合ACID语义的带锁事务，支持回滚

入门

安装

要开始使用BuntDB，请安装Go并运行go get：

$ go get -u github.com/tidwall/buntdb

这将获取该库。

打开数据库

BuntDB的主要对象是DB。要打开或创建数据库，使用buntdb.Open()函数：

package main

import (
	"log"

	"github.com/tidwall/buntdb"
)

func main() {
	// 打开data.db文件。如果不存在则创建。
	db, err := buntdb.Open("data.db")
	if err != nil {
		log.Fatal(err)
	}
	defer db.Close()

	...
}

也可以通过使用:memory:作为文件路径来打开一个不会持久化到磁盘的数据库。

buntdb.Open(":memory:") // 打开一个不会持久化到磁盘的文件。

事务

所有读写操作都必须在事务内进行。BuntDB一次只能打开一个写事务，但可以同时有多个并发的读事务。每个事务都维护一个稳定的数据库视图。换句话说，一旦事务开始，该事务的数据就不能被其他事务更改。

事务在一个暴露Tx对象的函数中运行，该对象代表事务状态。在事务内部，所有数据库操作都应该使用这个对象执行。在事务内部时，你不应该访问原始的DB对象。这样做可能会产生副作用，比如阻塞你的应用程序。

当事务失败时，它会回滚，并撤销在该事务期间对数据库所做的所有更改。有一个单一的返回值可用于关闭事务。对于读写事务，以这种方式返回错误将强制事务回滚。当读写事务成功时，所有更改都会持久化到磁盘。

只读事务

当你不需要对数据进行更改时，应该使用只读事务。只读事务的优点是可以有多个并发运行。

err := db.View(func(tx *buntdb.Tx) error {
	...
	return nil
})

读写事务

当你需要对数据进行更改时，应该使用读写事务。一次只能有一个读写事务运行。所以确保在完成后尽快关闭它。

err := db.Update(func(tx *buntdb.Tx) error {
	...
	return nil
})

设置和获取键值对

要设置一个值，你必须打开一个读写事务：

err := db.Update(func(tx *buntdb.Tx) error {
	_, _, err := tx.Set("mykey", "myvalue", nil)
	return err
})

要获取值：

err := db.View(func(tx *buntdb.Tx) error {
	val, err := tx.Get("mykey")
	if err != nil{
		return err
	}
	fmt.Printf("值为 %s\n", val)
	return nil
})

获取不存在的值将导致ErrNotFound错误。

迭代

数据库中的所有键值对都按键排序。要迭代键：

err := db.View(func(tx *buntdb.Tx) error {
	err := tx.Ascend("", func(key, value string) bool {
		fmt.Printf("键: %s, 值: %s\n", key, value)
		return true // 继续迭代
	})
	return err
})

还有AscendGreaterOrEqual、AscendLessThan、AscendRange、AscendEqual、Descend、DescendLessOrEqual、DescendGreaterThan、DescendRange和DescendEqual。请查看文档以获取有关这些函数的更多信息。

自定义索引

最初，所有数据都存储在一个B树中，每个项目有一个键和一个值。所有这些项目都按键排序。这对于快速从键获取值或迭代键很有用。欢迎浏览B树实现。

你还可以创建自定义索引，允许对值进行排序和迭代。自定义索引也使用B树，但它更灵活，因为它允许自定义排序。

例如，假设你想创建一个用于排序名字的索引：

db.CreateIndex("names", "*", buntdb.IndexString)

这将创建一个名为names的索引，用于存储和排序所有值。第二个参数是用于过滤键的模式。*通配符参数表示我们想接受所有键。IndexString是一个内置函数，对值执行不区分大小写的排序。

现在你可以添加各种名字：

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("user:0:name", "tom", nil)
	tx.Set("user:1:name", "Randi", nil)
	tx.Set("user:2:name", "jane", nil)
	tx.Set("user:4:name", "Janet", nil)
	tx.Set("user:5:name", "Paula", nil)
	tx.Set("user:6:name", "peter", nil)
	tx.Set("user:7:name", "Terri", nil)
	return nil
})

最后你可以迭代索引：

db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("names", func(key, val string) bool {
	fmt.Printf(buf, "%s %s\n", key, val)
		return true
	})
	return nil
})

输出应该是：

user:2:name jane
user:4:name Janet
user:5:name Paula
user:6:name peter
user:1:name Randi
user:7:name Terri
user:0:name tom

模式参数可以用来过滤键，像这样：

db.CreateIndex("names", "user:*", buntdb.IndexString)

现在只有键前缀为user:的项目会被添加到names索引中。

内置类型

除了IndexString，还有IndexInt、IndexUint和IndexFloat。这些是用于索引的内置类型。你可以选择使用这些或创建自己的类型。

所以要创建一个按年龄键数字排序的索引，我们可以使用：

db.CreateIndex("ages", "user:*:age", buntdb.IndexInt)

然后添加值：

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("user:0:age", "35", nil)
	tx.Set("user:1:age", "49", nil)
	tx.Set("user:2:age", "13", nil)
	tx.Set("user:4:age", "63", nil)
	tx.Set("user:5:age", "8", nil)
	tx.Set("user:6:age", "3", nil)
	tx.Set("user:7:age", "16", nil)
	return nil
})

db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("ages", func(key, val string) bool {
	fmt.Printf(buf, "%s %s\n", key, val)
		return true
	})
	return nil
})

输出应该是：

user:6:age 3
user:5:age 8
user:2:age 13
user:7:age 16
user:0:age 35
user:1:age 49
user:4:age 63

空间索引

BuntDB通过在R树中存储矩形来支持空间索引。R树的组织方式类似于B树，两者都是平衡树。但是，R树特别之处在于它可以操作多维数据。这对于地理空间应用非常有用。

要创建空间索引，请使用CreateSpatialIndex函数：

db.CreateSpatialIndex("fleet", "fleet:*:pos", buntdb.IndexRect)

然后IndexRect是一个内置函数，它将矩形字符串转换为R树可以使用的格式。这个函数开箱即用很容易使用，但你可能会发现创建一个从不同格式渲染的自定义函数更好，比如Well-known text或GeoJSON。

要向fleet索引添加一些经纬度点：

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("fleet:0:pos", "[-115.567 33.532]", nil)
	tx.Set("fleet:1:pos", "[-116.671 35.735]", nil)
	tx.Set("fleet:2:pos", "[-113.902 31.234]", nil)
	return nil
})

然后你可以在索引上运行Intersects函数:

db.View(func(tx *buntdb.Tx) error {
	tx.Intersects("fleet", "[-117 30],[-112 36]", func(key, val string) bool {
		...
		return true
	})
	return nil
})

这将获取所有三个位置。

k-最近邻

使用Nearby函数按照从近到远的顺序获取所有位置:

db.View(func(tx *buntdb.Tx) error {
	tx.Nearby("fleet", "[-113 33]", func(key, val string, dist float64) bool {
		...
		return true
	})
	return nil
})

空间括号语法

括号语法[-117 30],[-112 36]是BuntDB独有的,用于处理内置的矩形。但你不局限于这种语法。在CreateSpatialIndex期间你选择使用的任何Rect函数都将用于处理参数,在这种情况下是IndexRect。

2D矩形: [10 15],[20 25] 最小XY: "10x15", 最大XY: "20x25"
3D矩形: [10 15 12],[20 25 18] 最小XYZ: "10x15x12", 最大XYZ: "20x25x18"
2D点: [10 15] XY: "10x15"
经纬度点: [-112.2693 33.5123] 纬度经度: "33.5123 -112.2693"
经纬度边界框: [-112.26 33.51],[-112.18 33.67] 最小纬度经度: "33.51 -112.26", 最大纬度经度: "33.67 -112.18"

注意: 经度是Y轴且在左侧,纬度是X轴且在右侧。

你也可以用-inf和+inf表示无穷大。例如,你可能有以下点([X Y M]其中XY是一个点,M是时间戳):

[3 9 1]
[3 8 2]
[4 8 3]
[4 7 4]
[5 7 5]
[5 6 6]

然后你可以通过调用Intersects来搜索所有M在2-4之间的点。

tx.Intersects("points", "[-inf -inf 2],[+inf +inf 4]", func(key, val string) bool {
	println(val)
	return true
})

这将返回:

[3 8 2]
[4 8 3]
[4 7 4]

JSON 索引

可以在JSON文档中的单个字段上创建索引。BuntDB在底层使用GJSON。

例如:

package main

import (
	"fmt"

	"github.com/tidwall/buntdb"
)

func main() {
	db, _ := buntdb.Open(":memory:")
	db.CreateIndex("last_name", "*", buntdb.IndexJSON("name.last"))
	db.CreateIndex("age", "*", buntdb.IndexJSON("age"))
	db.Update(func(tx *buntdb.Tx) error {
		tx.Set("1", `{"name":{"first":"Tom","last":"Johnson"},"age":38}`, nil)
		tx.Set("2", `{"name":{"first":"Janet","last":"Prichard"},"age":47}`, nil)
		tx.Set("3", `{"name":{"first":"Carol","last":"Anderson"},"age":52}`, nil)
		tx.Set("4", `{"name":{"first":"Alan","last":"Cooper"},"age":28}`, nil)
		return nil
	})
	db.View(func(tx *buntdb.Tx) error {
		fmt.Println("按姓氏排序")
		tx.Ascend("last_name", func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		fmt.Println("按年龄排序")
		tx.Ascend("age", func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		fmt.Println("按30-50岁年龄范围排序")
		tx.AscendRange("age", `{"age":30}`, `{"age":50}`, func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		return nil
	})
}

结果:

按姓氏排序
3: {"name":{"first":"Carol","last":"Anderson"},"age":52}
4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

按年龄排序
4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}
3: {"name":{"first":"Carol","last":"Anderson"},"age":52}

按30-50岁年龄范围排序
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

多值索引

BuntDB可以在单个索引上连接多个值。这类似于传统SQL数据库中的多列索引。

在这个例子中,我们在"name.last"和"age"上创建一个多值索引:

db, _ := buntdb.Open(":memory:")
db.CreateIndex("last_name_age", "*", buntdb.IndexJSON("name.last"), buntdb.IndexJSON("age"))
db.Update(func(tx *buntdb.Tx) error {
	tx.Set("1", `{"name":{"first":"Tom","last":"Johnson"},"age":38}`, nil)
	tx.Set("2", `{"name":{"first":"Janet","last":"Prichard"},"age":47}`, nil)
	tx.Set("3", `{"name":{"first":"Carol","last":"Anderson"},"age":52}`, nil)
	tx.Set("4", `{"name":{"first":"Alan","last":"Cooper"},"age":28}`, nil)
	tx.Set("5", `{"name":{"first":"Sam","last":"Anderson"},"age":51}`, nil)
	tx.Set("6", `{"name":{"first":"Melinda","last":"Prichard"},"age":44}`, nil)
	return nil
})
db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("last_name_age", func(key, value string) bool {
		fmt.Printf("%s: %s\n", key, value)
		return true
	})
	return nil
})

// 输出:
// 5: {"name":{"first":"Sam","last":"Anderson"},"age":51}
// 3: {"name":{"first":"Carol","last":"Anderson"},"age":52}
// 4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
// 1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
// 6: {"name":{"first":"Melinda","last":"Prichard"},"age":44}
// 2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

降序索引

任何索引都可以通过用buntdb.Desc包装其less函数来降序排列。

db.CreateIndex("last_name_age", "*",
    buntdb.IndexJSON("name.last"),
    buntdb.Desc(buntdb.IndexJSON("age")),
)

这将创建一个多值索引,其中姓氏是升序,年龄是降序。

排序规则i18n索引

使用外部collate包,可以创建按指定语言排序的索引。这类似于传统数据库中的SQL COLLATE关键字。

安装:

go get -u github.com/tidwall/collate

例如:

import "github.com/tidwall/collate"

// 用法语不区分大小写排序
db.CreateIndex("name", "*", collate.IndexString("FRENCH_CI"))

// 指定数字应该按数值排序("2" < "12")
// 并使用逗号表示小数点
db.CreateIndex("amount", "*", collate.IndexString("FRENCH_NUM"))

JSON索引也支持排序规则:

db.CreateIndex("last_name", "*", collate.IndexJSON("CHINESE_CI", "name.last"))

查看collate项目以获取更多信息。

数据过期

可以通过在Set函数中使用SetOptions对象来设置TTL来自动驱逐项目。

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("mykey", "myval", &buntdb.SetOptions{Expires:true, TTL:time.Second})
	return nil
})

现在mykey将在一秒钟后自动删除。你可以通过使用相同的键/值再次设置值来移除TTL,但options参数设置为nil。

迭代时删除

BuntDB目前不支持在迭代过程中删除键。作为解决方法,你需要在迭代器完成后删除键。

var delkeys []string
tx.AscendKeys("object:*", func(k, v string) bool {
	if someCondition(k) == true {
		delkeys = append(delkeys, k)
	}
	return true // 继续
})
for _, k := range delkeys {
	if _, err = tx.Delete(k); err != nil {
		return err
	}
}

仅追加文件

BuntDB使用AOF(仅追加文件),这是一个记录所有由Set()和Delete()等操作引起的数据库更改的日志。

该文件的格式如下:

set key:1 value1
set key:2 value2
set key:1 value3
del key:2
...

当数据库再次打开时,它将回读aof文件并按确切顺序处理每个命令。这个读取过程在数据库打开时只发生一次。从那时起,该文件只会被追加。正如你可能猜到的，这个日志文件会随着时间的推移变得很大。有一个后台程序会在日志文件变得太大时自动缩小它。还有一个Shrink()函数，它会重写aof文件，使其只包含数据库中的项目。缩小操作不会锁定数据库，因此在缩小过程中可以继续进行读写事务。

持久性和fsync

默认情况下，BuntDB每秒钟在aof文件上执行一次fsync。这意味着可能会丢失最多一秒钟的数据。如果你需要更高的持久性，可以将可选的数据库配置设置Config.SyncPolicy设为Always。

Config.SyncPolicy有以下选项：

Never - fsync由操作系统管理，较不安全
EverySecond - 每秒fsync一次，快速且更安全，这是默认设置
Always - 每次写入后fsync，非常持久，但较慢

配置

以下是一些可用于更改数据库各种行为的配置选项。

SyncPolicy 调整数据同步到磁盘的频率。该值可以是Never、EverySecond或Always。默认为EverySecond。
AutoShrinkPercentage 被后台进程用来在aof文件大小大于上次缩小后文件大小的百分比时触发aof文件的缩小。例如，如果此值为100，上次缩小过程生成了100MB的文件，那么新的aof文件必须达到200MB才会触发缩小。默认为100。
AutoShrinkMinSize 定义了在自动缩小可以发生之前aof文件的最小大小。默认为32MB。
AutoShrinkDisabled 关闭自动后台缩小。默认为false。

要更新配置，你应该调用ReadConfig，然后调用SetConfig。例如：

var config buntdb.Config
if err := db.ReadConfig(&config); err != nil {
    log.Fatal(err)
}
if err := db.SetConfig(config); err != nil {
    log.Fatal(err)
}

性能

BuntDB有多快？

这里是在Raft Store实现中使用BuntDB的一些基准测试示例。

你也可以从项目根目录运行标准Go基准测试工具：

go test --bench=.

BuntDB-基准测试

有一个专门的工具是为BuntDB基准测试而创建的。

以下是在MacBook Pro 15" 2.8 GHz Intel Core i7上运行基准测试的结果：

$ buntdb-benchmark -q
GET: 4609604.74 operations per second
SET: 248500.33 operations per second
ASCEND_100: 2268998.79 operations per second
ASCEND_200: 1178388.14 operations per second
ASCEND_400: 679134.20 operations per second
ASCEND_800: 348445.55 operations per second
DESCEND_100: 2313821.69 operations per second
DESCEND_200: 1292738.38 operations per second
DESCEND_400: 675258.76 operations per second
DESCEND_800: 337481.67 operations per second
SPATIAL_SET: 134824.60 operations per second
SPATIAL_INTERSECTS_100: 939491.47 operations per second
SPATIAL_INTERSECTS_200: 561590.40 operations per second
SPATIAL_INTERSECTS_400: 306951.15 operations per second
SPATIAL_INTERSECTS_800: 159673.91 operations per second

要安装这个工具：

go get github.com/tidwall/buntdb-benchmark

联系方式

Josh Baker @tidwall

许可证

BuntDB源代码可在MIT 许可证下使用。

buntdb

特性

入门

安装

打开数据库

事务

只读事务

读写事务

设置和获取键值对

迭代

自定义索引

内置类型

空间索引

k-最近邻

空间括号语法

JSON 索引

多值索引

降序索引

排序规则i18n索引

数据过期

迭代时删除

仅追加文件

持久性和fsync

配置

性能

BuntDB-基准测试

联系方式

许可证

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号