llama-tokenizer-js是一个用于LLaMA模型的JavaScript分词器,可在浏览器端和Node.js环境中运行。它的主要用途是在客户端准确计算token数量,具有以下特点:
该项目由belladore.ai开发,是首个可在浏览器端运行的LLaMA JavaScript分词器。
通过npm安装:
npm install llama-tokenizer-js
import llamaTokenizer from 'llama-tokenizer-js' // 编码 console.log(llamaTokenizer.encode("Hello world!")) // 输出: [1, 15043, 3186, 29991] // 解码 console.log(llamaTokenizer.decode([1, 15043, 3186, 29991])) // 输出: 'Hello world!'