ast-types

ast-types

抽象语法树类型系统的模块化实现

ast-types 是一个模块化的抽象语法树(AST)类型系统实现,兼容 Esprima 和 Mozilla Parser API。它支持 AST 遍历、节点操作和自定义类型定义,便于处理复杂的 JavaScript 代码结构。此外,ast-types 提供作用域分析功能,适用于静态代码分析和转换任务。该项目为开发者提供了灵活高效的 AST 操作工具。

AST语法树节点遍历代码分析JavaScriptGithub开源项目

AST 类型 CI

本模块提供了一个高效、模块化的 Esprima 兼容实现,用于实现由 Mozilla 解析器 API 开创的抽象语法树类型层次结构。

安装

通过 NPM:

npm install ast-types

从 GitHub:

cd path/to/node_modules
git clone git://github.com/benjamn/ast-types.git
cd ast-types
npm install .

基本用法

import assert from "assert"; import { namedTypes as n, builders as b, } from "ast-types"; var fooId = b.identifier("foo"); var ifFoo = b.ifStatement(fooId, b.blockStatement([ b.expressionStatement(b.callExpression(fooId, [])) ])); assert.ok(n.IfStatement.check(ifFoo)); assert.ok(n.Statement.check(ifFoo)); assert.ok(n.Node.check(ifFoo)); assert.ok(n.BlockStatement.check(ifFoo.consequent)); assert.strictEqual( ifFoo.consequent.body[0].expression.arguments.length, 0, ); assert.strictEqual(ifFoo.test, fooId); assert.ok(n.Expression.check(ifFoo.test)); assert.ok(n.Identifier.check(ifFoo.test)); assert.ok(!n.Statement.check(ifFoo.test));

AST 遍历

由于该库深入理解 AST 类型系统,因此能够提供出色的节点迭代和遍历机制。

如果你想完全控制遍历过程,只需要一种枚举 AST 节点已知字段并获取其值的方法,你可能会对 getFieldNamesgetFieldValue 这两个基础函数感兴趣:

import { getFieldNames, getFieldValue, } from "ast-types"; const partialFunExpr = { type: "FunctionExpression" }; // 尽管 partialFunExpr 实际上并不包含 FunctionExpression 所需的所有字段, // types.getFieldNames 依然知道: console.log(getFieldNames(partialFunExpr)); // [ 'type', 'id', 'params', 'body', 'generator', 'expression', // 'defaults', 'rest', 'async' ] // 对于具有默认值的字段,如果该字段未实际定义,types.getFieldValue 将返回默认值。 console.log(getFieldValue(partialFunExpr, "generator")); // false

另外两个低级辅助函数 eachFieldsomeField 是基于 getFieldNamesgetFieldValue 定义的:

// 遍历对象的所有已定义字段,包括缺失或未定义的字段, // 将每个字段名和有效值(由 getFieldValue 返回)传递给回调函数。 // 如果对象没有相应的 Def,则不会调用回调函数。 export function eachField(object, callback, context) { getFieldNames(object).forEach(function(name) { callback.call(this, name, getFieldValue(object, name)); }, context); } // 类似于 eachField,但一旦回调函数返回真值就停止迭代。 // 与 Array.prototype.some 类似,最终结果为 true 或 false, // 表示回调函数是否对任何元素返回了 true。 export function someField(object, callback, context) { return getFieldNames(object).some(function(name) { return callback.call(this, name, getFieldValue(object, name)); }, context); }

下面是如何复制 AST 节点的示例:

import { eachField } from "ast-types"; const copy = {}; eachField(node, function(name, value) { // 注意,未定义的字段也会根据 node.type 的相关规则被访问, // 并在适当时替换为默认字段值。 copy[name] = value; })

但这还不是全部!你还可以使用强大的 types.visit 抽象轻松访问整个语法树。

这里是一个简单的例子,展示如何断言 ast 中从未使用 arguments.callee:

import assert from "assert"; import { visit, namedTypes as n, } from "ast-types"; visit(ast, { // 这个方法将被调用于任何 .type 为 "MemberExpression" 的节点: visitMemberExpression(path) { // 访问方法接收一个参数,一个包装感兴趣节点的 NodePath 对象。 var node = path.node; if ( n.Identifier.check(node.object) && node.object.name === "arguments" && n.Identifier.check(node.property) ) { assert.notStrictEqual(node.property.name, "callee"); } // 在访问方法返回之前,你有责任使用某个 NodePath 对象 //(通常是传入访问方法的对象)调用 this.traverse, // 或者返回 false 以表明遍历不需要继续深入这个子树。 this.traverse(path); } });

这里是一个稍微复杂一点的例子,将 ...rest 参数转换为可在浏览器中运行的 ES5 JavaScript:

import { builders as b, visit } from "ast-types"; // 重用相同的 AST 结构来表示 Array.prototype.slice.call。 var sliceExpr = b.memberExpression( b.memberExpression( b.memberExpression( b.identifier("Array"), b.identifier("prototype"), false ), b.identifier("slice"), false ), b.identifier("call"), false ); visit(ast, { // 这个方法将被调用于任何类型是 Function 子类型的节点 //(例如 FunctionDeclaration、FunctionExpression 和 ArrowFunctionExpression)。 // 注意,types.visit 预先计算了一个查找表, // 从每个已知类型到适当的访问方法,因此调度时间是常数。 visitFunction(path) { // 访问方法接收一个参数,一个包装感兴趣节点的 NodePath 对象。 const node = path.node; // 在访问方法返回之前,你有责任使用某个 NodePath 对象 //(通常是传入访问方法的对象)调用 this.traverse, // 或者返回 false 以表明遍历不需要继续深入这个子树。 // 如果你忘记了,将会触发断言失败,这很棒, // 因为这意味着你永远不会再犯忘记遍历子树这个灾难性错误。 // 同样很酷的是:因为你可以在访问方法的任何位置调用这个方法, // 所以由你决定遍历是前序、后序还是两者兼有! this.traverse(path); // 这个遍历只关心有 rest 参数的 Function 节点。 if (!node.rest) { return; } // 就本例而言,我们不会考虑有 Expression 主体的函数。 n.BlockStatement.assert(node.body); // 使用 types.builders 构建一个变量声明,形式如下: // // var rest = Array.prototype.slice.call(arguments, n); // // 其中 `rest` 是 rest 参数的名称,`n` 是一个数字字面量, // 指定函数接受的命名参数数量。 const restVarDecl = b.variableDeclaration("var", [ b.variableDeclarator( node.rest, b.callExpression(sliceExpr, [ b.identifier("arguments"), b.literal(node.params.length) ]) ) ]); // 类似于执行 node.body.body.unshift(restVarDecl), // 但包装其他 body 语句的 NodePath 对象 // 会更新它们的索引以适应新语句。 path.get("body", "body").unshift(restVarDecl); // 现在我们已经用普通 JavaScript 模拟了 rest 参数的行为, // 将 node.rest 置为 null。 path.get("rest").replace(null); // 直接执行 node.rest = null 也没问题, // 但我想指出上面的语句具有相同的效果。 assert.strictEqual(node.rest, null); } });

下面是如何使用 types.visit 来实现一个函数,该函数判断给定的函数节点是否引用了 this:

function usesThis(funcNode) { n.Function.assert(funcNode); var result = false; visit(funcNode, { visitThisExpression(path) { result = true; // 终止遍历的最快方法是调用 this.abort(), // 它会抛出一个特殊的异常(instanceof this.AbortRequest), // 该异常将在顶层 types.visit 方法中被捕获, // 因此你不必担心自己捕获异常。 this.abort(); }, visitFunction(path) { // 嵌套作用域中的 ThisExpression 节点不算作原始函数节点的 `this` 引用, // 所以我们可以安全地避免遍历这个子树。 return false; }, visitCallExpression(path) { const node = path.node; // 如果函数包含涉及 super 的 CallExpression 节点, // 这些表达式将隐式依赖 `this` 的值, // 即使它们并不显式包含任何 ThisExpression 节点。 if (this.isSuperCallExpression(node)) { result = true; this.abort(); // 抛出 AbortRequest 异常。 } this.traverse(path); }, // 是的,你可以定义任意的辅助方法。 isSuperCallExpression(callExpr) { n.CallExpression.assert(callExpr); return this.isSuperIdentifier(callExpr.callee) || this.isSuperMemberExpression(callExpr.callee); }, // 甚至可以定义辅助方法的辅助方法! isSuperIdentifier(node) { return n.Identifier.check(node.callee) && node.callee.name === "super"; }, isSuperMemberExpression(node) { return n.MemberExpression.check(node.callee) && n.Identifier.check(node.callee.object) && node.callee.object.name === "super"; } }); return result; }

你可能猜到了,当从子树抛出 AbortRequest 时,异常将从祖先访问方法中相应的 this.traverse 调用传播。如果你决定要取消请求,只需捕获异常并调用其 .cancel() 方法。try-catch 块下面的子树的剩余部分将被放弃,但祖先节点的剩余兄弟节点仍将被访问。

NodePath

传递给访问方法的 NodePath 对象是 AST 节点的包装器,它提供了对祖先对象链(一直到 AST 的根)和作用域信息的访问。

通常,path.node 指的是被包装的节点,path.parent.node 指的是最近的 Node 祖先,path.parent.parent.node 指的是祖父节点,依此类推。

注意,path.node 可能不是 path.parent.node 的直接属性值;例如,可能是 path.node 是父节点的一个数组的元素:

path.node === path.parent.node.elements[3]

在这种情况下,你应该知道 path.parentPath 提供了从 AST 根到完整对象路径(不仅仅是 Node 对象)的更细粒度访问:

// 实际上,path.parent 是 path 的祖父: path.parentPath.parentPath === path.parent // path.parentPath 对象包装了 elements 数组(注意我们使用 .value, // 因为 elements 数组不是一个 Node): path.parentPath.value === path.parent.node.elements // path.node 对象是该数组的第四个元素: path.parentPath.value[3] === path.node // 与 path.node 和 path.value 不同,它们是同义词,因为 path.node 是一个 Node 对象, // path.parentPath.node 与 path.parentPath.value 是不同的,因为 elements 数组不是一个 Node。 // 相反,path.parentPath.node 指的是最近的祖先 Node, // 恰好与 path.parent.node 相同: path.parentPath.node === path.parent.node // path 的名称是它在 elements 数组中的索引: path.name === 3 // 同样,path.parentPath 的名称是 path.parent.node 引用它的属性: path.parentPath.name === "elements" // 把它们放在一起,我们可以通过按名称访问每个属性, // 从 path.parent.node 一直追踪对象引用链到 path.node `NodePath` 对象是通过调用父 `NodePath` 对象的 `.get` 方法懒加载创建的: ```js // 如果之前从未创建过 elements 数组的 NodePath 对象, // 它将在此处创建并在未来被缓存: path.get("elements").get(3).value === path.value.elements[3] // 或者,你可以向 .get 传递多个属性名,而不是链式调用多个 .get: path.get("elements", 0).value === path.value.elements[0]

NodePath 对象支持许多有用的方法:

// 用另一个节点替换一个节点: var fifth = path.get("elements", 4); fifth.replace(newNode); // 现在执行一些可能重排列表的操作,这个替换仍然是安全的: fifth.replace(newerNode); // 用两个新节点替换数组中的第三个元素: path.get("elements", 2).replace( b.identifier("foo"), b.thisExpression() ); // 移除一个节点,如果会留下冗余的 AST 节点,则同时移除其父节点: // 例如 var t = 1, y = 2; 移除 `t` 和 `y` 声明会导致 `var undefined`。 path.prune(); // 返回最近的父 `NodePath`。 // 从节点列表中移除一个节点: path.get("elements", 3).replace(); // 在节点列表的开头添加三个新节点: path.get("elements").unshift(a, b, c); // 移除并返回节点列表中的第一个节点: path.get("elements").shift(); // 在节点列表的末尾推入两个新节点: path.get("elements").push(d, e); // 移除并返回节点列表中的最后一个节点: path.get("elements").pop(); // 在节点列表的第七个节点之前/之后插入一个新节点: var seventh = path.get("elements", 6); seventh.insertBefore(newNode); seventh.insertAfter(newNode); // 在节点列表的索引 5 处插入一个新元素: path.get("elements").insertAt(5, newNode);

作用域

在 AST 遍历过程中,作为 path.scope 暴露的对象提供了关于包含 path.node 的作用域中变量和函数声明的信息。查看 scope.ts 了解其公共接口,目前包括 .isGlobal.getGlobalScope().depth.declares(name).lookup(name).getBindings()

自定义 AST 节点类型

ast-types 模块设计为可扩展的。为此,它提供了一种可读、声明式的语法来指定新的 AST 节点类型,主要基于 require("ast-types").Type.def 函数:

import { Type, builtInTypes, builders as b, finalize, } from "ast-types"; const { def } = Type; const { string } = builtInTypes; // 假设你需要一个命名的 File 类型来包装你的 Programs。 def("File") .bases("Node") .build("name", "program") .field("name", string) .field("program", def("Program")); // 防止对 File 类型(以及任何其他由 def(...) 新引入的类型)进行进一步修改。 finalize(); // b.file 构建器函数现在可用。它期望两个参数,如上面 .build("name", "program") 所命名的。 const main = b.file("main.js", b.program([ // 包含了无意义的程序内容以增加色彩。 b.functionDeclaration(b.identifier("succ"), [ b.identifier("x") ], b.blockStatement([ b.returnStatement( b.binaryExpression( "+", b.identifier("x"), b.literal(1) ) ) ])) ])); assert.strictEqual(main.name, "main.js"); assert.strictEqual(main.program.body[0].params[0].name, "x"); // 等等。 // 如果你传递了错误类型的参数,或者未能传递足够的参数,将会抛出 AssertionError。 b.file(b.blockStatement([])); // ==> AssertionError: {"body":[],"type":"BlockStatement","loc":null} 不匹配 string 类型 b.file("lib/types.js", b.thisExpression()); // ==> AssertionError: {"type":"ThisExpression","loc":null} 不匹配 Program 类型

def 语法用于定义 babel-core.tsbabel.tscore.tses-proposals.tses6.tses7.tses2020.tsesprima.tsflow.tsjsx.tstype-annotations.tstypescript.ts 中找到的所有默认 AST 节点类型,因此你有大量示例可以学习。

编辑推荐精选

UI-TARS-desktop

UI-TARS-desktop

基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。

UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。

Wan2.1

Wan2.1

开源且先进的大规模视频生成模型项目

Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。

爱图表

爱图表

全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表

爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。

Qwen2.5-VL

Qwen2.5-VL

一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

HunyuanVideo

HunyuanVideo

HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

WebUI for Browser Use

WebUI for Browser Use

一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

xiaozhi-esp32

xiaozhi-esp32

基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

olmocr

olmocr

一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

飞书多维表格

飞书多维表格

飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

CSM

CSM

高质量语音生成模型

CSM 是一个开源的语音生成项目,它提供了一个基于 Llama-3.2-1B 和 CSM-1B 的语音生成模型。该项目支持多语言,可生成多种声音,适用于研究和教育场景。通过使用 CSM,用户可以方便地进行语音合成,同时项目还提供了水印功能,确保生成音频的可追溯性和透明度。

下拉加载更多