这是一些我在过去几年中积累的有趣的数学和物理技巧的集合,在Unity的C#中实现。你可以随意使用这里的代码。
一种极快的、通用的网格变形算法,具有任意的点放置和可配置的刚度。它具有一个理想的特性,即当"权重"(延展性)设置为0时,它表现得像刚性Kabsch,但随着权重的增加,它可以平滑地融入变形。
该实现类似于线性混合蒙皮,但蒙皮权重是通过反距离加权(在笛卡尔空间或表面空间中)自动计算的,而"骨骼旋转"则计算为最优地保持控制点之间的角度关系。
一个简单的示例,用于光线行进和绘制/混合到体积距离场纹理。距离场是空间的区域,在空间的每个点上存储到最近表面的距离。这个属性允许它们表示和渲染任意几何形状和拓扑结构的实体形状。
这个特定的实现还存储了指向最近点的归一化向量(场的法线或梯度)。这对于物理查询和照明很有用(无需进行数值导数)。
也称为Procrustes分析,该算法可以接受任意一组点对,并找到全局最优的刚性平移和旋转,以最小化这些点对之间的距离。非常有用,而且计算成本很低。使用Matthias Muller的极分解求解器代替SVD,如这里所述: https://animation.rwth-aachen.de/media/papers/2016-MIG-StableRotation.pdf
更新:添加了平均任意数量四元数的示例;可能比归一化的线性插值(在线性空间中平均四元数分量然后归一化)更准确。
一个通用的辅助工具,用于在3D中拟合点集的线和平面。使用一种新颖的*无矩阵公式来求解最佳拟合的正交线和平面;算法没有奇异性,可扩展到任意维度。
*(据我所知;我没有见过有人尝试不使用SVD进行正交回归(对于仅仅是最佳拟合的线/平面来说,SVD可能是不必要的昂贵))
一个预制件,将四个摄像机的图像连接并扭曲成一个180度的鱼眼视图,进行立体投影。
<img src="http://i.imgur.com/y1jYAzw.gif"> <img src="http://i.imgur.com/xlAhkL4.gif">
使用verlet积分(基于位置的动力学的一个子集)来模拟软/刚体、布料和粒子链接链条的多个示例。
卡尔曼滤波器的教科书实现(从维基百科转录)。卡尔曼滤波器是贝叶斯滤波的一种形式;它们能够接收来自多个来源的信息,并将它们"融合"成比任何组成信号都更清晰/准确的信号。一个正确调谐的卡尔曼滤波器在数学上是将嘈杂数据实时转换为清晰数据的"最优"技术(只要噪声遵循高斯分布,数据线性变化)。在实践中,人们必须处理偏差和非线性变化的量。
<img src="http://i.imgur.com/uymJf1L.gif"> <img src="http://i.imgur.com/ov58hQH.gif">
一组约束函数,可用于构建迭代逆运动学求解器。
<img src="https://i.imgur.com/x2AkTX2.gif"> <img src="https://i.imgur.com/kPwSHU0.gif">
通过将机器人与其环境(和自身)的穿透绘制为距离场来可视化"配置空间",其中每个轴是单个关节的角 度/配置。通过在这个空间的有效区域中进行路径查找,实际上是在规划机器人从一个配置到另一个配置的运动。配置空间的梯度也可以用于机器人从无效配置的轻微去穿透。 然而,由于预计算配置空间很慢(并且必须针对环境中的对象重新进行),我开发了CCDIK的一个变体(CCCDIK :) ),它通过暂时将接触点视为新的末端执行器来迭代地从环境中去穿透自身。
Nelder和Mead的无梯度数值优化方法的通用n维实现,用于最小化代价函数。这是一种流行的优化技术,适用于高维度和无梯度信息的问题。包括一个优化5自由度IK系统的示例(远不如CCDIK高效,但整体更灵活)。还包含一个数值梯度下降优化器用于比较。
Roy Jonker著名的线性分配问题解决方案的移植。允许你取两个任意对象列表(每个列表中的对象与另一个列表中的对象配对都有一个成本),并找到这些列表中对象之间的全局最优配对。非常方便。
有关商业许可详情,请参阅源文件。
Matthias Muller Fischer的O(1)空间哈希系统的重新实现,用于粒子-粒子碰撞查找。通常比朴素的O(n^2)碰撞检查快20倍以上。
一个参考实现,演示如何使用蒙皮网格渲染器中包含的数据将骨骼运动应用于模型。正如他们所说,给网格蒙皮的方法不止一种。
演示如何设置一个着色器,使用(禁用的)摄像机作为投影器视锥体将纹理投影到场景几何体上。对幻觉很有用。
包含一个用于生成任意维度和点数的近似均匀准随机分布点的类。 基于以下文章: http://extremelearning.com.au/unreasonable-effectiveness-of-quasirandom-sequences/
展示了一种有趣的技术,用于使粒子围绕距离场流动(在UE4的Niagara中效果会非常好)。
使用计算着色器实时绘制任意2D闵可夫斯基"差"。闵可夫斯基和(及其修改版"闵可夫斯基差")是碰撞检测中的核心操作。这个概念提供了一种完全通用的方法来确定任意两个物体是否相交,以及将它们分开的最小平移量。关键是确定原点(操作中使用的坐标系的原点)是否在结果闵可夫斯基差形状内。GJK是一种碰撞检测技术,通过对隐式闵可夫斯基差进行 少量采样,快速实现了这种检查。
操作类似于标准射线投射,但同时返回入射和出射信息。用于构建绕环境缠绕的电线和子弹入射/出射效果。
一种特殊的启发式公式,用于计算具有有限推力的双重积分质量的时间最优运动轨迹。
公式来自这门优秀的课程:http://underactuated.csail.mit.edu/underactuated.html?chapter=9
这是一种利用刚性最大/"开花"(类贝塞尔)插值方案来增强由离散段组成的轨迹端点的技术。包括3D和6D轨迹的实现。
灵感来自这篇论文:https://april.eecs.umich.edu/media/pdfs/olson2006icra.pdf
这似乎是一种独特的几何解决方案,用于计算2D和3D(适用时)刚体变换的枢轴点。计算效率高,几何直观,可扩展到任意维度。
一个示例,演示了如何使用滑动窗口加权平均来为噪声6自由度数据生成连续平滑样条。
用于生成本质上是变形平面的实体网格(在自由形态光学中常见的形状)。
用于生成具有任意长度和半径的胶囊体网格。
一个小型着色器,在你的物体/广告牌上光线追踪一个像素完美的球体,适用于想要受像素限制而非顶点限制的情况...
还包含一个用于寻找圆和球的切点的小型演示。
一个序列化工具,使用反射在运行时智能序列化和反序列化游戏对象层次结构、引擎组件、MonoBehaviour、引用等。对于保存/加载系统或运行时编辑器很有用。
一个通用矩阵类和一组基本矩阵运算(乘法、加法、减法、求逆、Cholesky分解等)。为支持卡尔曼滤波器的实现而编写。使用这些操作中的任何一个都会分配一个新数组(垃圾),所以在性能受限的系统上使用时要小心。
实现触觉探针的示例,其中触觉控制器执行器上的力等于绿色立方体相对于灰色立方体的线性和角位移。
我尝试实现捆绑调整(一种算法,试图解决两个相机图像之间的相对运动,给定一组特征点在图像之间的运动)。立体情况现在在大多数情况下收敛到唯一的6自由度姿态。这种实现具有高度的并行性。
这为HingeJoint和一般的Rigidbody添加了一个函数来"通过"它们施加扭矩。
一个未经测试的函数,用于将n维向量编码到n+1维环面的表面。最初旨在允许神经网络学习连续周期函数,而不会将维度膨胀到2n(即平凡的x -> (sin(x), cos(x))情况)。
尝试通过阻尼施加于物体的加速度来模拟软海绵接触。像摩擦这样的现象会导致它表现出奇怪的伪影...
使用了一个巧妙的技巧,如果移动弹簧关节的锚点,两个连接的刚体都会受到物理影响。这允许轻松模拟"肌肉"。
全家都能玩得开心!
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别 、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。