开源全原子蛋白质生成模型
Protpardelle是一个开源的全原子蛋白质生成模型项目,提供预训练模型、推理和训练代码。支持条件和无条件蛋白质设计,可通过HuggingFace网页应用或PyMOL插件使用。项目包含环境配置、示例命令和数据集获取方法,适合研究人员和开发者使用与贡献。
论文《全原子蛋白质生成模型》的代码。
该代码正在积极开发中,我们欢迎贡献、功能请求、问题报告、修正和任何问题!对于使用或改编自他人的代码,我们已尽力给予适当的归属,但如有任何需要更正的地方,请告诉我们。
要设置conda环境,请运行conda env create -f configs/environment.yml
,然后conda activate delle
。您还需要将ProteinMPNN仓库克隆到包含protpardelle/
仓库的同一目录中。您可能还需要在使用的配置中将home_dir
变量设置为包含protpardelle/
目录的路径。
您可以直接在由Gradio支持的便捷HuggingFace WebApp中使用protpardelle。
或者,您可以直接在Pymol中设计蛋白质。
为此,请将protpardelle_pymol.py
文件下载到您的计算机上。
然后打开Pymol,并导航到文件所在的目录。
pwd (查看当前所在目录)
cd 文件路径
然后加载文件。如果是首次启动,这将在Pymol使用的Python安装中安装gradio_client
。这可能需要几秒钟,Pymol窗口可能会出现冻结。
load protpardelle_pymol.py
条件设计
要运行条件设计,首先加载一个结构,例如
fetch 1pga
然后选择一些残基(并可选择命名该选择)。
要重新采样名为sele
的选择中的残基并生成5个样本,在Pymol控制台中运行以下命令:
protpardelle 1pga, sele, 5
无条件设计
要在长度50到60之间以步长5采样蛋白质,并为每个采样长度生成1个样本,使用以下命令:
protpardelle_uncond 50, 60, 5, 1