AlphaFold2 是 2021 年 AI for Science 领域最耀眼的一颗星。现在,有人在 PyTorch 中复现了它,并已在 GitHub 上开源。这一复现在性能上媲美原版 AlphaFold2,且在算力、存储方面的要求对于大众来说更加友好。
刚刚,哥伦比亚大学系统生物学助理教授 Mohammed AlQuraishi 在推特上宣布,他们从头训练了一个名为 OpenFold 的模型,该模型是 AlphaFold2 的可训练 PyTorch 复现版本。Mohammed AlQuraishi 还表示,这是第一个大众可用的 AlphaFold2 复现。



- 短序列推理:加快了在 GPU 上推理少于 1500 个氨基酸残基的链的速度;
- 长序列推理:通过该研究实现的低记忆注意力(low-memory attention)对极长链进行推理,OpenFold 可以在单个 A100 上预测 超过 4000 个残基的序列结构,借助 CPU offload 甚至可以预测更长的序列;
- 内存高效在训练和推理期间,在 FastFold 内核基础上修改的自定义 CUDA 注意力内核,使用的 GPU 内存分别比等效的 FastFold 和现有的 PyTorch 实现少 4 倍和 5 倍;
- 高效对齐脚本:该团队使用原始 AlphaFold HHblits/JackHMMER pipeline 或带有 MMseqs2 的 ColabFold,已经生成了数百万个对齐。
scripts/install_third_party_dependencies.sh
使用如下命令激活环境:
sourcescripts/activate_conda_env.sh
停用命令:
sourcescripts/deactivate_conda_env.sh
在激活环境下,编译 OpenFold 的 CUDA 内核
python3setup.pyinstall
在 / usr/bin 路径下安装 HH-suite:
#scripts/install_hh_suite.sh
使用如下命令可以下载用于训练 OpenFold 和 AlphaFold 的数据库:
bashscripts/download_data.shdata/
如果要使用一组 DeepMind 的预训练参数对一个或多个序列进行推理,可以运行如下代码:
python3run_pretrained_openfold.py
fasta_dir
data/pdb_mmcif/mmcif_files/
--uniref90_database_pathdata/uniref90/uniref90.fasta
--mgnify_database_pathdata/mgnify/mgy_clusters_2018_12.fa
--pdb70_database_pathdata/pdb70/pdb70
--uniclust30_database_pathdata/uniclust30/uniclust30_2018_08/uniclust30_2018_08
--output_dir./
--bfd_database_pathdata/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt
--model_device"cuda:0"
--jackhmmer_binary_pathlib/conda/envs/openfold_venv/bin/jackhmmer
--hhblits_binary_pathlib/conda/envs/openfold_venv/bin/hhblits
--hhsearch_binary_pathlib/conda/envs/openfold_venv/bin/hhsearch
--kalign_binary_pathlib/conda/envs/openfold_venv/bin/kalign
--config_preset"model_1_ptm"
--openfold_checkpoint_pathopenfold/resources/openfold_params/finetuning_2_ptm.pt
更多细节请参见 GitHub:https://github.com/aqlaboratory/openfold

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
算法
+关注
关注
23文章
4816浏览量
98813 -
开源
+关注
关注
3文章
4428浏览量
46589 -
深度学习
+关注
关注
73文章
5614浏览量
124759
原文标题:首个大众可用PyTorch版AlphaFold2复现,哥大开源OpenFold,star量破千
文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
热点推荐
求教:树莓派和arduino的通信
想让树莓派做arduino的上位机。 用的是树莓派2B 和arduino UNO。第一步:在树莓派linux系统下安装arduino ide(失败了)在树莓派
发表于 09-23 10:01
【NanoPi M2试用体验】NanoPi M2 debian简单认识和疑问
联网就成了一项极难的任务,即使现在,我依然没有一个合理的解决方案。当然这也是我发表这篇帖子的初衷,学习之乐趣和水平的提高亦在交流(有点儿装啊)。 目前我能想到的方法为,在Linux系统下安装
发表于 05-03 22:22
【从0教学嵌入式Linux】第十七集
开发板的IP地址为:192.168.1.1013.开发板ping一下PC的Linux系统,确保网络畅通4.在PC端的Linux系统
发表于 06-02 17:20
【从0教学嵌入式Linux】第三十二集
第32课:QT应用程序开发 (一)Linux系统下安装QT Creator集成开发环境1、打开Software Center2、搜索QT Creator(二)应用开发1、
发表于 06-27 10:42
Linux系统下安装ISO文件
路径名) /mnt/cd1
3、此时,在/mnt/cd1目录下,就有相应的安装文件了,接下来安装就可以了。
注:以上操作在su root 后进行,需要root权限。
发表于 07-04 08:21
最新版CCS7.3.0_官方软件下载
CCSv6[6.2] 开始 Linux 版本只提供64位版本,只能在64位 Linux 系统下安装及运行。 从 CCSv7 开始不支持 W
发表于 04-19 17:02
•0次下载
安装Linux系统对硬件有什么要求
很多初学者在安装 Linux 系统时,都对自己的电脑配置存在质疑,担心其是否能够满足安装 Linux 的要求。本节就从 CPU、内存、硬盘、
发表于 07-15 16:12
•2690次阅读
在Linux下如何安装和卸载rpm工具
在Windows系统下安装软件很简单,只要双击后缀为.exe的文件,然后根据提示连续单击“下一步”按钮即可。然而在Linux系统
Linux系统下的安装与使用
评论