2323 # PATH=${soft}/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:${db}/EasyMicrobiome/linux:${db}/EasyMicrobiome/script
2424 echo $PATH
2525
26- # ## EasyMetagenome流程
26+ # ## EasyMetagenome流程(正对照)
2727
2828EasyMetagenome流程,包括流程安装、使用和可视化脚本,以及测试流程数据和结果正对照,网址:https://github.com/YongxinLiu/EasyMetagenome
2929
@@ -32,14 +32,15 @@ EasyMetagenome流程,包括流程安装、使用和可视化脚本,以及测
3232 # 可选旧版更新
3333 cd EasyMetagenome && git pull && cd ../
3434
35- # 方法2. 网页中下载
36- # https://github.com/YongxinLiu/EasyMetagenome 中Code Download ZIP下载压缩包,上传至服务器,并解压
35+ # 方法2. 网页 https://github.com/YongxinLiu/EasyMetagenome 中Code Download ZIP下载压缩包,上传至服务器,解压
36+ unzip EasyMetagenome-master.zip
37+ mv EasyMetagenome-master EasyMetagenome
3738
3839 # 方法3. 备用链接下载,无法访问github时使用
39- wget -c http ://www.imeta.science/db/EasyMetagenome .tar.gz
40+ wget -c ftp ://download.nmdc.cn/tools/soft/EasyMicrobiome .tar.gz
4041 tar -xvzf EasyMetagenome.tar.gz
4142
42- # ## EasyMetagenome依赖软件和数据库(EasyMicrobiome )
43+ # ## EasyMicrobiome软件和数据库(EasyMetagenome依赖 )
4344
4445EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件和数据库的合集,网址:https://github.com/YongxinLiu/EasyMicrobiome
4546
@@ -52,21 +53,24 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
5253
5354 # 方法2. 网页中下载
5455 # https://github.com/YongxinLiu/EasyMicrobiome 中Code Download ZIP下载压缩包,上传至服务器,并解压
55-
56+ unzip EasyMicrobiome-master.zip
57+ mv EasyMicrobiome-master EasyMicrobiome
58+
5659 # 方法3. 备用链接下载,无法访问github时使用
57- wget -c http ://www.imeta.science/db /EasyMicrobiome.tar.gz
60+ wget -c ftp ://download.nmdc.cn/tools/ /EasyMicrobiome.tar.gz
5861 tar -xvzf EasyMicrobiome.tar.gz
5962
6063 # 添加linux命令可执行权限
61- chmod +x ${db} /EasyMicrobiome/linux/* ${db} /EasyMicrobiome/script/*
64+ chmod +x ` pwd ` /EasyMicrobiome/linux/* ` pwd ` /EasyMicrobiome/script/*
6265
6366 # 添加环境变量
64- echo " export PATH=\"\$ PATH:${db} /EasyMicrobiome/linux:${db} /EasyMicrobiome/script\" " >> ~ /.bashrc
67+ echo " export PATH=\"\$ PATH:` pwd ` /EasyMicrobiome/linux:` pwd ` /EasyMicrobiome/script\" " >> ~ /.bashrc
6568 source ~ /.bashrc
66-
69+ echo $PATH
70+
6771# ## 软件管理器Conda
6872
69- # 下载最新版miniconda3,~49M
73+ # 下载最新版miniconda3,71M
7074 wget -c https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
7175 # 安装,-b批量,-f无提示,-p目录,许可协议打yes
7276 bash Miniconda3-latest-Linux-x86_64.sh -b -f -p ${soft}
@@ -81,8 +85,8 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
8185 conda config --add channels conda-forge # Highest priority
8286
8387 # conda默认配置文件为 ~/.condarc 查看配置文件位置
84- mamba install pandas -c conda-forge -y
8588 conda install mamba -c conda-forge -y
89+ mamba install pandas -c conda-forge -y
8690 mamba install conda-pack -c conda-forge -y
8791 conda config --set channel_priority strict
8892 conda config --show-sources
@@ -97,6 +101,8 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
97101
98102** 注:直接安装、下载解压安装,二选一。一种方法不成功,尝试另一种。**
99103
104+ BioConda: https://bioconda.github.io/recipes/kneaddata/README.html
105+
100106# ## kneaddata直接安装
101107
102108 # 新建 kneaddata 环境
@@ -108,13 +114,15 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
108114
109115# ## (可选)kneaddata下载解压安装
110116
111- # 下载
112- wget -c http://www.imeta.science/db/conda/kneaddata.tar.gz
117+ # 指定conda文件名
118+ s=kneaddata
119+ # 下载,可选NMDC、百度云等
120+ # wget -c ftp://download.nmdc.cn/tools//conda/${s}.tar.gz
113121 # 指定安装目录
114- mkdir -p ${soft} /envs/kneaddata
115- tar -xvzf kneaddata .tar.gz -C ${soft} /envs/kneaddata
122+ mkdir -p ${soft} /envs/${s}
123+ tar -xvzf ${s} .tar.gz -C ${soft} /envs/${s}
116124 # 启动环境
117- conda activate kneaddata
125+ conda activate ${s}
118126 # 初始化环境
119127 conda unpack
120128
@@ -169,7 +177,7 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
169177# ## HUMAnN2解包安装
170178
171179 # 下载
172- wget -c http ://www.imeta.science/db /conda/humann2.tar.gz
180+ wget -c ftp ://download.nmdc.cn/tools/ /conda/humann2.tar.gz
173181 # 指定安装目录
174182 mkdir -p ${soft} /envs/humann2
175183 tar -xvzf humann2.tar.gz -C ${soft} /envs/humann2
@@ -232,7 +240,7 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
232240
233241 # # metaphlan2数据库下载和配置
234242 mkdir -p ${db} /humann2 && cd ${db} /humann2
235- wget -c http ://www.imeta.science/db /humann2/metaphlan2.tar.gz
243+ wget -c ftp ://download.nmdc.cn/tools/ /humann2/metaphlan2.tar.gz
236244 tar xvzf metaphlan2.tar.gz
237245 # 链接到软件安装目录
238246 mkdir -p ${soft} /envs/humann2/bin/databases
@@ -246,7 +254,7 @@ EasyMetagenome依赖流程EasyMicrobiome,包括很多脚本、常用小软件
246254
247255 n=lefse
248256 # 下载
249- wget -c http ://www.imeta.science/db /conda/${n} .tar.gz
257+ wget -c ftp ://download.nmdc.cn/tools/ /conda/${n} .tar.gz
250258 # 指定安装目录
251259 mkdir -p ${soft} /envs/${n}
252260 tar -xvzf ${n} .tar.gz -C ${soft} /envs/${n}
@@ -274,7 +282,7 @@ kraken2 基于LCA算法的物种注释 https://ccb.jhu.edu/software/kraken/
274282# ## Kraken2解包安装
275283
276284 # 下载
277- wget -c http ://www.imeta.science/db /conda/kraken2.tar.gz
285+ wget -c ftp ://download.nmdc.cn/tools/ /conda/kraken2.tar.gz
278286 # 指定安装目录
279287 mkdir -p ${soft} /envs/kraken2
280288 tar -xvzf kraken2.tar.gz -C ${soft} /envs/kraken2
@@ -291,17 +299,25 @@ kraken2 基于LCA算法的物种注释 https://ccb.jhu.edu/software/kraken/
291299
292300# ## Kraken2数据库安装
293301
294- 下载数据库(NCBI每2周更新一次),记录下载日期和大小。需根据服务器内存、使用目的选择合适方案。--standard标准模式下只下载5种数据库 :古菌archaea、细菌bacteria、人类human、载体UniVec_Core、病毒viral。也可选直接下载作者构建的索引,还包括bracken的索引。链接:https://benlangmead.github.io/aws-indexes/k2 (3/14/2023版)。
302+ 下载数据库(NCBI每2周更新一次),记录下载日期和大小。需根据服务器内存、使用目的选择合适方案。--standard标准模式下只下载5种 ** 标准数据库 :古菌archaea、细菌bacteria、人类human、载体UniVec_Core、病毒viral** 。也可选直接下载作者构建的索引,还包括bracken的索引。链接:https://benlangmead.github.io/aws-indexes/k2 (3/14/2023版)。
295303
296- 方案1. 下载标准+原生动物+真菌+植物 8GB (PlusPFP-8 )
304+ 方案1. 下载标准+原生动物+真菌 16GB (PlusPF-16 )
297305
298- v=k2_pluspfp_08gb_20230314
299- mkdir -p ~ /db/kraken2/pluspfp8g
306+ v=k2_pluspf_16gb_20230314
307+ mkdir -p ~ /db/kraken2/pluspf16g
300308 cd ~ /db/kraken2
301309 wget -c https://genome-idx.s3.amazonaws.com/kraken/${v} .tar.gz
302- tar xvzf ~ /db/kraken2/${v} .tar.gz -C ~ /db/kraken2/pluspfp8g
310+ tar xvzf ~ /db/kraken2/${v} .tar.gz -C ~ /db/kraken2/pluspf16g
311+
312+ 方案2. 下载标准+原生动物+真菌 69GB (PlusPF)
303313
304- 方案2. 下载标准+原生动物+真菌+植物完整库 107G
314+ v=k2_pluspf_20230314
315+ mkdir -p ~ /db/kraken2/pluspf16g
316+ cd ~ /db/kraken2
317+ wget -c https://genome-idx.s3.amazonaws.com/kraken/${v} .tar.gz
318+ tar xvzf ~ /db/kraken2/${v} .tar.gz -C ~ /db/kraken2/pluspf
319+
320+ 方案3. 下载标准+原生动物+真菌+植物完整库 144G (PlusPFP)
305321
306322指定解压目录,包括时间和类型
307323
@@ -319,7 +335,7 @@ kraken2 基于LCA算法的物种注释 https://ccb.jhu.edu/software/kraken/
319335# ## megahit解包安装
320336
321337 # 下载
322- wget -c http ://www.imeta.science/db /conda/megahit.tar.gz
338+ wget -c ftp ://download.nmdc.cn/tools/ /conda/megahit.tar.gz
323339 # 指定安装目录
324340 mkdir -p ${soft} /envs/megahit
325341 tar -xvzf megahit.tar.gz -C ${soft} /envs/megahit
@@ -349,7 +365,7 @@ eggNOG http://eggnogdb.embl.de
349365# ## eggNOG解包安装
350366
351367 # 下载
352- wget -c http ://www.imeta.science/db /conda/eggnog.tar.gz
368+ wget -c ftp ://download.nmdc.cn/tools/ /conda/eggnog.tar.gz
353369 # 指定安装目录
354370 mkdir -p ${soft} /envs/eggnog
355371 tar -xvzf eggnog.tar.gz -C ${soft} /envs/eggnog
@@ -380,7 +396,7 @@ eggNOG http://eggnogdb.embl.de
380396 download_eggnog_data.py -y -f --data_dir ${db} /eggnog
381397 # 百度或微生物所备用链接下载eggnog/eggnog.tar.gz
382398 # 链接至默认目录
383- ln -s ${db} /eggnog ${soft} /envs/eggnog/lib/python3.9/site-packages/data
399+ ln -sf ${db} /eggnog ${soft} /envs/eggnog/lib/python3.9/site-packages/data
384400 # 复制数据至内存中加速比对
385401 # cp eggnog.* /dev/shm
386402
@@ -390,12 +406,12 @@ dbCAN3 http://bcb.unl.edu/dbCAN2
390406
391407 d=08062022
392408 # 创建数据库存放目录并进入
393- mkdir -p ${db} /dbcan3 && cd ${db} /dbcan3
409+ mkdir -p ${db} /dbcan2 && cd ${db} /dbcan2
394410 # 下载序列和描述(biocloud 10M)
395411 wget -c https://bcb.unl.edu/dbCAN2/download/Databases/V11/CAZyDB.${d} .fa
396412 wget -c https://bcb.unl.edu/dbCAN2/download/Databases/V11/CAZyDB.${d} .fam-activities.txt
397413 # 备用数据库下载并解压
398- # wget -c http ://www.imeta.science/db /dbcan2/CAZyDB.${d}.tar.gz
414+ # wget -c ftp ://download.nmdc.cn/tools/meta /dbcan2/CAZyDB.${d}.tar.gz
399415 # tar xvzf CAZyDB.${d}.tar.gz
400416
401417 # 提取基因家簇对应注释
@@ -414,7 +430,7 @@ RGI Github: https://github.com/arpcard/rgi
414430# ## rgi解包安装
415431
416432 # 下载
417- wget -c http ://www.imeta.science/db /conda/rgi.tar.gz
433+ wget -c ftp ://download.nmdc.cn/tools/ /conda/rgi.tar.gz
418434 # 指定安装目录
419435 mkdir -p ${soft} /envs/rgi
420436 tar -xvzf rgi.tar.gz -C ${soft} /envs/rgi
@@ -456,7 +472,7 @@ RGI Github: https://github.com/arpcard/rgi
456472# ## metawrap下载安装
457473
458474 # 下载
459- wget -c http ://www.imeta.science/db /conda/metawrap.tar.gz
475+ wget -c ftp ://download.nmdc.cn/tools/ /conda/metawrap.tar.gz
460476 # 指定安装目录
461477 mkdir -p ${soft} /envs/metawrap
462478 tar -xvzf metawrap.tar.gz -C ${soft} /envs/metawrap
@@ -492,9 +508,9 @@ NCBI核酸和物种信息(以下可选)
492508 # 可能会出现个别库下载不完整的情况,删了重下,不要续传
493509 # 物种信息,压缩文件45M,解压后351M
494510
495- mkdir -p ${db} /NCBI_tax
496- (cd ${db} /NCBI_tax ; wget -c ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz)
497- (cd ${db} /NCBI_tax ; tar -xvzf taxdump.tar.gz)
511+ mkdir -p ${db} /NCBI/tax
512+ (cd ${db} /NCBI/tax ; wget -c ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz)
513+ (cd ${db} /NCBI/tax ; tar -xvzf taxdump.tar.gz)
498514
499515
500516 # # 数据库位置设置
@@ -512,7 +528,7 @@ NCBI核酸和物种信息(以下可选)
512528 # CONFIGURABLE PATHS FOR DATABASES (see 'Databases' section of metaWRAP README for details)
513529 # path to kraken standard database
514530 KRAKEN_DB=~ /KRAKEN_DB
515- KRAKEN2_DB=/db/kraken2/pluspfp /
531+ KRAKEN2_DB=~ /db/kraken2/pluspf /
516532
517533 # path to indexed human (or other host) genome (see metaWRAP website for guide). This includes .bitmask and .srprism files
518534 BMTAGGER_DB=~ /BMTAGGER_DB
@@ -530,7 +546,7 @@ Conda: https://bioconda.github.io/recipes/drep/README.html
530546# ## drep 基因组去冗余解包安装
531547
532548 # 下载dRep v3.2.2无法安装依赖chechm,改用2.6.2
533- wget -c http ://www.imeta.science/db /conda/drep.tar.gz
549+ wget -c ftp ://download.nmdc.cn/tools/ /conda/drep.tar.gz
534550 # 指定安装目录
535551 mkdir -p ${soft} /envs/drep
536552 tar -xvzf drep.tar.gz -C ${soft} /envs/drep
@@ -571,7 +587,7 @@ GTDB-Tk是一个软件工具包,用于根据基因组数据库分类法GTDB为
571587
572588 soft=~ /miniconda3
573589 # 下载
574- wget -c http ://www.imeta.science/db /conda/gtdbtk.tar.gz
590+ wget -c ftp ://download.nmdc.cn/tools/ /conda/gtdbtk.tar.gz
575591 # 指定安装目录
576592 mkdir -p ${soft} /envs/gtdbtk
577593 tar -xvzf gtdbtk.tar.gz -C ${soft} /envs/gtdbtk
@@ -610,7 +626,7 @@ download-db.sh自动下载数据库,将下载至conda中的envs/gtdbtk/share/g
610626 download-db.sh
611627
612628 # 备用链接和手工解压
613- wget -c http ://www.imeta.science/db /gtdb/gtdbtk_r207_v2_data.tar.gz
629+ wget -c ftp ://download.nmdc.cn/tools/ /gtdb/gtdbtk_r207_v2_data.tar.gz
614630 tar xvzf auxillary_files/gtdbtk_r207_v2_data.tar.gz -C ./ --strip 1
615631
616632# 常见问题
@@ -692,7 +708,7 @@ https://pan.baidu.com/s/1Ikd_47HHODOqC3Rcx6eJ6Q?pwd=0315
692708删除当前文件并重新下载即可
693709
694710 rm kneaddata.tar.gz
695- wget http ://www.imeta.science/db /conda/kneaddata.tar.gz
711+ wget ftp ://download.nmdc.cn/tools/ /conda/kneaddata.tar.gz
696712
697713# # Kraken2
698714
0 commit comments