Software website : https://github.com/GiantSpaceRobot/FindFungi
...
Table of Contents | ||||||
---|---|---|---|---|---|---|
|
1. การติดตั้ง Prerequisites
เนื่องจากบนระบบ TARA มี software บางส่วนติดตั้งไว้แล้ว ที่ต้องติดตั้งเพิ่มเติมจะมี 3 ส่วนคือ ทั้งนี้ถ้ามีการติดตั้ง software ดังกล่าวไว้ใน local หรือ project module ไม่จำเป็นต้องติดตั้งเพิ่มเติม
วิธีการติดตั้ง application โดยใช้ EasyBuild (thaisc.io) ในส่วน EasyBuild
1.1 python 2.7 package : biopython และ ete3
...
View file | ||
---|---|---|
|
2. การติดตั้ง FindFungi
สามารถทำตามขั้นตอนใน https://github.com/GiantSpaceRobot/FindFungi#installing ได้เลย โดยที่ clone จาก https://github.com/astrophys/FindFungi_adapted_for_slurm แทน เพื่อใช้ slurm implementation จากนั้นทำการปรับค่าใน PATH ใน FindFungi-0.23.3.sh ตัวอย่างเช่น
Code Block |
---|
##### USER INPUT REQUIRED: export ScriptPath=$PROJECTHOME/TS-195/FindFungi_adapted_for_slurm/ #Location of downloaded python and shell scripts export PreDir=$z #Location you want FindFungi to build the analysis export KrakenDir=$PROJECTHOME/TS-195/Kraken_32DB/ #Location of the 32 downloaded Kraken databases export FungTaxDir=$PROJECTHOME/TS-195/FindFungi_adapted_for_slurm/ #Location of the Fungal taxids and PipelineSummary files from GitHub export BLAST_DB_Dir=$PROJECTHOME/TS-195/FungalGenomeDatabases_EqualContigs/ #Location of the 949 downloaded BLAST databases |
3. การ run FindFungi บน TARA
3.1 ปรับทรัพยากรที่ต้องการใช้งานใน FindFungi-0.23.3.sh
...
sbatch -W --array=1-32 --cpus-per-task=10 --job-name=kraken_Fungi --wrap='kraken --preload --db ${KrakenDir}/Kraken_${SLURM_ARRAY_TASK_ID} --threads 10 --fasta-input ${PreDir}/FASTA/${z}.final.fna --output ${Dir}/Processing/SplitFiles_Kraken/${z}.${SLURM_ARRAY_TASK_ID}' |
---|
เป็น
sbatch -W --array=1-32%2 --cpus-per-task=10 --job-name=kraken_Fungi --wrap='kraken --preload --db ${KrakenDir}/Kraken_${SLURM_ARRAY_TASK_ID} --threads 10 --fasta-input ${PreDir}/FASTA/${z}.final.fna --output ${Dir}/Processing/SplitFiles_Kraken/${z}.${SLURM_ARRAY_TASK_ID}' |
...
sbatch -W --job-name=sort_${File} -c 1 --mem=64GB -p memory --wrap="sort -k2,2 ${d} > ${Dir}/Processing/SplitFiles_Kraken/sorted_${File}" & |
...
sbatch -W --job-name=${Taxid} --cpus-per-task=20 -t 24:00:00 --wrap="blastn -task megablast -query ${Dir}/Processing/ReadNames.${Taxid}.fsa -db ${BLAST_DB_Dir}/Taxid-${Taxid} -out ${Dir}/Results/BLAST_Processing/BLAST.${Taxid} -evalue 1E-20 -num_threads 20 -outfmt 6" & |
เพื่อเพิ่ม time limit ในกรณีที่ job อาจจะใช้เวลานานในการ run (สามารถปรับค่าได้ตามความเหมาะสม)
3.2 run FindFungi
3.2.1 เตรียม script
สามารถปรับได้จากตัวอย่างด่านล่าง
Code Block |
---|
#!/bin/bash #SBATCH -p compute # Specify the partition or machine type used [Compute/Memory/GPU] #SBATCH -N 1 -c 4 # Specify the number of nodes and the number of core per node #SBATCH -t 100:00:00 # Specifies the maximum time limit (hour: minute: second) #SBATCH -J findfungi # Specify the name of the Job #SBATCH -A projxxxx # Specify Project account which will be received after Register ** If you do not specify in this section, the job will not be able to run. #SBATCH # You can specify additional options. module purge # unload all modules as they may have previously been loaded. module load R/3.6.2-fosscuda-2019b mu # activate local modules # Load the module that you want to use. This example is intel module load R/3.6.2-fosscuda-2019b module load Biopython/1.75-foss-2019b-Python-2.7.16 module load skewer/0.2.2-foss-2019b module load Kraken/1.1-foss-2019b-Perl-5.30.0 ./FindFungi_adapted_for_slurm/FindFungi-0.23.3.sh ERR675624_both-pairs.fastq ERR675624 # Run your program or executable code |
...
โดย job ที่ได้จะเป็น job หลักและมีการ submit job อื่นๆ เพิ่มเติมเป็นๆระยะๆ ตาม pipeline
...
Related articles
Filter by label (Content by label) | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
...