Pub-Script/1_trim/step.sh
2025-06-01 21:09:16 +08:00

23 lines
1.6 KiB
Bash
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

###从NCBI下载基因组(DNA)/转录组(RNA)测序数据到获得预测基因的处理步骤以Nyctotherus_ovalis物种为例见/home/Data_01/yizhenzhen06/public_share/Saccharomyces_cerevisiae_DNA。如果没有注明仅基因组数据要做其他步骤基因组和转录组步骤一样。直接写在本文件里的美丽表示可以直接终端运行指令其他指令要提交pbs任务运行。
fastqc -o 1_trim/QC/ --noextract -t 2 -f fastq 0_rawdata/SRRXXXXXX_1.fastq 0_rawdata/SRRXXXXXX_2.fastq
#分别检查左、右端数据质量,数据量大可以一起提交脚本运行。
#如果数据质量不好就做trimmomatic质控过滤。如果质量没问题就分别合并所有左、右端两端reads文件进行组装。
:cat SRRXXXXXX.1_1.fastq SRRXXXXXX.1_1.fastq > species_name_1.fastq #合并所有左端reads文件
:cat SRRXXXXXX.1_2.fastq SRRXXXXXX.1_2.fastq > species_name_2.fastq #合并所有右端reads文件
trimmomatic PE -phred33 -threads 16 \
1_trim/species_name_1.fastq \
1_trim/species_name_2.fastq \
1_trim/species_name_1_p.fastq \
1_trim/species_name_1_up.fastq \
1_trim/species_name_2_p.fastq \
1_trim/species_name_2_up.fastq \
ILLUMINACLIP:../../adapters/NexteraPE-PE.fa:2:30:10:8:true LEADING:3 TRAILING:3 SLIDINGWINDOW:5:20 MINLEN:36 HEADCROP:15
#trimmomatic质控过滤参数需根据具体数据质量进行调整大型数据请提交脚本运行。
fastqc -o 1_trim/QC/ --noextract -t 2 -f fastq 0_rawdata/SRRXXXXXX_1.fastq 0_rawdata/SRRXXXXXX_2.fastq
#再次检查左、右端数据质量,数据量大同样提交脚本运行。