23 lines
1.6 KiB
Bash
23 lines
1.6 KiB
Bash
###从NCBI下载基因组(DNA)/转录组(RNA)测序数据到获得预测基因的处理步骤(以Nyctotherus_ovalis物种为例,见/home/Data_01/yizhenzhen06/public_share/Saccharomyces_cerevisiae_DNA。如果没有注明仅基因组数据要做,其他步骤基因组和转录组步骤一样。直接写在本文件里的美丽表示可以直接终端运行指令,其他指令要提交pbs任务运行。
|
||
|
||
fastqc -o 1_trim/QC/ --noextract -t 2 -f fastq 0_rawdata/SRRXXXXXX_1.fastq 0_rawdata/SRRXXXXXX_2.fastq
|
||
|
||
#分别检查左、右端数据质量,数据量大可以一起提交脚本运行。
|
||
#如果数据质量不好,就做trimmomatic质控过滤。如果质量没问题,就分别合并所有左、右端两端reads文件进行组装。
|
||
|
||
:cat SRRXXXXXX.1_1.fastq SRRXXXXXX.1_1.fastq > species_name_1.fastq #合并所有左端reads文件
|
||
:cat SRRXXXXXX.1_2.fastq SRRXXXXXX.1_2.fastq > species_name_2.fastq #合并所有右端reads文件
|
||
|
||
trimmomatic PE -phred33 -threads 16 \
|
||
1_trim/species_name_1.fastq \
|
||
1_trim/species_name_2.fastq \
|
||
1_trim/species_name_1_p.fastq \
|
||
1_trim/species_name_1_up.fastq \
|
||
1_trim/species_name_2_p.fastq \
|
||
1_trim/species_name_2_up.fastq \
|
||
ILLUMINACLIP:../../adapters/NexteraPE-PE.fa:2:30:10:8:true LEADING:3 TRAILING:3 SLIDINGWINDOW:5:20 MINLEN:36 HEADCROP:15
|
||
#trimmomatic质控过滤,参数需根据具体数据质量进行调整,大型数据请提交脚本运行。
|
||
|
||
fastqc -o 1_trim/QC/ --noextract -t 2 -f fastq 0_rawdata/SRRXXXXXX_1.fastq 0_rawdata/SRRXXXXXX_2.fastq
|
||
|
||
#再次检查左、右端数据质量,数据量大同样提交脚本运行。 |