Readme

Requirements

numpy==1.19.4
pandas==0.25.3
python==3.6.12
scikit-learn==0.23.2
torch==1.7.0+cu101
torchvision==0.8.0+cu101
xgboost==1.3.0
tqdm==4.54.1

Installation

pip install -r requirements.txt

Data preparation

Generate training and testing files

python generate_sample.py

Generate sequences for searching

Use sequence_generated.py in ./sequence_generated to generate the sequence for customized searching space, we offered sequences for peptides which length is 6 and the script to generate peptide sequences of length 7 in folder ./sequence_generated.

Generate strutual data for sequences

Use cal_pep_des.py in ./featured_data_generated to generate structual data for Classification and Ranking stage from the sequences derived in the last step.

Model Training

Pipeline training

Use train.py to get all the params for the three models(Classifcation, Ranking, Regressing). You can use customized training data or data generated from Grampa dataset.

Incremental learning

Use lstm_fine_tune.py for incremental learning. The augmented data was provided in folder ./data/origin_data. Using customized data validated in other wet-lab settings is optional.

Searching for antimicrobial sequences

Use predict.py to get the final searching result. For a vast searching space, you may use 'chunk' mechanism to avoid RAM shortage.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
data		data
featured_data_generated		featured_data_generated
sequence_generated		sequence_generated
README.md		README.md
cfg.py		cfg.py
dataset.py		dataset.py
generate_sample.py		generate_sample.py
lstm_fine_tune.py		lstm_fine_tune.py
models.py		models.py
predict.py		predict.py
requirements.txt		requirements.txt
settings.py		settings.py
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Readme

Requirements

Installation

Data preparation

Generate training and testing files

Generate sequences for searching

Generate strutual data for sequences

Model Training

Pipeline training

Incremental learning

Searching for antimicrobial sequences

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Readme

Requirements

Installation

Data preparation

Generate training and testing files

Generate sequences for searching

Generate strutual data for sequences

Model Training

Pipeline training

Incremental learning

Searching for antimicrobial sequences

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages