Reference Difference Transformer (RDTransformer)

RDTransformer is a Transformer-based model designed to predict the functional effects of mutations in biological sequences (RNA, DNA, or proteins). Built upon a Transformer backbone, it introduces a dynamic difference-based embedding mechanism relative to the wild-type sequence. This mechanism filters out noise from non-mutational sites while emphasizing the effects of introduced or natural mutations.

🧠 Architecture

📚 Data

The pretraining data was sourced from the RNAcentral database.
Citation:

RNAcentral Consortium.
RNAcentral 2021: secondary structure integration, improved sequence search and new member databases.
Nucleic Acids Research, 2021; 49(D1):D212-D220.
https://doi.org/10.1093/nar/gkaa921

Both raw and preprocessed pretraining datasets are available here.

💻 Source Code

The full implementation is available here.

⚙️ Environment Setup

1. Create environment:

conda env create -f environment.yml

Note: This is a CPU-only environment to maximize compatibility. The original experiments in the paper were conducted with the following configuration:

PyTorch 2.6.0 + CUDA 12.4

NVIDIA driver 555.42.06

cuDNN: as bundled with the PyTorch 2.6.0+cu124 distribution

To reproduce GPU-accelerated results, install the matching CUDA-enabled PyTorch wheel:
pip install torch==2.6.0+cu124 --index-url https://download.pytorch.org/whl/cu124

2. Activate environment:

conda activate rdt_env

🚀 Run Scripts:

Configure finetuning using the YAML files in src/finetune_configs/, then run scripts from src/

1. Run pretraining:

python pretrain.py

2. Run cross-validation for fine-tuning:

python finetune_cv.py --config finetune_configs/wb_cv_config.yaml
python finetune_cv.py --config finetune_configs/elisa_cv_config.yaml

3. Run finetuning on full training set:

python finetune_fulltrain.py --config finetune_configs/wb_fulltrain_config.yaml
python finetune_fulltrain.py --config finetune_configs/elisa_fulltrain_config.yaml

4. Run evaluation on held-out test set:

python finetune_test.py --config finetune_configs/wb_test_config.yaml
python finetune_test.py --config finetune_configs/elisa_test_config.yaml

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
data		data
src		src
README.md		README.md
architecture.png		architecture.png
environment.yml		environment.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Reference Difference Transformer (RDTransformer)

🧠 Architecture

📚 Data

💻 Source Code

⚙️ Environment Setup

🚀 Run Scripts:

About

Uh oh!

Releases

Packages

Languages

davidwongmedinfo/RDTransformer

Folders and files

Latest commit

History

Repository files navigation

Reference Difference Transformer (RDTransformer)

🧠 Architecture

📚 Data

💻 Source Code

⚙️ Environment Setup

🚀 Run Scripts:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages