Add files via upload

ZahraTaherikhonakdar · web-flow · commit f8bc7aef744a · 2025-03-21T13:42:07.000-04:00
diff --git a/src/qs/cair/scripts/multitask.sh b/src/qs/cair/scripts/multitask.sh
@@ -0,0 +1,42 @@
+#!/usr/bin/env bash
+
+SRC_DIR=../
+DATA_DIR=${SRC_DIR}/data/
+EMBED_DIR=${SRC_DIR}/data/fasttext/
+MODEL_DIR=${SRC_DIR}/tmp/
+
+RGPU=$1
+MODEL_NAME=$2
+DATASET=msmarco
+
+
+PYTHONPATH=$SRC_DIR CUDA_VISIBLE_DEVICES=$RGPU python -W ignore ${SRC_DIR}/main/multitask.py \
+	--model_type $MODEL_NAME \
+	--train_file train.json \
+	--dev_file dev.json \
+	--test_file test.json \
+	--max_doc_len 200 \
+	--max_query_len 20 \
+	--uncase True \
+	--max_examples -1 \
+	--emsize 300 \
+	--batch_size 32 \
+	--test_batch_size 32 \
+	--num_epochs 50 \
+	--dropout_emb 0.2 \
+	--dropout 0.2 \
+	--dropout_rnn 0.2 \
+	--optimizer adam \
+	--learning_rate 0.001 \
+	--weight_decay 0.0 \
+	--early_stop 5 \
+	--valid_metric bleu \
+	--checkpoint True \
+	--model_dir $MODEL_DIR \
+	--model_name $MODEL_NAME \
+	--only_test False \
+	--data_workers 5 \
+	--dataset_name $DATASET \
+	--data_dir ${DATA_DIR}/${DATASET}/ \
+	--embed_dir $EMBED_DIR \
+	--embedding_file crawl-300d-2M-subword.vec
diff --git a/src/qs/cair/scripts/ranker.sh b/src/qs/cair/scripts/ranker.sh
@@ -0,0 +1,43 @@
+#!/usr/bin/env bash
+
+SRC_DIR=../
+DATA_DIR=${SRC_DIR}/data/
+EMBED_DIR=${SRC_DIR}/data/fasttext/
+MODEL_DIR=${SRC_DIR}/tmp/
+
+RGPU=$1
+MODEL_NAME=$2
+DATASET=msmarco
+
+
+PYTHONPATH=$SRC_DIR CUDA_VISIBLE_DEVICES=$RGPU python -W ignore ${SRC_DIR}/main/ranker.py \
+	--model_type $MODEL_NAME \
+	--train_file train.json \
+	--dev_file dev.json \
+	--test_file test.json \
+	--max_doc_len 200 \
+	--max_query_len 20 \
+	--uncase True \
+	--num_candidates 10 \
+	--max_examples -1 \
+	--emsize 300 \
+	--batch_size 64 \
+	--test_batch_size 64 \
+	--num_epochs 50 \
+	--dropout_emb 0.2 \
+	--dropout 0.2 \
+	--dropout_rnn 0.2 \
+	--optimizer adam \
+	--learning_rate 0.001 \
+	--weight_decay 0.0 \
+	--early_stop 5 \
+	--valid_metric map \
+	--checkpoint True \
+	--model_dir $MODEL_DIR \
+	--model_name $MODEL_NAME \
+	--only_test False \
+	--data_workers 5 \
+	--dataset_name $DATASET \
+	--data_dir ${DATA_DIR}/${DATASET}/ \
+	--embed_dir $EMBED_DIR \
+	--embedding_file crawl-300d-2M-subword.vec
diff --git a/src/qs/cair/scripts/recommender.sh b/src/qs/cair/scripts/recommender.sh
@@ -0,0 +1,41 @@
+#!/usr/bin/env bash
+
+SRC_DIR=../
+DATA_DIR=${SRC_DIR}/data/
+EMBED_DIR=${SRC_DIR}/data/fasttext/
+MODEL_DIR=${SRC_DIR}/tmp/
+
+RGPU=$1
+MODEL_NAME=$2
+DATASET=msmarco
+
+PYTHONPATH=$SRC_DIR CUDA_VISIBLE_DEVICES=$RGPU python:wq -W ignore ${SRC_DIR}/main/recommender.py \
+	--model_type $MODEL_NAME \
+	--train_file train.json \
+	--dev_file dev.json \
+	--test_file test.json \
+	--max_query_len 20 \
+	--uncase True \
+	--num_candidates 10 \
+	--max_examples -1 \
+	--emsize 300 \
+	--batch_size 64 \
+	--test_batch_size 64 \
+	--num_epochs 50 \
+	--dropout_emb 0.2 \
+	--dropout 0.2 \
+	--dropout_rnn 0.2 \
+	--optimizer adam \
+	--learning_rate 0.001 \
+	--weight_decay 0.0 \
+	--early_stop 5 \
+	--valid_metric bleu \
+	--checkpoint True \
+	--model_dir $MODEL_DIR \
+	--model_name $MODEL_NAME \
+	--only_test False \
+	--data_workers 5 \
+	--dataset_name $DATASET \
+	--data_dir ${DATA_DIR}/${DATASET}/ \
+	--embed_dir $EMBED_DIR \
+	--embedding_file crawl-300d-2M-subword.vec