Review RAG2 by nvaulin · Pull Request #30 · Python-BI-2023/Peer_review

nvaulin · 2024-02-26T17:57:22Z

Review RAG2

MariaLuk

Подсмотрела интересные идеи, особенно про continue) спасибо!

MariaLuk · 2024-03-09T13:44:03Z

RAG2.py

+from Bio import SeqIO
+from Bio.SeqUtils import gc_fraction
+from Bio.Seq import Seq
+


PEP просит две пустых строки, после import

MariaLuk · 2024-03-09T13:48:12Z

RAG2.py

+from Bio.SeqUtils import gc_fraction
+from Bio.Seq import Seq
+
+class BiologicalSequence(ABC):


По предложению Никиты мы могли здесь наследоваться от строки, но потом было сказано, что так лучше не делать). Так что, видимо ,хорошо, что тут не так.

Но при этом мы обсуждали что абстрактный класс это каркас в котором должны быть только abstact методы, а определены они будут ниже в дочерних классах.

MariaLuk · 2024-03-09T13:52:17Z

RAG2.py

+    def gc_content(self):
+        gc_content = (self.sequence.count('G') + self.sequence.count('C')) / len(self.sequence) if self.sequence else 0
+        return gc_content
+
+class DNASequence(NucleicAcidSequence):
+    complement_map = {'A': 'T', 'T': 'A', 'G': 'C', 'C': 'G'}


Словари прописаны как атрибуты классов, а не экземпляров, отлично!
Но я бы добавила в этот словарь и буквы в нижнем регистре, да ,обычно пишут заглавными, но все же g это тоже G. и соответственно в подсчет GC бы тоже добавила

MariaLuk · 2024-03-09T13:53:32Z

RAG2.py

+class DNASequence(NucleicAcidSequence):
+    complement_map = {'A': 'T', 'T': 'A', 'G': 'C', 'C': 'G'}
+    def transcribe(self):
+        return RNASequence(self.sequence.replace('T', 'U'))


Прикольно, что сделано через replace, я так не догадалась

MariaLuk · 2024-03-09T13:55:59Z

RAG2.py

+        return all(nucleotide in self.complement_map for nucleotide in self.sequence)
+
+    def complement(self):
+        return ''.join(self.complement_map[nucleotide] for nucleotide in self.sequence)


По условию тут должны были возвращаться объекты классов RNASequence или DNASequence

Такие штуки в ревью еще здорово оформлять кодом (RNASequence), хотя в целом когда это 1-2 слова то не обязательно тратить время на такие мелочи

MariaLuk · 2024-03-09T13:56:52Z

RAG2.py

+            sequence (str): The input protein sequence in one-letter code.
+
+        Returns:
+            str: The converted protein sequence in three-letter code.


Классно, что есть докстринга

MariaLuk · 2024-03-09T14:00:47Z

RAG2.py

+        Returns:
+            str: The converted protein sequence in three-letter code.
+        """
+        AMINO_ACIDS = {'A': 'Ala', 'C': 'Cys', 'D': 'Asp', 'E': 'Glu', 'F': 'Phe', 'G': 'Gly', 'H': 'His', 'I': 'Ile',


Так как это не глобальная переменная, то я бы назвала ее маленькими буквами

MariaLuk · 2024-03-09T14:16:46Z

RAG2.py

+        if not (gc_bounds[0] <= gc_content <= gc_bounds[1]):
+            continue
+
+        if not (length_bounds[0] <= len(sequence) <= length_bounds[1]):
+            continue
+
+        if not check_quality(quality_scores, quality_threshold):
+            continue


Очень долго разбиралась, но поняла, что да , так должно работать. Если условие не выполнится, то все прейдет к следующей итерации! Не знала такого про continue, либо знала, но забыла, очень круто, хочу попробовать пользоваться. Здорово, что каждая запись последовательно отрабатывается на три фильтра

Если возвращаться к условиям задачи на основе которой мы делали из прошлого семестра, то там надо было отработать ситуации ,в которых подавалась только одна граница для интервалов фильтрования, а не две. Это, кстати, вроде, есть в функциях check ниже

MariaLuk · 2024-03-09T14:22:02Z

RAG2.py

+
+        filtered_seqs[record.id] = (sequence, quality_scores)
+
+    if output_filename:


Если имя файла не прописано, то вернутся просто последовательности без записи в файл. Опять же по условиям задачи прошлого семестра, надо было тогда создавать папку с результатами и туда складывать файл с названием, как исходный

И еще такой момент, получается в запись идет только последовательность и качество, и теряется исходный формат записи fastq файла

MariaLuk · 2024-03-09T14:45:43Z

RAG2.py

+        if not (length_bounds[0] <= len(sequence) <= length_bounds[1]):
+            continue
+
+        if not check_quality(quality_scores, quality_threshold):


Сначала думала, что функция check_quality потерялась, потом нашла ее
Мне кажется, это не очень гуманным к проверяющему оставлять почти 500 строк никак не используемого кода в формате дз четким тз))
Там, конечно ,есть классные и интересные функции, и я бы даже почитала ВСЕ) но если я буду выполнять задание "провести код ревью", то тут получится код ревью без границ просто. Опять же, check_quality где-то там потерялась)

MariaLuk · 2024-03-09T14:48:17Z

RAG2.py

+        return '-'.join(three_letter_code)
+
+
+def filter_fastq(input_path: str, output_filename: str = None, gc_bounds: tuple = (0, 100), length_bounds: tuple = (0, 2 ** 32),


Нас просили переписать, заменить функцию фильтратор. Когда их две, я могу потеряться)

nvaulin added 2 commits February 26, 2024 20:50

Add RAG2.py

b485d53

Add RAG2.py

fc277ad

MariaLuk reviewed Mar 9, 2024

View reviewed changes


		filtered_seqs[record.id] = (sequence, quality_scores)

		if output_filename:

		return '-'.join(three_letter_code)


		def filter_fastq(input_path: str, output_filename: str = None, gc_bounds: tuple = (0, 100), length_bounds: tuple = (0, 2 ** 32),

Conversation

nvaulin commented Feb 26, 2024

Uh oh!

MariaLuk left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

MariaLuk Mar 9, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

MariaLuk Mar 9, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

MariaLuk Mar 9, 2024 •

edited

Loading

MariaLuk Mar 9, 2024 •

edited

Loading