修改、删除、重写了部分代码，精简了代码结构

WangHunZi · WangHunZi · commit bd646261edf0 · 2023-09-13T02:17:53.000+08:00
diff --git a/README.md b/README.md
@@ -2,17 +2,25 @@
 python脚本下载[jyy老师](https://jyywiki.cn/)的OS课件
 
 如果你修改代码中的`WITHOUT_DOWNLOAD`，还可以下载其他的课件
+也可以修改代码中的`SOURCE_FILE_TYPE`来添加你想要下载的文件类型。如果某些文件类型没有添加到此变量中，那就不会下载该类型的文件。
 
-# 使用说明
+# 使用
 
 运行脚本后输入对应选项即可选择要下载的课件，按下回车默认下载2023年课件
 
-课件中包含图片、嵌入的代码等，经过测试，显示都没有什么问题。
+课件中包含图片、嵌入的代码等，经过测试，课件的显示都没有什么问题。
 
-所有的内容都在`Courseware`这个文件夹里
+所有的课件内容都在`Courseware`这个文件夹里
 
 # 更新
+## V2.1 2023-09-13
+这一版代码要比上一版更加精简，精简了太多，删除了V2.0中很看不爽的`file_download`中的代码，重写为`while`的一个整体，觉得很不错，还节省了一个变量。
+灵光一闪好像漏了`.h`文件，添加进去后发现果然漏了，然后又试探性地下载`.txt`和`.vim`，结果却是一无所获，这个问题随缘解决吧，至少现在的文件类型是相对比较全的。
 
-## 2023-9-10
+## V2.0 2023-09-10
 这一版代码要比第一版要更加完善，能够下载不同年份的课件，且代码实现要比第一版更加精简。
-但还是有很多要优化的地方。
+但还是有很多要优化的地方。
+
+## V1.0 2023-09-07
+第一版代码写得略微粗糙，全是for+if，逻辑很朴实，大致思路就是从index.html开始下载，然后对下载的文件中的资源执行分析，然后对分析的链接再次下载......反复执行这个过程。
+主要的限制在于只能下载2023年的课件。
diff --git a/main.py b/main.py
@@ -27,7 +27,9 @@ def download(url_, path_):
 class OSCourseware:
     BASE_URL = "https://jyywiki.cn"
     SOURCE_FILE_TYPE = (
-        ".png", ".jpg", ".gif", ".webp", "jpeg", ".js", ".css", ".html", ".c", ".cpp", ".py", ".sh", ".S"
+        ".png", ".jpg", ".gif", ".webp", "jpeg",
+        ".js", ".css", ".html",
+        ".c", ".h", ".cpp", ".py", ".sh", ".S", ".lua", ".txt"
     )
     COURSEWARE_DIR = "Courseware"
     WITHOUT_DOWNLOAD = [
@@ -38,7 +40,6 @@ class OSCourseware:
     year = []
     year_input = ''
     current_dir = ''
-    index_url_path_pairs = {}
     slides_url_path_pairs = {}
     sources_url_path_pairs = {}  # 字典不用去重
 
@@ -63,40 +64,23 @@ def build_courseware_url_path(year_):
 
         if self.year_input == "ALL":
             for year in ['2021', '2022', '2023']:
-                self.index_url_path_pairs.update(build_courseware_url_path(year))
+                self.sources_url_path_pairs.update(build_courseware_url_path(year))
         elif self.year_input != "Invalid":
-            self.index_url_path_pairs.update(build_courseware_url_path(self.year_input))
+            self.sources_url_path_pairs.update(build_courseware_url_path(self.year_input))
             if self.year_input != "2023":
                 self.WITHOUT_DOWNLOAD.append(f'{self.BASE_URL}/OS/2023/index.html')
         else:
             print("输入非法，程序退出")
             sys.exit()
 
     def file_download(self):
-        # 按年下载、分析index.html
-        def _download(_url_path_pairs):
-            for _url, _path in _url_path_pairs.items():
+        while self.sources_url_path_pairs:
+            self.slides_url_path_pairs.update(self.sources_url_path_pairs)
+            self.sources_url_path_pairs.clear()
+            for _url, _path in self.slides_url_path_pairs.items():
                 download(_url, _path)
-
-        def _analyse(_url_path_pairs):
-            for _url, _path in _url_path_pairs.items():
                 self.file_analyse(_path)
 
-        def _analyse_download(_url_path_pairs):
-            _analyse(_url_path_pairs)
-            _download(self.sources_url_path_pairs)
-
-        # 下载index.html文件，分析index.html后下载课件
-        _download(self.index_url_path_pairs)
-        _analyse_download(self.index_url_path_pairs)
-
-        # 分析课件后下载课件中的其他文件
-        self.slides_url_path_pairs.update(self.sources_url_path_pairs)
-        _analyse_download(self.slides_url_path_pairs)
-
-        self.slides_url_path_pairs.update(self.sources_url_path_pairs)
-        _analyse_download(self.slides_url_path_pairs)
-
     # 提取每个文件中的链接
     def file_analyse(self, filepath):
         # 对非HTML文件不做分析
@@ -123,9 +107,9 @@ def file_analyse(self, filepath):
                 path = os.path.normpath(os.path.join(os.path.dirname(filepath), link.replace("/", "\\")))
                 relative_path = path.split(os.getcwd() + os.sep + self.COURSEWARE_DIR)[1]
                 url = urljoin(self.BASE_URL, relative_path.replace("\\", "/"))
-                if url in self.WITHOUT_DOWNLOAD:
-                    continue
-                self.sources_url_path_pairs.update({url: path})
+                if url not in self.WITHOUT_DOWNLOAD:
+                    self.sources_url_path_pairs.update({url: path})
+                    self.WITHOUT_DOWNLOAD.append(url)
 
 
 courseware = OSCourseware()