开发环境:python3.9
集成开发环境:PyCharm
前置准备-导入相应的库:numpy,pandas,matplotlib,requests,lxml,csv
1.运用python语言的优势,去实现爬虫模块,这里主要使用xpath的解析方式,爬取虎扑页面NBA球员的各项数据指标。
2.对爬取到的数据先进行整合再分类,通过对数据整体的分类,找出最有价值的几名球员。
3.对球员的各项指标进行横向对比,进一步分析球员的特点,找出最全面的球员。这里采取雷达图,动态可视化等方式进行直观分析。
4.最后进行整体总结,分析哪一位球员的优势与不足,得出一个什么样的结论。
SpiderHot-->K-Means-->RadarMap-->DurantScore-->DurantRadarMap
网站是动态变化的,不是一成不变的,所以要示具体情况而做小幅度的修改。