Skip to content

Latest commit

 

History

History
215 lines (108 loc) · 17.3 KB

0521.md

File metadata and controls

215 lines (108 loc) · 17.3 KB

构建有效的数据分析团队和项目生态系统以实现成功

网址:www.kdnuggets.com/2021/04/build-effective-data-analytics-team-project-ecosystem-success.html

评论

作者:Randy Runtsch,数据分析师

介绍


我们的前三大课程推荐

1. Google 网络安全证书 - 快速入门网络安全职业。

2. Google 数据分析专业证书 - 提升您的数据分析水平

3. Google IT 支持专业证书 - 支持您的组织在 IT 领域


在长期的软件开发、信息安全和数据分析职业生涯中,我观察到大型、复杂和令人不知所措的项目有可能无法满足利益相关者的需求,除非它们得到极其出色的管理。相反,我参与的大多数成功的数据分析项目规模、团队规模和时间线都很小。它们通常在几天、几周或几个月内完成,并且通常能满足最终用户的需求。

高效的管理、敏捷的实践、熟练的从业者、强大的工具、标准和指南可以结合起来创建一个数据分析生态系统,从而实现短项目周期和有用的解决方案。以下部分描述了我的团队开发和利用的一些组织、项目和数据分析特质与技术。虽然我们在大型企业的风险管理和内部审计职能中构建了数据分析程序,但你也许可以将这些技术应用于你的工作环境中。

良好的管理与领导力

在我 34 年的软件开发和数据分析工作经历中,我观察到许多管理和领导风格,无论好坏。我最近在与一位创建框架并指导我们团队在大型企业中建立成功的部门数据分析程序的经理合作时,取得了显著的成功。根据经验和观察,以下是他和其他杰出领导者帮助个人、团队和项目成功的一些特质和行动:

  • 为项目设定目标,并管理项目及团队以实现这些目标。

  • 确定所需的能力,招聘和培训员工以满足这些需求。

  • 与内部和外部组织合作,分享和学习最佳实践。

  • 提供符合需求的强大软件工具。

  • 作为与高层管理沟通的桥梁。

  • 与团队及其成员合作并关心他们,但不要过于强势。

  • 确保实施并遵循基本但足够的标准、指南和程序。

  • 为成长和成就建立节奏。

  • 尊重每个团队成员的时间和专注需求。

招聘和发展技能与知识

几年前,我参加了一个数据分析会议,一位讲者描述了她作为数据科学家所需的一些技能。她表示,执行她的工作需要超过 200 项技能。确实,创建成功的数据分析解决方案要求分析师具备许多才能。为了招聘和培养具备所需技能和知识的分析师,你和你的管理层可以考虑以下步骤:

  1. 编写引人注目的职位描述和招聘启事——制定职位描述和招聘启事,描述成功候选人必须具备的技能和知识。同时,列出员工在职期间需要发展的技能和知识。

  2. 招聘具有专业知识和良好潜力的数据分析师——运用职位描述和招聘启事,招聘具备所需技能和知识,并具有发展额外所需技能的能力和潜力的分析师。

  3. 识别学习资源——创建课程和教程的列表,以帮助数据分析师发展在其职位上取得成功所需的技能和知识。

  4. 评估技能——评估团队及其成员的优势和劣势,识别发展和成长需求,将每个数据分析师的技能和知识与职位描述以及深入的能力列表进行对比。

  5. 培训分析师——确保工作单位的预算和时间表允许资金和时间用于数据分析师完成培训,以发展所需的技能和知识。根据技能评估结果,确保分析师参加学习资源列表中定义的培训。

保持项目团队小型化

复杂的项目与大型团队可能会因为管理不善而陷入困境。尽量保持每个项目的规模和范围较小,并将团队规模限制为一到三名最终用户和一名主数据分析师,可能有助于项目的成功。对于复杂项目,团队可以增加数据分析师,以便通过分工或互补技能来提升项目效益。对于大型或复杂项目,你可能希望指派一名项目经理与团队合作,识别和管理任务、时间表、风险和问题。最后,在需要时寻求项目业务领域的主题专家(SME)。

采用敏捷实践

项目团队,特别是在软件开发中,通常会应用敏捷开发方法,例如 Scrum 或 Kanban,来组织任务并快速推进。我的团队有效地使用了在 Microsoft OneNote 中开发的 Kanban Board,以便在频繁的站会中跟踪和沟通任务。它由一页上的三个列组成。每个任务从“准备工作”移动到“进行中”时,任务开始,从“进行中”到“完成”时,任务结束。

示例看板

简单的 Kanban Board 可以用来管理项目任务。图像由作者提供。

确定简洁的范围、目标和时间表

与最终用户、团队成员和经理在项目生命周期中的对话对于建立并保持商定的简洁范围、目标和时间表至关重要。通过保持项目紧凑,我在一周到三个月长的项目中都取得了一致的成功。

如果项目庞大且复杂,可以考虑将其拆分成更小的子项目,每个子项目具有有限的范围、目标和时间表。

将合理数量的竞争项目和任务分配给数据分析师

一些研究人员发现,当多任务处理时,人类表现会受到影响。分配给个人的多个项目或任务可能会适得其反。此外,虽然技能和任务多样性是可以提高个人满意度和表现的工作因素(见job characteristics theory),但分配给工人的项目或任务数量应合理,以便工人能够成功并完成所有任务。

平衡团队合作与自主性

在一个运作良好的团队中工作可以带来许多好处,例如:

  • 团队成员可以互补彼此的技能。

  • 团队成员可以相互鼓励并推动前进。

  • 团队成员可以共享想法并进行头脑风暴,以确定解决方案。

  • 团队的生产力可能会超过其各部分的总和。

对于有效团队合作的好处毋庸置疑。另一方面,一些类型的工作,如数据分析、编程和写作,通常最好由那些半自主工作的个人完成,这些个人通常会收到团队成员的反馈。他们的工作需要专注和有限的干扰。

采用并掌握强大且多功能的工具和语言

数据分析师应该配备强大且多功能的数据分析工具,以满足他们的需求。通过这种方法,分析师可以利用每个工具的功能,发展能力和最佳实践。以下部分描述了我的当前团队在数据分析项目中使用的每个软件包。

Alteryx Designer — 根据 Alteryx 的网站,Designer 可用于“自动化分析的每一步,包括数据准备、数据融合、报告、预测分析和数据科学。”虽然单用户许可证的费用高达数千美元,但它是一个强大的数据分析和数据科学工具。我的团队使用它来创建和运行工作流,这些工作流输入数据、转换和准备数据,并以多种格式输出数据。分析师可以快速轻松地创建功能强大且运行迅速的工作流。

Tableau — Tableau 软件创建了一个强大且可能是最受欢迎的商业智能和数据可视化平台。我的团队使用 Tableau Desktop 连接数据源,开发可视化工作表和仪表板。然后,我们将可视化内容发布到 Tableau Server,最终用户可以查看和互动。

Python — Python 是一种用户友好且强大的编程语言,在数据分析师和数据科学家中非常受欢迎。与同样受数据科学家青睐的以统计为中心的 R 语言不同,Python 是一种通用编程语言。它是免费的且易于学习。分析师可以通过自由提供的库扩展 Python 的功能,例如 NumPyTensorFlow

Python 编程语言

Python 编程语言代码示例。图片来自作者。

SQL — 结构化查询语言(SQL)是用于实现、操作和查询存储在关系数据库管理系统(RDBMS)中的结构化数据的标准语言。它包括多个子语言。通过数据查询语言(DQL),分析师可以查询和检索数据库表中的数据。RDBMS 数据库在全球企业中存储大量数据集。

SQL — 结构化查询语言

SQL(结构化查询语言)代码示例。图片来自作者。

Microsoft SQL Server Management Studio (SSMS) — SSMS 是微软的集成开发环境(IDE),用于管理和查询在 SQL Server RDBMS 中实现的数据库。免费且易于学习,我使用 SSMS 创建和运行 SQL 代码以查询包含所需数据的数据库。

Microsoft SQL Server Management Studio (SSMS)

SQL Server Management Studio (SSMS) 用于管理 Microsoft SQL Server 数据库和 SQL 代码。图片来自作者。

Rapid SQL — Rapid SQL 是一个类似于 SSMS 的集成开发环境,用于开发 SQL 查询以访问存储在 Oracle、SQL Server、DB2 和 SAP Sybase 数据库中的数据。我使用 Rapid SQL 从 DB2 或 Oracle 数据库中获取数据。

微软 Visual Studio — Visual Studio 是微软的旗舰集成开发环境(IDE)。我使用 Visual Studio Professional 来创建用 Python 和其他编程语言编写的应用程序。它的编辑器功能强大,具有语法高亮功能。 Visual Studio Community 2019 是一个免费的 IDE 版本,可能满足你的需求。微软的 Visual Studio Code(VS Code)是另一个受程序员和数据分析师欢迎的免费 IDE。

微软 Visual Studio

微软 Visual Studio Professional 是一个集成开发环境(IDE),用于编写程序和开发应用程序。图像由作者提供。

微软 Excel — Excel 无疑是一个普遍使用、有用、强大且有时不可或缺的工具。我使用 Excel 工作簿作为项目数据源和输出,以创建小型数据集,进行必要的数据清洗和计算等。像 Excel 这样的电子表格应用程序在任何数据分析或数据科学工作中都是一项重要工具。

微软 Excel

电子表格应用程序,如微软 Excel,是多功能的数据分析工具。图像由作者提供。

制定基本标准、指南和程序

对数据分析项目应用简明的标准和指南可以提高生产力以及工作产品的维护和共享。以下是指导我工作的标准和指南类型。

命名标准 — 对文件夹、文件、数据库表、列和字段等项进行标准化命名,使得在多个工作产品中一致命名和查找工作产品变得容易。

文件夹结构标准和模板 — 使用统一的文件夹结构可以使设置新项目和查找文件夹及文件变得容易。我的团队使用以下文件夹结构模板来组织和存储所有数据分析项目的工作产品:

  • 项目名称(将此值更改为项目名称)

  • alteryx_workflows

  • 数据

  • 文档

  • python_programs

  • sql_scripts

  • tableau_workbooks

文件夹结构会根据每个项目的需求扩展和收缩。

编码标准 — 编码标准对编程的作用就像语法对英语散文的作用一样。它们帮助我们组织和清晰一致地传达思想。我曾参与的数据分析和软件开发团队受益于记录的编码规范。在项目中应用这些标准可以使每个代码模块更易于原作者编写,并且任何团队成员都可以更容易地阅读、理解、增强和维护。以下是我的团队用于指导工作的部分编码标准的描述。

  • 类、变量和函数命名规范 — 为了可读性,我们决定将所有类、函数和变量名称创建为小写字母,每个单词或缩写之间用下划线(“_”)分隔。每个类和变量名称描述它存储的值类型,而每个函数名称描述函数对哪些值或对象执行什么操作。例如,存储人名的变量可以叫做 person_name 或 person_nm。一个从数据库中检索人名列表的函数可以叫做 get_person_names()。

  • 代码模块前言 — 我们在每个模块开头加入文本以描述其目的。为了帮助可能维护该模块的其他编码人员,我们添加了额外的信息,例如作者的名字、数据库连接字符串、文件位置和更改日志。

  • 注释 — 尽管有些人说代码自我文档化,但我相信,恰当的注释可以帮助编码人员组织思路,并帮助需要维护或增强代码的其他人更快地理解它。例如,在开始时,我描述一个函数对什么数据做了什么。我还在每个执行任务的代码逻辑分组之前添加简要注释。

  • 空白 — 为了使代码更易读,我在每个函数、每组变量定义和每个执行特定任务的代码块之间插入空行。

  • 简洁的函数范围和可见大小 — 与空白一样,我限制每个函数的内容,以便更容易编码、理解、维护和扩展。我努力保持每个函数简单,并尝试使其内容在编辑器中可见(例如,跨 80 个字符和向下 40 行)。

可视化样式指南 — 尽管编码标准可以帮助程序员理解、编写和维护代码,但可视化样式指南可以帮助数据分析师开发一致、有用和有意义的视觉效果。它们还可以通过提供一致、设计良好、易于理解和用户友好的视觉效果来使数据分析项目中的最终用户受益。以下是我的团队采纳的一些视觉样式指南。

  • 品牌标准 — 我们公司的品牌管理部门已确定了一组一致的字体、颜色和视觉设计风格及组件。我们将这些纳入我们的可视化指南,以增加专业性和一致性,并帮助最终用户获得熟悉的用户界面风格。

  • 字体 — 我们公司设计了一种字体,当可用时我们将使用它。否则,我们的数据分析产品将默认使用 Ariel 字体。

  • 颜色 — 我们公司的品牌标准包括一个小的色彩调色板。我们在可能的情况下将这些颜色应用于图表、图形和仪表板。我们还尽量限制在任何图表、图形或仪表板上使用的颜色数量,以保持视觉上的愉悦。

  • 标题、头部和标签——我们的指南描述了文本元素(如仪表板标题、图表和图形头部、列、过滤器和图例)应用的标准位置、字体、大小和颜色。

  • 视觉组件的摆放——与文本一样,我们的指南描述了仪表板上元素(如图表和图形、过滤器和图例)的标准位置。

摘要

构建一个有效的数据分析团队并不容易,该团队需要定期构建和交付数据分析解决方案,为终端用户提供洞察力并帮助他们做出决策。但是,运用我在软件开发和数据分析领域长期积累的经验和有效实践,可能会帮助你取得成功。

简历:Randy Runtsch 是一名数据分析师、软件开发人员、作家、摄影师、骑行者和冒险家。他和他的妻子住在美国明尼苏达州东南部。请关注 Randy 即将发布的关于公共数据集推动数据分析解决方案、编程、数据分析、自行车旅行、啤酒等方面的文章。

原文。经许可转载。

相关:

  • 数据科学团队模型:国际象棋与跳棋

  • 在小公司构建数据科学团队的六个建议

  • 数据科学家缺失的团队

更多相关内容