piflow/木兰社区-PiFlow.md at master · lianwy11/piflow · GitHub

项目名称或建议名称（在木兰开源社区中必须唯一）

大数据流水线系统PiFlow

要求的项目成熟度级别：孵化|毕业

孵化

项目描述

PiFlow是一个基于分布式计算框架技术开发的大数据流水线处理与调度系统。该系统将大数据采集、清洗、存储与分析进行抽象和组件化开发，以所见即所得、拖拽配置的简洁方式实现大数据处理流程化配置、运行与智能监控。提供100+的数据处理组件，包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等，更支持面向领域的二次组件开发。数据可溯源，性能优越。

是否与当前木兰开源社区托管项目有合作机会

有

许可证名称，版本和许可证文本的URL

Apache License 2.0
https://github.com/cas-bigdatalab/piflow/blob/master/LICENSE

源代码控制（Trustie、GitHub、Gitee等）-请确认使用的工具

GitHub：https://github.com/cas-bigdatalab/piflow
Gitee: https://gitee.com/opensci/piflow

问题追踪器（Trustie、GitHub、Gitee、JIRA等）-请确认使用的工具

GitHub：https://github.com/cas-bigdatalab/piflow/issues
JIRA

协作工具（Mail List，Wiki，IRC，Slack，WeChat，QQ等）-请确认正在使用的工具，并注明您想要使用的工具的要求

Wiki
WeChat：PiFlow User Group
QQ群：1003489545

外部依赖关系，包括这些依赖关系的许可证（名称和版本）

Spark 2.3.4 (Apache-2.0 License)
hadoop 2.6.0 (Apache-2.0 License)

最初的提交者（姓名，电子邮件，组织）以及他们从事该项目已有多长时间

PiFlow server | 姓名 | 邮箱 | 组织 | 从事该项目时间 |
| ------ | --------------- | ----------------------------- | ---- |
| 沈志宏 | [email protected] | 中国科学院网络信息中心 | 2018.05-- 至今 |
| 朱小杰 | [email protected] | 中国科学院网络信息中心 | 2018.07-- 至今 |
PiFlow web | 姓名 | 邮箱 | 组织 | 从事该项目时间 |
| ------ | ----------------|-------------------------------| ---- |
| 周健鹏 | [email protected] | 中国科学院网络信息中心 | 2018.09-- 至今 |
| 孙静芳 | [email protected] | 中国科学院网络信息中心 | 2020.08 -- 至今 |

项目是否定义了贡献者，提交者，维护者等角色？如果是，请在MAINTAINERS.md中记录它

无

该项目的贡献者总数，包括其从属关系：

17人

该项目有发布方法吗？如果是，请在RELEASES.md中进行记录

GitHub中进行Release

该项目是否有行为准则？如果是，请共享URL。如果否，请创建CODE_OF_CONDUCT.md并指向。

否

在木兰开源社区中托管项目时，您是否需要基础架构（域名、邮箱、论坛等）请求

需要

项目网站-您是否有网站？如果没有，您是否保留了一个域名，并希望您创建一个网站

无

项目治理-您是否有该项目的有效治理模型？请提供URL到它的记录位置，通常是GOVERNANCE.md

无

社交媒体帐户-您是否有任何Twitter/Facebook/微博/公众号

无

现有赞助（例如，是否有任何组织迄今为止提供了资金或其他支持，以及对该支持的描述）

无