Skip to content

Latest commit

 

History

History
107 lines (54 loc) · 7.4 KB

open-source-projects-google-uber-facebook-data-science-ai.md

File metadata and controls

107 lines (54 loc) · 7.4 KB

谷歌、优步和 Facebook 的数据科学与人工智能开源项目

原文:www.kdnuggets.com/2019/11/open-source-projects-google-uber-facebook-data-science-ai.html

comments figure-name

开源正成为分享和改进技术的标准。一些世界上最大的组织,如谷歌、Facebook 和优步,正在将它们在工作流程中使用的技术开源给公众。这使得普通人能够利用在全球最大公司中使用的技术。可能最知名的开源项目是 PyTorch 和 Tensorflow(这两个项目恰巧都是深度学习的事实标准)。


我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你的组织进行 IT 工作


figure-name来源

  1. PyTorch

figure-name来源

  • PyTorch 基本上是数据科学社区中最著名的深度学习库。它拥有一个丰富的生态系统,数据科学家可以利用这些工具进行各种任务。可用的一些工具包括用于贝叶斯优化的BoTorch、用于设计和使用自然语言处理深度学习模型的AllenNLP、用于轻松构建和评估神经网络的fastai以及提供完整 scikit-learn 兼容性的高级接口skorch
  1. Prophet

figure-name来源

  • Prophet 是一个开源时间序列预测库,提供**PythonR**的 API。它能够在具有高季节性的数据上表现良好,并能够考虑假期效应。它可以处理数据中的缺失值和异常值。时间序列中的一个大问题是缺失数据,因为数据应是顺序的,常见的做法是用均值或中位数填补缺失值(大多数情况下这不是时间序列中的最佳选择)。

figure-name来源

  1. CausalML

figure-name来源

  • CausalML 是 Uber 提供的开源工具,用于提升建模和因果推断方法,采用机器学习技术。它允许用户从实验或观察数据中估计条件平均处理效应(CATE)或个体处理效应(ITE)。
  1. Ludwig

figure-name来源

  1. Pyro

figure-name来源

  • Pyro 由 Uber AI Labs 维护,并建立在 PyTorch 之上,用于深度概率编程。它建立在通用、可扩展、最小和灵活的原则上。正在开发一个名为 NumPyro 的 Pyro 概率编程库的测试版,具有 NumPy 后端,以实现更快的处理速度。
  1. kepler.gl

figure-name来源

  • Kepler.gl 是 Uber 提供的开源地理空间分析工具箱,用于大规模数据集的处理。它旨在帮助数据科学家使用交互式和数据驱动的方法在位置数据上产生影响。它构建在 Mapbox GL 和 Deck.gl 之上。

谷歌开源项目

figure-name来源

  1. Google Cloud Data Lab

figure-name来源

  • Google Datalab 是一个交互式可视化探索工具,具有 IPython 后端,这意味着它拥有一个熟悉的 Jupyter 环境,因此经常使用 Jupyter 的用户会感到很熟悉。Cloud Datalab 使得可以使用 Python、SQL 和 JavaScript(用于 BigQuery 用户自定义函数)在 BigQuery、Cloud Machine Learning Engine、Compute Engine 和 Cloud Storage 上分析数据。然而,如果决定使用云资源(如虚拟机和 Cloud Storage),则需要付费
  1. Tensorflow

figure-name来源

  • 这个框架无需介绍。Tensorflow 与 PyTorch 一起被视为数据科学社区的事实标准深度学习框架。Tensorflow 激发了许多扩展,以更好地利用库,从可视化到直接从命令库的生产 API。
  1. CausalImpact

figure-name来源

  • CausalImpact 库是一个 R 库,用于估计设计干预对时间序列的因果效应。该库使用贝叶斯时间序列模型来估计事件发生时的效果,即使没有现实世界的证据。这在随机实验不可用或不可行时特别有用。

相关:

  • 2018 年回顾:机器学习开源项目与框架

  • Facebook 一直在悄悄开源一些令人惊叹的 PyTorch 深度学习功能

  • LinkedIn、Uber、Lyft、Airbnb 和 Netflix 如何解决机器学习解决方案的数据管理和发现问题

更多相关话题