简介

Data Scientist Workbench目标是提供一站式的大数据分析工作平台。目前,此预览版仅限于基于 IPython/Jupter Notebook 与 Spark 的集成。你可以使用 notebooks 开发和运行 Spark 程序, 并可很轻松地实现可视化,创建相关文档和展示你的数据分析结果。目前 Spark 支持 Python 和 Scala 的开发和集成。

如何申请Data Scientist Workbench服务器

登录 Data Scientist Workbench(英文版) ,点击主页中间蓝色的“Get started now“ 按钮进行注册。 完成注册后,将会收到邮件,指导你如何开始使用此工具平台。中文版将于7月31日上线,请随时检查来自IBM Analytics的邮件。

Hello World 演示

为了快速体验如何在 Data Scientist Workbench 平台上开发,运行基于 Scala,Python 语言的Spark程序, 建议参照一下的步骤, 运行 "Hello World" notebook 和提供的演示样品数据.

  1. 登录 Data Scientist Workbench 选择 My Notebooks 菜单.
  2. 在搜索栏里导入下面的文件和notebook.

    • Notebook: https://share.knowledgeanyhow.org/#/api/v1/workbench/10.114.214.68/shares/sHbSUP0luy1xE2q/Scala%20and%20Spark%20in%2015%20minutes.ipynb

    • 数据文件: https://share.knowledgeanyhow.org/#/api/v1/workbench/10.114.214.68/shares/t9LwxWg0EkWKMYX/2015.csv

  3. 使用 notebook!

更多有关如何分享数据文件和notebooks,请参考如何分享数据和Notebooks.