启用Zeppelin Notebook
背景
Apache Zeppelin 是一款让交互式数据分析变得可行的基于网页的开源框架。Zeppelin提供了数据分析、数据可视化等功能。
在Zeppelin中创建一个数据分析Notebook,需要使用者先创建对应的Interpreter,再来创建Notebook。
这一流程中,有诸多繁琐之处:
首先:
在配置Interpreter过程中需要需要配置大量参数、管理依赖包,例如:需要添加一个DB2的 JDBC Interpreter,需要填写DB2 JDBC需要参数外,还需要在Zeppelin管理平台中上传DB2 JDBC相关的Java依赖包,这无形中增加了用户的使用难度。
再者:
Zeppelin一般是配合用户自己的数仓管理平台来使用的,当用户开发数仓应用过程中需要确认开发过程每个步骤执行是否正确,需要频繁从数仓平台切换到Zeppelin上来确认产出的结果是否正确。
其次:
Zeppelin的生产环境包下载包已经有1.5G体积巨大, 下载包中已经包含了大量Interpreter的配置模版,其实绝大部分是用不到的。
为了解决以上问题TIS在3.7.1版本中尝试了将Zeppelin无缝与TIS进行整合
- 借助TIS自身强大的插件系统可以让Zeppelin的Interpreter封装成TIS插件,这样可以将Zeppelin的发布包中的Interpreter化整为零,实现按需使用。
- TIS 已经提供了功能丰富的数据源定义模块,无形中承担了Zeppelin的Interpreter的功能,只要将Zeppelin嫁接在TIS数据源定义模块之上就能免去Interpreter定义步骤。
- Zeppelin和TIS的前台组件都是基于Angular来开发的,并且都使用了ng-zorro,这样TIS与Zeppelin整合更加顺畅,UI风格统一,没有违和感。
在TIS中如何激活Zeppelin
下载
tis-zeppelin
包,大约160M
wget http://mirror.qlangtech.com/4.0.1/tis/tis-zeppelin-0.10.1-bin-all.tar.gz
解压
tar xvf tis-zeppelin-0.10.1-bin-all.tar.gz
生成的解压目录记为
ZEPPELIN_HOME
设置TIS启动参数
将上一步骤中解压目录设置到以下shell脚本中,作为参数
ZEPPELIN_HOME
的值{TIS_UBER_HOME}/bin/tis# If intend to active Zeppelin Notebook in TIS , Download tis-zeppelin-0.10.1-bin-all.tar.gz from TIS repository,And uncomment line below
export ZEPPELIN_HOME=/tmp/zeppelin-0.10.1-bin-all重启TIS
cd {TIS_UBER_HOME}./bin/tis restart
Ï
在TIS中使用Notebook
以MySQL
为例,在TIS中如何一站式使用MySQL Notebook
定义TIS MySQL DataSource
打开MySQL Notebook
数据源添加完成之后就能点击Notebook 按钮,打开
MySQL Notebook
面板在MySQL Notebook中进行查询