调度系统Azkaban

Azkaban包括三个关键组件:

关系数据库:使用 Mysql数据库,主要用于保存流程、权限、任务状态、任务计划等信息。
AzkabanWebServer:为用户提供管理留存、任务计划、权限等功能。
AzkabanExecutorServer:执行任务,并把任务执行的输出日志保存到 Mysql;可以同时启动多个 AzkabanExecutorServer,通过mysql获取流程状态来协调工作。

 

安装步骤

1. 创建数据库azkaban,加载相应的元数据表(azkaban-sql-script-2.5.0.tar.gz)

CREATE DATABASE azkaban;
GRANT all privileges ON azkaban.* to ‘hq’@’%’;

mysql> source create-all-sql-2.5.0.sql

2. 下载并安装azkaban-web-server-2.5.0.tar.gz

tar xvf azkaban-web-server-2.5.0.tar.gz

创建SSL配置,命令如下:
keytool -keystore keystore -alias jetty -genkey -keyalg RSA
cp keystore azkaban-web-2.5.0/

cd azkaban-web-2.5.0

修改配置参数
vi conf/azkaban.properties

default.timezone.id=Asia/Shanghai

database.type=mysql
mysql.port=3306
mysql.host=xxx.xxx.xxx.xxx
mysql.database=azkaban
mysql.user=hq
mysql.password=xxxxxx

jetty.keystore=keystore
jetty.password=azkaban #(配置SSL的密码)
jetty.keypassword=azkaban #(配置SSL的密码)
jetty.truststore=keystore
jetty.trustpassword=azkaban #(配置SSL的密码)
3. 下载并安装azkaban-executor-server-2.5.0.tar.gz
tar xvf azkaban-executor-server-2.5.0.tar.gz
cd azkaban-executor-2.5.0

修改executor的运行参数
vi conf/azkaban.properties

mysql.host=xxx.xxx.xxx.xxx
mysql.database=azkaban
mysql.user=hq
mysql.password=xxxxxx
4. 启动web和executor的服务

cd azkaban-web-2.5.0
bin/azkaban-web-start.sh

cd azkaban-executor-2.5.0
bin/azkaban-executor-start.sh

借助Phantomjs生成pentaho dashboard的pdf输出格式

环境: CentOS 5.4, Pentaho 5.3

下载 phantomjs编译版本

wget http://phantomjs.googlecode.com/files/phantomjs-1.9.2-linux-x86_64.tar.bz2

tar xvf phantomjs-1.9.2-linux-x86_64.tar.bz2

cd phantomjs

wget https://raw.githubusercontent.com/ariya/phantomjs/master/examples/rasterize.js

生成pdf文件:

bin/phantomjs rasterize.js http://www.baidu.com baidu.pdf

bin/phantomjs rasterize.js ‘http://xxx.xxx.xxx.xxx:8080/pentaho/api/repos/%3Apublic%3ASteel%20Wheels%3ADashboards%3AHome%20Dashboard.xcdf/generatedContent?ts=1439186533366&userid=admin&password=password’ Steel_Whells.pdf

Pentaho BI Server生成pdf格式时中文字体丢失

环境:CentOS 5.2, Pentaho BI Server 5.3

定位问题是出在linux服务器缺少对宋体字体的支持

在windows XP上的c:\\\\windows\\\\fonts目录下找到宋体文件simsun.ttc,放至到linux目录下/tmp

在linux上的操作如下:
sudo mkdir /usr/share/fonts/songti
sudo cp /tmp/simsun.ttc /usr/share/fonts/songti/

fc-cache /usr/share/fonts/songti/
fc-list :lang=zh

访问Pentaho API时加入密码参数

环境: CentOS 5.4, Pentaho BI Server 5.3

切换到 biserver-ce/pentaho-solutions/system目录下,编辑security.properties

修改如下:

requestParameterAuthenticationEnabled=true

重启BI Server服务

通过浏览器或curl访问

http://xxx.xxx.xxx.xxx:8080/pentaho/api/repos/%3Apublic%3ASteel%20Wheels%3AReports%3ATop%20Customers%20%28report%29.prpt/viewer?ts=1438767939338&userid=admin&password=password

 

curl -o 2.pdf –user admin:password http://xxx.xxx.xxx.xxx:8080/pentaho/api/repos/%3Ahome%3Aantifraud%3A%E8%A2%AB%E6%94%BB%E5%87%BB%E5%85%B3%E9%94%AE%E8%AF%8DTop20%E6%97%A5%E6%8A%A5.prpt/generatedContent?output-type=pdf