使用TPC-H生成大量数据

环境: REHL 5,  tpch

TPC-H 基准测试是由 TPC-D发展而来的。TPC-H 用 3NF 实现了一个数据仓库, 用于商业智能计算测试。可从http://www.tpc.org/tpch/中下载tpch_2_14_0.zip  ,放入Linux 环境目录下。解压缩unzip tpch_2_14_0.zip, 在生成的文件 cp makefile.suite makefile , 编辑vi makefile

################
CC      = gcc
# Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)
#                                  SQLSERVER, SYBASE, ORACLE
# Current values for MACHINE are:  ATT, DOS, HP, IBM, ICL, MVS,
#                                  SGI, SUN, U2200, VMS, LINUX, WIN32
# Current values for WORKLOAD are:  TPCH
DATABASE= ORACLE
MACHINE = LINUX
WORKLOAD = TPCH

注:这里要设置CC, DATABASE, MACHINE, WORKLOAD这四个变量

然后编译(make)并生成可执行文件(dbgen) 。

生成1G的数据:

./dbgen -vf -s 1

查看生成的数据: ls -l *tbl

还有表定义文件是该目录下的dss.dll文件

作者: hqiang1984

量化自我,极简主义