1. 修改内核参数
sysctl命令被用于在内核运行时动态地修改内核的运行参数,可用的内核参数在目录/proc/sys中。它包含一些TCP/IP堆栈和虚拟内存系统的高级选项, 这可以让有经验的管理员提高引人注目的系统性能。用sysctl可以读取设置超过五百个系统变量。以下为/etc/sysctl.conf的推荐配置,供参考:
Linux资源限制配置文件是/etc/security/limits.conf;限制用户进程的数量对于linux系统的稳定性非常重要。limits.conf文件限制着用户可以使用的最大文件数,最大线程,最大内存等资源使用量。以下为limits.conf的推荐设置,供大家参考:
* soft nofile 65536 * hard nofile 65536 * soft nproc 131072 * hard nproc 131072
2. 创建gpadmin用户
gp 的安装部署均在gpadmin用户下进行操作,所以在root 用户下执行用户创建命令:
1) 上传安装包并安装Greenplum
本例用的是greenplum-db-5.10.2-rhel7-x86_64.rpm安装包,先上传至服务器,新建数据库安装目录:/home/greenplum,执行以下rpm安装命令,安装后的目录为:/home/greenplum/greenplum-db,切换到用户gpadmin(su - gpadmin ),后续的命令都在该用户下执行。下面用rpm命令初始化安装:
rpm -ivh --prefix=/home/greenplum greenplum-db-5.10.2-rhel7-x86_64.rpm
2) 修改参数配置
在/home/greenplum/greenplum-db 中 新建并写入文件seg_hosts和hostlist, 写入内容为主机名bigdata-01,主机名可以通过执行hostname获得
3) 使用gpssh-exkeys将所有机器通道打开
执行以下命令:
4) 新建数据目录
首先进入安装目录
cd /home/greenplum/greenplum-db
创建数据存放目录
将 ~/greenplum-db/docs/cli_help/gpconfigs/gpinitsystem_config拷贝为~/greenplum-db/initgp_config,执行以下命令:
cp /home/greenplum/greenplum-db/docs/cli_help/gpconfigs/gpinitsystem_config /home/greenplum/greenplum-db/initgp_config
5) 环境变量设置
修改~/.bashrc, 注意当前操作用户为gpadmin,在 home/gpadmin 下执行:vi .bashrc,在文件中添加:
source /home/greenplum/greenplum-db/greenplum_path.shexport LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/greenplum/greenplum-db/libexport GPHOME=/home/greenplum/greenplum-dbexport MASTER_DATA_DIRECTORY=/home/greenplum/greenplum-db/gpdata/gpmaster/gpseg-1然后令其生效:source .bashrc
复制
6) 创建初始化文件
新建一个initgp_config文件作为gp的初始化配置文件,文件目录可以为greenplum-db目录,文件中的主要配置如下,供参考:
declare -a DATA_DIRECTORY=(/home/greenplum/greenplum-db/gpdata/gpdatap1 /home/greenplum/greenplum-db/gpdata/gpdatap2)MASTER_HOSTNAME=bigdata-01MASTER_DIRECTORY=/home/greenplum/greenplum-db/gpdata/gpmasterENCODING=utf-8declare -a MIRROR_DATA_DIRECTORY=(/home/greenplum/greenplum-db/gpdata/gpdatam1 /home/greenplum/greenplum-db/gpdata/gpdatam2)MACHINE_LIST_FILE=/home/greenplum/greenplum-db/seg_hosts 复制
红字为需要修改及特别留意的配置项
7) 运行数据库
/home/greenplum/greenplum-db/bin/gpseginstall -f /home/greenplum/greenplum-db/hostlist -u gpadmin -p 前面设置的密码
执行完后继续执行:
/home/greenplum/greenplum-db/bin/gpinitsystem -c home/greenplum/greenplum-db/initgp_config
当显示的结果中有,“Greenplum Database instance successfully created”即安装成功,
可以使用psql -p 2345 -d postgres进行访问。
以下是gp数据库启动、停止、查看服务状态、查询进程等相关命令:
备份数据脚本如下:pg_dump -U user database -t tablename -f dump.sql
导入数据脚本如下:createdb -U user database #如果没有用户首先创建用户psql -U user -d database -f dump.sql
如果发现无法通过IP去访问数据库,则可能该数据库默认只能通过本地连接,也就是回环地址(127.0.0.1),可以修改安装目录下的data\pg_hba.conf,在配置文件最后有IPV4和IPV6的配置,新增一行(这里我用的IPV4,开放所有IP),具体配置可以参考下图:
0.0.0.0/0 表示全部IP地址都合法,合法的IP地址即可
关于Greenplum集群安装部署的教程很多,数据库的编译安装可以参照gp的Github官网教程, 系统的前期配置和完整教程可参考教程,该教程成功率较高。由于Greenplum的版本不断在更新,按照原来众多博主写的教程安装还是会踩很多坑,本文总结此次安装Greenplum所踩过的坑及解决方案,希望对大家有所帮助。
Greenplum安装主要是一些细节不注意的问题,遇到报错,认真读报错信息,缺依赖装依赖,版本过低就升级,重要的是细心就行。

更多精彩干货分享
点击下方名片关注
IT那活儿
