mycat使用记录一 -- 安装与配置

rkdownm

背景条件

  现有app流量数据统计分析系统,因数据量过大使用单数据库性能有限,打算将现有数据库进行优化,计划使用mycat实现分布式,在本地搭建环境学习

环境

  VMware虚拟机下的Cetnos7 × 3台

mycat的安装

  1. 下载mycat,这里我选择的是1.6.5版本,也就是目前的release版本。
  2. 上传至linux系统,解压至/opt/mycat(我习惯的目录)

mycat的配置

配置文件路径

$mycat_home$指的是安装目录
$mycat_home$/conf/server.xml Mycat的配置文件,设置账号、参数等
$mycat_home$/conf/schema.xml Mycat对应的物理数据库和数据库表的配置
$mycat_home$/conf/rule.xml Mycat分片(分库分表)规则

具体配置
  1. wrapper.conf
    —配置jdk(如果已经配置java环境变量,这一步可以忽略)
    1
    2
    wrapper.java.command=/usr/bin/java
    #配置java的路径
  2. server.xml

    1. user标签

      1
      2
      3
      4
      5
      <user name="root" defaultAccount="true">
      <property name="password">your_password</property>
      <property name="schemas">db1,db2</property>
      <property name="readOnly">false</property>
      </user>

      user 用户配置节点
      —name 登录的用户名,也就是连接Mycat的用户名
      —password 登录的密码,也就是连接Mycat的密码
      —schemas 数据库名,这里会和schema.xml中的配置关联,多个用逗号分开,例如需要这个用户需要管理两个数据库db1,db2,则配置db1,dbs

    2. privileges标签

      1
      2
      3
      4
      5
      6
      7
      8
      9
       <privileges check="false"> 默认关闭
      <schema name="TESTDB" dml="0110" >
      <table name="tb 01" dml="0000"></table>
      <table name="tb02" dml="1111"></table>
      1 代表有权限
      0 代表无权限
      顺序为 insert,update,select,delete
      </schema>
      </privileges>
    3. system标签
        这个标签内嵌套的所有 property 标签都与系统配置有关。
    4. firewall标签
        有关防火墙的标签,也就是在网络层对请求的地址进行限制,主要是从安全角度来保证Mycat不被匿名IP进行访问
      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
       <!-- 全局SQL防火墙设置 -->
      <!--白名单可以使用通配符%或着*-->
      <!--例如<host host="127.0.0.*" user="root"/>-->
      <!--例如<host host="127.0.*" user="root"/>-->
      <!--例如<host host="127.*" user="root"/>-->
      <!--例如<host host="1*7.*" user="root"/>-->
      <!--这些配置情况下对于127.0.0.1都能以root账户登录-->
      <!--
      <firewall>
      <whitehost>
      <host host="1*7.0.0.*" user="root"/>
      </whitehost>
      <blacklist check="false">
      </blacklist>
      </firewall>
  3. schema.xml
    — schema 数据库设置,此数据库为逻辑数据库,name与server.xml中schema对应
    — dataNode 分片信息,也就是分库相关配置
    — dataHost 物理数据库,真正存储数据的数据库

    1. schema标签
        schema标签用来定义mycat实例中的逻辑库,mycat可以有多个逻辑库,每个逻辑库都有自己的相关配置。可以使用schema标签来划分这些不同的逻辑库
        如果不配置schema标签,所有表的配置会属于同一个默认的逻辑库。逻辑库的概念和MySql的database的概念一样,我们在查询两个不同逻辑库中的表的时候,需要切换到该逻辑库下进行查询。
      1
      2
      3
      4
      5
      6
      7
      <schema name=" " checkSQLschema="false" sqlMaxLimit="100">
      </schema>
      <!--
      name 逻辑数据库名,与server.xml中的schema对应
      checkSQLschema 数据库前缀相关设置,当该值为true时,例如我们执行语句select * from TESTDB.company 。mycat会把语句修改为 select * from company 去掉TESTDB。
      sqlMaxLimit 当该值设置为某个数值时,每条执行的sql语句,如果没有加上limit语句,Mycat会自动加上对应的值。不写的话,默认返回所有的值。
      -->
    2. table标签
      —name 表名,物理数据库中表名
      —dataNode 表存储到哪些节点,多个节点用逗号分隔。节点为下文dataNode设置的name
      —primaryKey主键字段名,自动生成主键时需要设置
      —autoIncrement 是否自增
      —rule 分片规则名,具体规则下文rule详细介绍
      —type 该属性定义了逻辑表的类型,目前逻辑表只有全局表和普通表。全局表: global 普通表:无
        注:全局表查询任意节点,普通表查询所有节点效率低
      —autoIncrement mysql对非自增长主键,使用last_insert_id() 是不会返回结果的,只会返回0。所以,只有定义了自增长主键的表,才可以用last_insert_id()返回主键值。
      mycat提供了自增长主键功能,但是对应的mysql节点上数据表,没有auto_increment,那么在mycat层调用last_insert_id()也是不会返回结果的。
      —needAddLimit 指定表是否需要自动的在每个语句后面加上limit限制,由于使用了分库分表,数据量有时候会特别庞大,这时候执行查询语句,忘记加上limt就会等好久,所以mycat自动为我们加上了limit 100,这个属性默认为true,可以自己设置为false禁用。如果使用这个功能,最好配合使用数据库模式的全局序列。
      —subTables 分表,分表目前不支持Join。

      1
      2
      3
      <table name=“test” primaryKey="ID" autoIncrement="true" dataNode=“dn1,dn2,dn3” />
      <table name=“mine” primaryKey="ID" autoIncrement="true" dataNode=“dn1,dn2,dn3” />
      <table name=“new” primaryKey="ID" autoIncrement="true" dataNode=“dn1,dn2,dn3” />
    3. childTable标签
      —childTable 标签用于定义 E-R 分片的子表。通过标签上的属性与父表进行关联。
      —name 子表的名称
      —joinKey 子表中字段的名称
      —parentKey 父表中字段名称
      —primaryKey 同Table
      —needAddLimit 同Table

      1
      2
      3
      <table name="customer" primaryKey="ID" dataNode="dn1,dn2" rule="sharding-by-intfile">
      <childTable name="c_a" primaryKey="ID" joinKey="customer_id" parentKey="id" />
      </table>
    4. dataNode标签
        datanode标签定义了mycat中的数据节点,也就是我们所说的数据分片。一个datanode标签就是一个独立的数据分片。
        例子中的表述的意思为,使用名字为localhost1数据库实例上的db1物理数据库,这就组成一个数据分片,最后我们用dn1来标示这个分片。
      —name 定义数据节点的名字,这个名字需要唯一。我们在table标签上用这个名字来建立表与分片对应的关系
      —dataHost 用于定义该分片属于哪个数据库实例,属性与datahost标签上定义的name对应
      —database 用于定义该分片属于数据库实例上 的具体库。

      1
      <dataNode name="dn1" dataHost="localhost1" database="db1" />
    5. dataHost标签
      —name 唯一标示dataHost标签,供上层使用
      —maxCon 指定每个读写实例连接池的最大连接。
      —minCon 指定每个读写实例连接池的最小连接,初始化连接池的大小
      —balance 负载均称类型
        balance=”0”:不开启读写分离机制,所有读操作都发送到当前可用的writeHost上
        balance=”1”:全部的readHost与stand by writeHost参与select语句的负载均衡,简单的说,当双主双从模式(M1-S1,M2-S2 并且M1 M2互为主备),正常情况下,M2,S1,S2都参与select语句的负载均衡。
        balance=”2”:所有读操作都随机的在writeHost、readHost上分发
        balance=”3”:所有读请求随机的分发到writeHst对应的readHost执行,writeHost不负担读写压力。(1.4之后版本有)
      —writeType 负载均衡类型。
        writeType=”0”, 所有写操作发送到配置的第一个 writeHost,第一个挂了切到还生存的第二个writeHost,重新启动后已切换后的为准,切换记录在配置文件中:dnindex.properties .
        writeType=”1”,所有写操作都随机的发送到配置的 writeHost。1.5以后版本废弃不推荐。
      —switchType
        -1 不自动切换
        1 默认值 自动切换
        2 基于MySql主从同步的状态决定是否切换,心跳语句为 show slave status
        3 基于 MySQL galary cluster 的切换机制(适合集群)(1.4.1),心跳语句为 show status like ‘wsrep%’
      —dbType 指定后端链接的数据库类型目前支持二进制的mysql协议,还有其他使用jdbc链接的数据库,例如:mongodb,oracle,spark等
      —dbDriver 指定连接后段数据库使用的driver,目前可选的值有native和JDBC。使用native的话,因为这个值执行的是二进制的mysql协议,所以可以使用mysql和mariadb,其他类型的则需要使用JDBC驱动来支持。
      1.6版本开始支持postgresql的原始协议。
      如果使用JDBC的话需要符合JDBC4标准的驱动jar 放到mycat\lib目录下,并检查驱动jar包中包括如下目录结构文件 META-INF\services\java.sql.Driver。 在这个文件写上具体的driver类名,例如com.mysql.jdbc.Driver
      —tempReadHostAvailable
        如果配置了这个属性 writeHost 下面的 readHost 仍旧可用,默认 0 可配置(0、1)。
      1
      2
      3
      4
      5
      6
      <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
      <heartbeat>select user()</heartbeat>
      <writeHost host="hostM1" url="192.168.1.100:3306" user="root" password="123456">
      <readHost host="hostS1" url="192.168.1.101:3306" user="root" password="123456" />
      </writeHost>
      </dataHost>
    6. heartbeat标签
        这个标签内指明用于和后端数据库进行心跳检查的语句。例如:MYSQL 可以使用 select user(),Oracle 可以使用 select 1 from dual 等。
        这个标签还有一个 connectionInitSql 属性,主要是当使用 Oracla 数据库时,需要执行的初始化 SQL 语句就放到这里面来。例如:alter session set nls_date_format=’yyyy-mm-dd hh24:mi:ss ‘
      1.4 主从切换的语句必须是:show slave status

    7. writeHost /readHost 标签
        这两个标签都指定后端数据库的相关配置,用于实例化后端连接池。唯一不同的是,writeHost 指定写实例、readHost 指定读实例。
        在一个 dataHost 内可以定义多个 writeHost 和 readHost。但是,如果 writeHost 指定的后端数据库宕机,那么这个 writeHost 绑定的所有 readHost 都将不可用。
        另一方面,由于这个 writeHost 宕机,系统会自动的检测到,并切换到备用的 writeHost 上去。这两个标签的属性相同,这里就一起介绍。
      —host 用于标识不同实例,一般 writeHost 我们使用M1,readHost我们用S1。
      —url 后端实例连接地址。Native:地址:端口 JDBC:jdbc的url
      —password 后端存储实例需要的密码
      —user 后端存储实例需要的用户名字
      —weight 权重 配置在 readhost 中作为读节点的权重
      —usingDecrypt 是否对密码加密,默认0。具体加密方法看官方文档。