TDSQL迁移,myloader:39626报错问题的排查与解决
背景介绍
TDSQL平台下,某系统由于业务需求,要将其中三个数据库迁移至其他实例。TDSQL拥有DCN同步以及多源同步等迁移功能,但是由于前期部署规划问题并没有安装相关组件,因此综合考虑后,决定使用mydumper进行数据冷迁移。
正文
cd /data/home/tdsql/tdsqlinstall/mysqlagent/bin
./mydumper -u数据库用户名 -p 密码 -h 源实例网关地址 -P 网关端口 -B 数据库名 --threads=线程数 --outputdir=导出目录 --events --routines --triggers --less-locking
Mydumper参数说明
–events :备份事件。
–routines :备份存储过程和函数。
–triggers :备份触发器。
–less-locking :减少对 InnoDB 表的锁施加时间。
–ignore-sysdb :忽略 Sysdb 库和 MySQL 库。
–chunk-filesize :将表按大小分块时,指定的块大小,单位是 MB。
–complete-insert :使用完整的 insert 语句(包含列名称)。
–outputdir :导出的目录。
–complete-insert, -c :使用完整的 insert 语句(包含列名称)。
–single-transaction :该选项在导出数据之前提交一个 BEGIN SQL 语句, BEGIN 不会阻塞任何应用程序且能保证导出时数据库的一致性状态。
–add-drop-database :每个数据库创建之前添加 drop 数据库语句。
–add-drop-table :每个数据表创建之前添加 drop 数据表语句。(默认为打开状态,使用–skip-add-drop-table 取消选项)
–add-locks :在每个表导出之前增加 LOCK TABLES 并且之后 UNLOCK TABLE。(默认为打开状态,使用–skip-add-locks 取消选项)
–set-gtid-purged=OFF :这个选项可以取消 GTID 信息写入 dump 文件。
./myloader -u-u数据库用户名 -p 密码 -h 新实例网关地址 -P 新网关端口 -v 1 --threads=线程数 --outputdir=导出目录 --enable-binlog
Myloader参数说明
–enable-binlog 启用还原数据的二进制日志。
–overwrite-tables 如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构。
导出导入的操作比较简单,需要注意的是threads配置数不宜过大,否则会过多占用DB机器的资源,最终影响业务系统的性能;另外需要先预估导出数据文件的大小,导出路径应该留有充足的空间(不建议导出到根目录)。
在导入完成后,有几个表出现如下报错:
** (myloader:39626): CRITICAL **: Error restoring cgdb.eval_rec_status from file cgdb.eval_rec_status.sql: Duplicate entry '0' for key 'PRIMARY'
** (myloader:39626): CRITICAL **: Error restoring cgdb.databasechangelog from file cgdb.databasechangelog.sql: Duplicate entry '0' for key 'PRIMARY'
与源环境进行了数据比对,发现以上报错的两个表在新环境下,创建成功但是无数据导入。
根据报错相关信息,发现这几张表并无主键,导出表语句(db.table-schema.sql)如下:
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;
CREATE TABLE `databasechangelog` (
`ID` varchar(255) NOT NULL,
`AUTHOR` varchar(255) NOT NULL,
`FILENAME` varchar(255) NOT NULL,
`DATEEXECUTED` datetime DEFAULT NULL,
`ORDEREXECUTED` int(11) NOT NULL,
`EXECTYPE` varchar(10) NOT NULL,
`MD5SUM` varchar(35) DEFAULT NULL,
`DESCRIPTION` varchar(255) DEFAULT NULL,
`COMMENTS` varchar(255) DEFAULT NULL,
`TAG` varchar(255) DEFAULT NULL,
`LIQUIBASE` varchar(20) DEFAULT NULL,
`CONTEXTS` varchar(255) DEFAULT NULL,
`LABELS` varchar(255) DEFAULT NULL,
`DEPLOYMENT_ID` varchar(10) DEFAULT NULL
) ENGINE=InnoDB AUTO_INCREMENT=10108 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC;
插入数据的语句(db.table.sql)如下:
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;
/*!40103 SET TIME_ZONE='+00:00' */;
INSERT INTO `databasechangelog` VALUES('xxx’,’xxx’,’xxx’...省略若干数据);
从以上信息可以得知这张表并无主键,但是为何会出现主键相关报错,决定去排查源环境下的表结构。
源环境下该表有一个名为tdsql_pk_auto_implicit的主键。当一个表创建时没有指定主键,那么TDSQL会自动创建一个主键,另外值得一提的是,该主键只能通过jmysql的方式才可见,业务用户是无法查到该主键的。
同理,在新环境下没有主键的表也会自动创建名为tdsql_pk_auto_implicit的主键,这样就可以理解为什么会有 (myloader:39626): Duplicate entry '0’ for key 'PRIMARY’这条报错了,因为插入数据的语句格式为:INSERT INTO databasechangelog
VALUES('xxx’,’xxx’,’xxx’…省略若干数据); 并没有指定列名。
想要指定列名,在mydumper工具中可以使用参数 --complete-insert,(使用包含列名称的insert 语句)导出,结果如下:
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;
/*!40103 SET TIME_ZONE='+00:00' */;
INSERT INTO `databasechangelog` (`ID`,`AUTHOR`,`FILENAME`,`DATEEXECUTED`,`ORDEREXECUTED`,`EXECTYPE`,`MD5SUM`,`DESCRIPTION`,`COMMENTS`,`TAG`,`LIQUIBASE`,`CONTEXTS`,`LABELS`,`DEPLOYMENT_ID`) VALUES('xxx’,’xxx’,’xxx’...省略若干数据);
再次使用myloader导入,成功无报错,至此问题解决。
TDSQL中,无主键的表会自动创建一个名为tdsql_pk_auto_implicit的主键,该主键只能通过jmysql的方式才可见,业务用户无法查到该主键。这类表在使用myloader导入时,需要使用–complete-insert参数,生成的导入语句需要指定列名,否则会导入失败。
墨天轮原文链接:https://www.modb.pro/db/108754?sjhy(复制到浏览器或者点击“阅读原文”立即查看)
小云为云和恩墨大讲堂粉丝带来专属福利
云和恩墨大讲堂 | 一个分享交流的地方