Kettle导入四字节的 UTF-8 字符(CJK 统一表意文字扩展 B 区)出错

  1. 修改 Kettle 连接参数

在数据库连接的“选项”标签页中,设置:

  • useUnicode:值填 true
  • characterEncoding:值填 utf8(注意:这里填 utf8 即可,JDBC 驱动会自动识别并支持四字节字符,不要填 utf8mb4,驱动可能不认识)
  • 在连接时执行初始化命令

这是最关键的一步。在 Kettle 连接配置的“高级”标签页中,添加一条命令:


这条命令会强制告诉 MariaDB 服务器:“我这个客户端用的是真正的、完整的 UTF-8 编码”,从而彻底绕过服务端的猜测逻辑。