濮阳杆衣贸易有限公司

主頁 > 知識庫 > mysql/Java服務(wù)端對emoji的支持與問題解決方法詳解

mysql/Java服務(wù)端對emoji的支持與問題解決方法詳解

熱門標(biāo)簽:怎么在地圖標(biāo)注位置生成圖片 真人語音電話機(jī)器人 美國反騷擾電話機(jī)器人 電銷卡外呼系統(tǒng)供應(yīng)商 福建外呼系統(tǒng)定制化 悟空科技電話機(jī)器人 銅陵防封電銷卡 騰訊地圖標(biāo)注提升 400電話可以免費(fèi)申請嗎

本文實(shí)例講述了mysql Java服務(wù)端對emoji的支持與問題解決方法。分享給大家供大家參考,具體如下:

問題描述

將底層抓取的微博數(shù)據(jù)存入mysql,有些數(shù)據(jù)存入失敗,查看Tomcat后,核心錯誤信息如下:

// 拋出字符集不支持的異常
sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1

原因分析

  • MYSQL 5.5 之前, utf8 編碼只支持1~3個字節(jié),即BMP這部分的unicode編碼區(qū)(基本就是0000~FFFF這一區(qū))。
  • Emoji表情是4個字節(jié),而mysql的utf8編碼最多3個字節(jié),所以導(dǎo)致數(shù)據(jù)插不進(jìn)去
  • 5.5之后,mysql加入utf8mb4編碼,可支持4個字節(jié),即一個字符最多能有4字符,因此utf8mb4編碼可支持更多的字符集。
  • 因此,如果項(xiàng)目要存儲移動產(chǎn)品的用戶文本,必須將DB字符集從UTF8/GBK等傳統(tǒng)字符集升級到utf8mb4

【注】

  • utf8mb4兼容utf8,且比utf8能表示更多的字符。所以將DB字符集從UTF8或GBK等傳統(tǒng)字符集升級到utf8mb4時不用擔(dān)心字符的兼容性問題

解決方法

過濾特殊的表情符

content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]", "");// 簡單粗暴,不人性化

升級數(shù)據(jù)庫字符集

1、utf8mb4支持的mysql版本為5.5.3+,若mysql低于該版本請先升級

2、修改database、table和column字符集

3、修改mysql配置文件my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到后在以下三部分里添加如下內(nèi)容:

[client] default-character-set = utf8mb4

[mysql] default-character-set = utf8mb4

[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'

4、重啟mysql并查看字符集

在mysql命令行輸入:

SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';

重啟之前的字符集

重啟之后的字符集

【注】

  • 必須保證以下字段為utf8mb4
    • character_set_client
    • character_set_connection
    • character_set_database
    • character_set_results
    • character_set_server

以上4步完成后,利用mysql客戶端navicat在表中手動加入Emoji表情⛄,若能保存成功說明數(shù)據(jù)庫已升級成功。

這些字符集配置的具體區(qū)別參考 深入Mysql字符集設(shè)置

5、檢查服務(wù)器端db配置文件

// 配置spring時使用的鏈接如下:
url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=trueuseUnicode=truezeroDateTimeBehavior=convertToNulltransformedBitIsBoolean=trueautoReconnect=trueautoReconnectForPools=truefailOverReadOnly=falsemaxReconnects=10"
// 若characterEncoding=utf8mb4,插入數(shù)據(jù)時報錯Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4'
// 去掉characterEncoding或characterEncoding=utf8

Emoji表情

android系統(tǒng)中,搜狗、百度輸入法自帶Emoji表情。

【注】

如果系統(tǒng)之間Emoji表情符號不兼容,只能看到方塊;

更多關(guān)于MySQL相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《MySQL常用函數(shù)大匯總》、《MySQL日志操作技巧大全》、《MySQL事務(wù)操作技巧匯總》、《MySQL存儲過程技巧大全》及《MySQL數(shù)據(jù)庫鎖相關(guān)技巧匯總》

希望本文所述對大家MySQL數(shù)據(jù)庫計(jì)有所幫助。

您可能感興趣的文章:
  • MySQL mysqladmin客戶端的使用簡介
  • MySQL 如何連接對應(yīng)的客戶端進(jìn)程
  • 解決MySql客戶端秒退問題(找不到my.ini)
  • PHP Swoole異步MySQL客戶端實(shí)現(xiàn)方法示例
  • 解決Node.js mysql客戶端不支持認(rèn)證協(xié)議引發(fā)的問題
  • mysql8.0.11客戶端無法登陸的解決方法
  • 初識NodeJS服務(wù)端開發(fā)入門(Express+MySQL)
  • 用于App服務(wù)端的MySQL連接池(支持高并發(fā))
  • 解讀MySQL的客戶端和服務(wù)端協(xié)議

標(biāo)簽:湖南 湖北 云浮 臨汾 白銀 烏海 聊城 武威

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《mysql/Java服務(wù)端對emoji的支持與問題解決方法詳解》,本文關(guān)鍵詞  mysql,Java,服務(wù),端,對,emoji,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《mysql/Java服務(wù)端對emoji的支持與問題解決方法詳解》相關(guān)的同類信息!
  • 本頁收集關(guān)于mysql/Java服務(wù)端對emoji的支持與問題解決方法詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    台南市| 上虞市| 敖汉旗| 靖西县| 从江县| 拉萨市| 昆明市| 华阴市| 德化县| 阜南县| 抚宁县| 安龙县| 潜江市| 揭东县| 新河县| 肥城市| 济宁市| 平罗县| 潼关县| 行唐县| 余姚市| 梁平县| 元阳县| 酉阳| 皮山县| 临洮县| 开平市| 丹寨县| 阳朔县| 阜阳市| 乐亭县| 巴南区| 加查县| 泸州市| 政和县| 瓦房店市| 鹿邑县| 盐源县| 和田县| 迁安市| 大同市|