转换多字节与UTF-8、Unicode之间的转换

unicode转换  时间:2021-04-12  阅读:()

多字节与UTF-8、 Unicode之间的转换

VC中Ansi、 Unicode、 UTF8字符串之间的转换和写入文本

An si字符串我们最熟悉英文占一个字节汉字2个字节 以一个\0结尾常用于txt文本文件

Unicode字符串每个字符(汉字、英文字母)都占2个字节 以2个连续的\0结尾 NT操作系统内核用的是这种字符串常被定义为typedef unsigned short wchar_t;所以我们有时常会见到什么char*无法转换为unsigned short*之类的错误其实就是unicode

UTF8是Unicode一种压缩形式英文A在unicode中表示为0x0041 老外觉得这种存储方式太浪费因为浪费了50%的空间于是就把英文压缩成1个字节成了u tf8编码但是汉字在u tf8中占3个字节显然用做中文不如a ns i合算这就是中国的网页用作a n s i编码而老外的网页常用utf8的原因。

UTF8在还游戏里运用的很广泛 比如WOW的lua脚本等

下面来说一下转换主要用代码来说明吧

写文件我用了CFi le类其实用FILE*之类的也是一样写文件和字符串什么类别没有关系硬件只关心数据和长度

Ansi转Unicode

介绍2种方法void CConvertDlg: :OnBnCl ickedButtonAnsiToUnicode()

{

//ansi to unicodechar*szAnsi="abcd1234你我他";

//预转换得到所需空间的大小int wcsLe n =: :MultiByteToWideChar(CP_ACP, NULL, szAnsi , strlen(szAnsi), NULL,

0);

//分配空间要给'\0'留个空间 MultiByteToWideChar不会给'\0'空间wchar_t*wszString=newwchar_t[wcsLen+1];

//转换

: :MultiByteToWideChar(CP_ACP,NULL,szAnsi ,strlen(szAnsi),wszSt ring,wcsLen);

//最后加上'\0'wszString[wcsLen]='\0';

//unicode版的MessageBoxAPI

: :MessageBoxW(GetSafeHwnd(),wszString,wszString,MB_OK);

//接下来写入文本

//写文本文件头2个字节0xfeff低位0xff写在前

CFi lecFi le;cFi le.Open(_T("1 .txt"),CFi le: :modeWrite|CFi le: :modeCreate);

//文件开头cFi le.SeekToBegin();cFi le.Write("\xff\xfe",2);

//写入内容cFi le.Write(wszString,wcsLen*sizeof(wchar_t));cFi le.Flush();cFi le.Close();delete[]wszString;wszSt ring=NULL;

//方法2

//设置当前地域信息不设置的话使用这种方法 中文不会正确显示

//需要#include<locale.h>setlocale(LC_CTYPE, "chs");wchar_t wcsStr[100];

//注意下面是大写S在unicode中代表后面是ansi字符串

//swprintf是sprintf的unicode版本

//格式的前面要加大写L代表是unicodeswprintf(wcsStr, L"%S",szAns i);

: :MessageBoxW(GetSafeHwnd(),wcsStr,wcsStr,MB_OK);

}

Unicode转Ansi

也是2种方法void CConvertDlg: :OnBnCl ickedButtonUnicodeToAnsi()

{

//unicode to ansiwchar_t*wszString=L"abcd1234你我他";

//预转换得到所需空间的大小这次用的函数和上面名字相反int ansiLen =: :WideCharToMultiByte(CP_ACP, NULL,wszString,wcslen(wszString),NULL,0,NULL,NULL);

//同上分配空间要给'\0'留个空间char*szAnsi=newchar[ansiLen+1];

//转换

//unicode版对应的strlen是wcslen

: :WideCharToMultiByte(CP_ACP, NULL, wszString, wcslen(wszSt ring), szAnsi ,ansiLen,NULL,NULL);

//最后加上'\0'szAnsi[ansiLen]='\0' ;

//Ansi版的MessageBoxAPI

: :MessageBoxA(GetSafeHwnd(),szAnsi ,szAnsi ,MB_OK);

//接下来写入文本

//写文本文件 ANSI文件没有BOM

CFi lecFi le;cFi le.Open(_T("1.txt"),CFi le: :modeWrite|CFi le: :modeCreate);

//文件开头cFi le.SeekToBegin();

//写入内容cFi le.Write(szAnsi ,ansiLen*sizeof(char));cFi le.Flush();cFi le.Close();delete[]szAnsi ;szAnsi=NULL;

//方法2

//和上面一样有另一种方法setlocale(LC_CTYPE, "chs");char szStr[100];

//注意下面是大写在ansi中代表后面是unicode字符串

//sprintfsprintf(szStr, "%S",wszSt ring);

: :MessageBoxA(GetSafeHwnd(),szStr,szStr,MB_OK);

}

Unicode转UTF8void CConvertDlg: :OnBnCl ickedButtonUnicodeToU8()

{

//unicode to UTF8wchar_t*wszString=L"abcd1234你我他";

//预转换得到所需空间的大小这次用的函数和上面名字相反int u 8Len =: :WideCharToMultiByte(CP_UTF8, NULL,wszSt ring,wcslen(wszString),NULL,0,NULL,NULL);

//同上分配空间要给'\0'留个空间

//UTF8虽然是Unicode的压缩形式但也是多字节字符串所以可以以char的形式保存char*szU8=new char[u8Len+1];

//转换

//unicode版对应的strlen是wcslen

: :WideCharToMultiByte(CP_UTF8,NULL,wszSt ring,wcslen(wszString), szU8, u8Len,NULL,NULL);

//最后加上'\0'szU8[u8Len]='\0' ;

//MessageBox不支持UTF8,所以只能写文件

//接下来写入文本

//写文本文件 UTF8的BOM是0xbfbbef

CFi lecFi le;cFi le.Open(_T("1 .txt"),CFi le: :modeWrite|CFi le: :modeCreate);

//文件开头cFi le.SeekToBegin();

//写BOM 同样低位写在前cFi le.Write("\xef\xbb\xbf",3);

//写入内容cFi le.Write(szU8, u8Len*sizeof(char));cFi le.Flush();cFi le.Close();delete[]szU8;szU8=NULL;

}

UTF8转UNICO DEvoid CConvertDlg: :OnBnCl ickedButtonU8ToUnicode()

{

//UTF8 to Unicode

//由于中文直接复制过来会成乱码编译器有时会报错故采用16进制形式char*szU8="abcd 1234\xe4\xbd\xa0\xe6\x88\x91\xe4\xbb\x96\x00";

//预转换得到所需空间的大小int wcsLen=: :MultiByteToWideChar(CP_UTF8,NULL,szU8,strlen(szU8),NULL,0);//分配空间要给'\0'留个空间 MultiByteToWideChar不会给'\0'空间wchar_t*wszString=newwchar_t[wcsLen+1];

//转换

: :MultiByteToWideChar(CP_UTF8,NULL,szU8,strlen(szU8),wszString,wcsLen);//最后加上'\0'wszString[wcsLen]='\0';

//unicode版的MessageBoxAPI

: :MessageBoxW(GetSafeHwnd(),wszString,wszString,MB_OK);

//写文本同ansi to unicode

}

An si转换utf8和utf8转换An si就是上面2个的结合把u n icod e作为中间量进行2次转换即可

#include<iostream>

#include<string>

#include<Windows.h>using namespace std;

void unicodeToUTF8(constwstring&src,string&result)

int n=WideCharToMultiByte(CP_UTF8,0,src.c_str(), -1 ,0,0,0,0);result.resize(n);

: :WideCharToMultiByte(CP_UTF8,0,src.c_str(), -1 , (char*)result.c_str(), result. length(),0,0);

void unicodeToGB2312(constwstring&wstr ,string&result)

int n=WideCharToMultiByte(CP_ACP, 0,wstr.c_str(), -1 ,0,0,0,0);result.resize(n);

: :WideCharToMultiByte(CP_ACP, 0,wstr.c_str(), -1 , (char*)result.c_str(), n,0,0);

void utf8ToUnicode(const string&src,wstring&result)

int n=MultiByteToWideChar(CP_UTF8,0,src.c_str(), -1 ,NULL,0);result.resize(n);

: :MultiByteToWideChar(CP_UTF8,0,src.c_str(), -1 , (LPWSTR)result.c_str(), result. len g th());

void gb2312ToUnicode(const string&src,wstring&result)

int n=MultiByteToWideChar(CP_ACP, 0,src.c_str(), -1 ,NULL,0);result.resize(n);

: :MultiByteToWideChar(CP_ACP, 0,src.c_str(), -1 , (LPWSTR)result.c_str(), result. length());

ucloud香港服务器优惠活动:香港2核4G云服务器低至358元/年,968元/3年

ucloud香港服务器优惠降价活动开始了!此前,ucloud官方全球云大促活动的香港云服务器一度上涨至2核4G配置752元/年,2031元/3年。让很多想购买ucloud香港云服务器的新用户望而却步!不过,目前,ucloud官方下调了香港服务器价格,此前2核4G香港云服务器752元/年,现在降至358元/年,968元/3年,价格降了快一半了!UCloud活动路子和阿里云、腾讯云不同,活动一步到位,...

Krypt($120/年),2vCPU/2GB/60GB SSD/3TB

Krypt这两天发布了ION平台9月份优惠信息,提供一款特选套餐年付120美元(原价$162/年),开设在洛杉矶或者圣何塞机房,支持Windows或者Linux操作系统。ion.kryptcloud.com是Krypt机房上线的云主机平台,主要提供基于KVM架构云主机产品,相对于KT主站云服务器要便宜很多,产品可选洛杉矶、圣何塞或者新加坡等地机房。洛杉矶机房CPU:2 cores内存:2GB硬盘:...

raksmart:年中大促,美国物理机$30/月甩卖;爆款VPS仅月付$1.99;洛杉矶/日本/中国香港多IP站群$177/月

RAKsmart怎么样?RAKsmart发布了2021年中促销,促销时间,7月1日~7月31日!,具体促销优惠整理如下:1)美国西海岸的圣何塞、洛杉矶独立物理服务器低至$30/月(续费不涨价)!2)中国香港大带宽物理机,新品热卖!!!,$269.23 美元/月,3)站群服务器、香港站群、日本站群、美国站群,低至177美元/月,4)美国圣何塞,洛杉矶10G口服务器,不限流量,惊爆价:$999.00,...

unicode转换为你推荐
北京市儿童福利院access数据库修复请问Access数据库修复恢复该怎么办啊,有些页和模块打不开了,也不知道是怎么回事,丢了文件还企业建网站企业建网站有什么用?建企业网站建立一个企业网站要多少费用支付宝调整还款日花呗调整还款日算延期吗?重庆杨家坪猪肉摊主杀人重庆一市民发现买的新鲜猪肉晚上发蓝光.专家解释,猪肉中含磷较多且携带了一种能发光的细菌--磷光杆菌时discuz伪静态求虚拟主机Discuz 伪静态设置方法引擎收录怎么使自己的网站被搜索引擎收录呢?广告管理系统求一份广告公司管理制度,要详细点,包括奖惩条例,抽成这些。盛大通行证登录手机注册的盛大通行证进盛大游戏时账号是什么?
四川虚拟主机 yaokan永久域名经常更换 如何查询域名备案号 购买域名和空间 星星海 softlayer 博客主机 免费网站监控 天猫双十一抢红包 hnyd 52测评网 anylink 免费防火墙 域名和空间 如何安装服务器系统 支持外链的相册 华为云盘 免费asp空间申请 wordpress中文主题 空间服务器 更多