文档

由于网站程序中的中文编码不一致导致网页出现乱码

更新时间:

本文为您介绍访问网站页面时,由于网站程序中存在中文编码不一致而导致网页出现乱码的可能原因和解决方案。

问题描述

访问网站页面时出现乱码现象。

问题原因

程序代码中常见的三种中文编码分别是GB2312(简体中文)、GBK(国标)、BIG5(繁体中文),可能会因为网站页面中的程序中文编码不一致,即网站程序中使用GB2312(简体中文)、GBK(国标)、BIG5(繁体中文)混合的编码方式而导致访问网站时出现乱码现象。

解决方案

您可以使用Windows操作系统自带的API函数来实现三种常见中文编码的转换,通过本文介绍的转换方法可以解决网站页面出现乱码的问题。

本文主要介绍如下编码的四种转换方式:

说明

关于GB2312和BIG5之间的转换,您可以通过GBK间接实现。以GB2312=>BIG5为例,您只需要先将GB2312转换成GBK,然后再将GBK转换成BIG5。

BIG5=>GBK

void BIG52GBK(char szBuf)
{
  if(!strcmp(szBuf, ""))
   return;
  int nStrLen = strlen(szBuf);
  wchar_t pws = new wchar_t[nStrLen + 1];
  try
  {
   int nReturn = MultiByteToWideChar(950, 0, szBuf, nStrLen, pws, nStrLen + 1);
   BOOL bValue = false;
   nReturn = WideCharToMultiByte(936, 0, pws, nReturn, szBuf, nStrLen + 1, "?", &bValue);
   szBuf[nReturn] = 0;
  }
  __finally
  {
   delete[] pws;
  }
}

GBK=>BIG5

void GBK2BIG5(char szBuf)
{
  if(!strcmp(szBuf, ""))
   return ;
  int nStrLen = strlen(szBuf);
  wchar_t pws = new wchar_t[nStrLen + 1];
  try
  {
   MultiByteToWideChar(936, 0, szBuf, nStrLen, pws, nStrLen + 1);
   BOOL bValue = false;
   WideCharToMultiByte(950, 0, pws, nStrLen, szBuf, nStrLen + 1, "?", &bValue);
   szBuf[nStrLen] = 0;
  }
  finally
  {
   delete[] pws;
  }
}

GB2312=>GBK

void GB2GBK(char szBuf)
{
  if(!strcmp(szBuf, ""))
   return;
  int nStrLen = strlen(szBuf);
  WORD wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
  int nReturn = LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nStrLen, NULL, 0);
  if(!nReturn)
   return;
  char pcBuf = new char[nReturn + 1];
  try
  {
   wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_PRC);
   LCMapString(wLCID, LCMAP_TRADITIONAL_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
   strncpy(szBuf, pcBuf, nReturn);
  }
  finally
  {
   delete[] pcBuf;
  }
}

GBK=>GB2312

void GBK2GB(char szBuf)
{
  if(!strcmp(szBuf, ""))
   return;
  int nStrLen = strlen(szBuf);
  WORD wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
  int nReturn = LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nStrLen, NULL, 0);
  if(!nReturn)
   return;
  char pcBuf = new char[nReturn + 1];
  try
  {
   wLCID = MAKELCID(MAKELANGID(LANG_CHINESE, SUBLANG_CHINESE_SIMPLIFIED), SORT_CHINESE_BIG5);
   LCMapString(wLCID, LCMAP_SIMPLIFIED_CHINESE, szBuf, nReturn, pcBuf, nReturn + 1);
   strncpy(szBuf, pcBuf, nReturn);
  }
  finally
  {
   delete []pcBuf;
  }
}
// 调用示例
   ……
  char sourceEncode[255];
  char szBuf[1024];
  // 从GB2312转到GBK
  strcpy(szBuf, sourceEncode);
  GB2GBK(szBuf);
  // 从GB2312转到BIG5,通过GBK中转
  strcpy(szBuf, sourceEncode);
  GB2GBK(szBuf);
  GBK2BIG5(szBuf);  
   ……
}
  • 本页导读 (1)