C语言中如何判断utf8编码

2023-06-28,

本文小编为大家详细介绍“C语言中如何判断utf8编码”,内容详细,步骤清晰,细节处理妥当,希望这篇“C语言中如何判断utf8编码”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

实例代码:

int utf8_check(const char* str, size_t length) { 
  size_t i; 
  int nBytes; 
  unsigned char chr; 
 
  i = 0; 
  nBytes = 0; 
  while (i < length) { 
    chr = *(str + i); 
 
    if (nBytes == 0) { //计算字节数 
      if ((chr & 0x80) != 0) { 
        while ((chr & 0x80) != 0) { 
          chr <<= 1; 
          nBytes++; 
        } 
        if ((nBytes < 2) || (nBytes > 6)) { 
          return 0; //第一个字节最少为110x xxxx 
        } 
        nBytes--; //减去自身占的一个字节 
      } 
    } else { //多字节除了第一个字节外剩下的字节 
      if ((chr & 0xC0) != 0x80) { 
        return 0; //剩下的字节都是10xx xxxx的形式 
      } 
      nBytes--; 
    } 
    i++; 
  } 
  return (nBytes == 0); 
}

读到这里,这篇“C语言中如何判断utf8编码”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注本站行业资讯频道。

《C语言中如何判断utf8编码.doc》

下载本文的Word格式文档,以方便收藏与打印。