C++ Primer 5th 阅读笔记:变量和基本类型

2023-07-29,,

一些语言的公共特性

内建类型,如整型,字符型等;
变量,为值绑定的一个名字;
表达式和语句,操作值。
分支和循环,允许我们条件执行和重复执行;
函数,定义抽象计算单元。

扩展语言的方式

自定义类型;
标准库。

本章重点

学习语言的基本知识和标准库。

内建类型;
简要介绍自定义类。

类型

定义了数据的意义;
定义了数据的操作;

从二进制的角度看,类型定义了数据占用几个 bit,以及如何解释这些 bit

基本内建类型

算术类型

整型
字符型
布尔型
浮点型
特殊类型:void

算术类型

整型 (integral types)

bool: 两个值 truefalse
char:可以包含 basic character set 中的字符对应的数字。大小等于一个机器字节(single machine byte)。
wchar_tchar16_tchar32_t。用于 extended character sets

wchar_t 可以包含最大 extended character sets 中字符对应的数字。(Windows 2 字节;Unix 4 字节)

char16_tchar32_t 用于 Unicode 字符。

有关 char 的进一步讨论,见 Byte是8位吗?—C语境中的Byte及C语言的char类型

浮点型 (floating-point types)

标准没有定义具体的数据格式。一般使用的都是 IEEE 格式。

关于浮点数的详细介绍可见:IEEE 754浮点数标准详解

符号

有符号:signed int/intsigned short/shortsigned long/longsigned long long/long longsigned char

标准没有定义具体的数据格式。一般为补码。
无符号:unsigned int/unsignedunsigned shortunsigned longunsigned long longunsigned char
特殊:char 有无符号看编译器的实现。

算术类型的经验法则

    不包含负数,使用无符号数。
    使用 int 来进行整数运算。 short 太小,long 一般和 int 一样大。如果数字太大使用 long long
    不要在算术运算中使用 charbool。可以在算术运算中使用 signed charunsigned char
    浮点数运算使用 doublefloat 精度有限且带来执行效率上的提升不大。long double 的计算开销过大,一般不使用。

类型转换

赋值语句

左值类型:bool

右值类型:非 bool

转换规则:0 -> false, ≠0 -> true
左值类型:非 bool

右值类型:bool

转换规则:false -> 0, true -> 1
左值类型:整型

右值类型:浮点型

转换规则:f -> int(f)
左值类型:浮点型

右值类型:整型

转换规则:z -> z.00
左值类型:无符号数
右值类型:超出范围的数

转换规则:n -> n % Nn 是超出范围的数, N 是无符号类型能表示的所有值的个数

表达式

如果在算数表达式中同时出现 有符号数无符号数,所有 有符号数 转换为 无符号数

一例无限循环的错误代码,

// WRONG: u can never be less than 0; the condition will always succeed
for (unsigned u = 10; u >= 0; --u)
std::cout << u << std::endl

有关 有符号数无符号数 的一些资料:

c++ - Adding two unsigned char variables and result is int - Stack Overflow
C++中在什么情况下使用无符号类型,为什么? - 知乎
C++有符号和无符号之间的转换 - 知乎
给一个无符号数赋值一个负数,并且该负数绝对值上溢,编译器是如何处理的呢? - 知乎

未定义的行为和实现定义的行为

避免未定义的行为(undefined behavior)和实现定义的行为(implementation-defined behavior)。使用这些行为可能造成程序不可移植(nonportable)。

建议参考以下的文章:

C++中的"未定义的行为"
C++ 未定义行为
C++程序员需要知道的未定义行为

字面量

整型

整数 20 的三种表示法

十进制:20
八进制:0240 开头
十六进制:0x140x 开头

十进制字面量默认都是 有符号数

八进制和十六进制则可以为 有符号数 或者 无符号数

十进制字面量的类型为 intlonglong long 中可以容纳字面量值的最小类型。

八进制和十六进制的类型为 intunsigned intlongunsigned longlong longunsigned long long 中可以容纳字面量值的最小类型。

如果最大类型也不能容纳字面量,则将引起一个错误。

注意: -42 不是字面量,42 才是字面量,- 在其中作为相反数的操作符。

浮点型

浮点数的字面量包含了小数点或者指数(使用科学计数法)。指数使用 e 或者 E 来表示。

3.14159
3.14159E0
0.
0e0.001

科学记数法的形式是由两个数的乘积组成,aEb = a×10^b

浮点型字面量的默认类型是 double

字符和字符串字面量

字符字面量,包含在单引号中的一个字符 'a'
字符串字面量,包含在双引号中的 0 个或多个字符 "abcd"

字符串字面量是一个字符数组,每个字符串字面量的最后都会有一个 零字符 '\0'(null character)。

多个相邻的字符串字面量会被自动拼接成一个字符串字面量,比如,

// multiline string literal
std::cout << "a really, really long string literal "
"that spans two lines" << std::endl;

转义序列

转义序列用于表示 非打印字符 或者有特殊含义的字符(如,单引号、双引号)。

转义序列使用 \ 开头。

一般化的转义序列:

\ 后面跟 1 到 3 个八进制数字(0-7);
\x 后面跟 1 或者多个十六进制数字(0-f)。

注意:

如果 \ 后面跟了四个及以上的八进制数,只有前三个字符会被解释成一般化的转义序列;
如果 \x 后面跟了多个十六进制数,十六进制数会用尽所有的数来表示一个字符。

参考资料:

Escape sequence for ? in c++

字面量类型

我们可以通过添加前缀(针对字符字面量或者字符串字面量)或者后缀(针对整型字面量或者浮点数字面量)的方式来修改默认的字面量类型。

最佳实践:在使用 L 作为后缀时,建议使用大写 L, 而不要使用小写 l,目的是为了区分字母 l 和数字 1

注意:后缀只是指定了字面量能接受的最小类型,如果字面量的值无法被容纳在这个最小类型内,字面量将会尝试下一个更大的类型。

其他字面量

bool 字面量:truefalse
指针字面量: nullptr

参考资料:

c++nullptr(空指针常量)、constexpr(常量表达式)

变量和对象的区别

在本书中的变量和对象没有区别!

变量定义

    变量类型指示符(type specifier)
    一个或者多个变量名(使用逗号隔开)

    2.1. 可以为变量指定一个初始值(可选)
    分号 ; 结束

示例:

int sum = 0, value, units_sold = 0;
Sales_item item;
std::string book("0-201-78345-X");

初始化

可以使用之前定的变量来进行初始化;
初始化和赋值在 C++ 中是两个不同的操作;

示例:

double price = 109.99, discount = price * 0.16;
double salePrice = applyDiscount(price, discount);

关于初始化与赋值的区别,可以查看 CSDN 初始化与赋值的区别

对于基本数据类型,二者是没有任何区别,对于非基本数据类型,在写法与效率上有许多不同。

列表初始化

四种初始化的方式:

int units_sold = 0;
int units_sold = {0};
int units_sold{0};
int units_sold(0);

C++11 中使用花括号来初始化内建类型,如果存在类型转换且具有数据丢失的风险,则编译器将会报错。

long double ld = 3.1415926536;
int a{ld}, b = {ld}; // error: narrowing conversion required
int c(ld), d = ld; // ok: but value will be truncated

关于花括号初始化的更多内容,可以参考: C++11 花括号初始化

关于 initializer 的解释,可以参考 Initializers

默认初始化

变量的初始化取决于:

变量的类型
变量定义的位置

内建类型:

定义在函数外的变量会被初始化为 0
定义在函数内的变量不会被初始化(uninitialized)

变量声明(Declaration)和变量定义(Definition)

声明

变量声明指定了变量的类型和名称。

定义

变量定义也是变量声明。

变量定义指定了变量的类型和名称。

变量定义分配存储空间。

变量定义可以指定一个初始值(可选)。

如何声明一个变量?

    添加 extern 关键字;
    不要提供初始值。
extern int i; // declares but does not define i
int j; // declares and defines j

任何包含初始值的声明都是定义。

extern double pi = 3.1416; // definition

注意:变量可以被声明多次,但只能被定义一次。

关于声明和定义的参考资料

为什么c++要“在头文件中声明,在源文件中定义”? - 知乎!
C语言关键字extern详解 - 知乎!

标识符

由字母、数字、下划线组成;
无长度限制;
大小写敏感;

语言保留字

标准库保留字

不能出现两个连续的下划线,如 __i;
不能下划线之后跟着大写字母,如 _I;
函数外的标识符,不能以下划线开头,如:

int _i; // WARNING: DISALLOW!
int main()
{
...
}

关于保留字的参考资料:

C/C++中的保留字_准备开始胡乱学代码的凯的博客-CSDN博客_c++保留字
C++标准库及其保留字(关键字)——附:C++标准文档

命名习惯

名称应符合它的用法;
变量一般是小写字母,如 index
类名称通常以大写字母开头,如 Sales_item
名字多个单词之间需要加以区分,
下划线命名:student_loan
驼峰式命名:studentLoan

关于命名法的参考资料

C语言中变量名及函数名的命名规则与驼峰命名法
变量命名法
四种常用的命名规则:帕斯卡命名法、驼峰命名法、下划线命名法、匈牙利命名法

作用域(Scopes)

每个名称都有自己关联的实体,比如,变量、函数、类型等等。

每个名称都对应的作用域。

作用域一般使用花括号来界定。

相同的名称在不同的作用域中可以关联不同的实体。

名称的可见性从声明的地方开始,直到声明所在作用域的结尾结束。

分类

全局作用域(global scope):在整个程序可见
块作用域(block scope)(局部作用域):仅局部可见

建议:尽量在靠近变量第一次使用的地方定义变量。

嵌套作用域(Nested Scopes)

一个作用域可以包含其他作用域。

外部作用域(Outer Scope) 包含了内部作用域(Inner Scope)。

外部作用域中的名字可以被其内部作用域使用。

外部作用域中的名字可以被其内容作用域重新定义。

作用域操作符(::)

如果 :: 左侧为空,其代表全局作用域。

我们可以通过作用域操作符来忽视默认的域规则。

复合类型

复合类型是根据另一种类型定义的类型。

复合类型包括:

引用;
指针;
等等。

声明语句是一个基本数据类型(base type) 跟着一组声明符(declarators)。

声明符,一是给了变量的名称,二是给了变量的类型(基于基本数据类型)。

引用

引用定义了变量的一个别名。

引用的声明符格式为: &var

引用的必须初始化。

引用不可修改。

引用的类型和被引用对象的类型必须匹配(但存在例外)。

引用只能用变量初始化,不能用字面量或者符合表达式。

指针

指针用于间接访问其他元素。

指针本身就是对象。

指针可修改。

指针定义可以不初始化。

指针的声明符格式为: *var

指针存储了另一个对象的地址。

我们通过取址符&(address-of operator) 来获取对象的地址。

指针的类型和被指向对象的类型必须匹配(但存在例外)。

四种状态

    指向一个对象;
    指向对象的后面一个位置;
    空指针,不指向任何对象;
    无效指针。

使用解引用操作符 * 来访问指向的对象。

空指针

空指针不指向任何对象。

空指针的三种表示:

字面量 0
宏定义 NULL
字面量 nullptr(推荐使用)

注意:不能将一个整型变量赋值给指针,即使整型变量的值为 0

为什么指针难以调试?

指针的值代表一个地址,我们很难区分合法的地址和非法的地址。
建议:初始化所有指针,指向一个具体的对象,或者空指针。
建议:只在被指向的对象定义后,再定义指针。

指针转换到布尔值:

空指针转换为 false
其他指针转换为 true

void* 指针

void* 指针可以指向任意一个对象。

void* 指针不保存指向对象的类型信息。

我们无法通过 void* 指针操作其指向的对象。

参考资料:

给定一个指针,如何判断这个指针是否已经指向一个合法的对象?
引用和指针的区别
C++:指针与引用的区别
【C++入门】函数重载,引用

复合类型的声明

定义语句是一个基本数据类型(base type) 跟着一组声明符(declarators)。

一个定义中可以定义不同类型的变量。

// i is an int; p is a pointer to int; r is a reference to int
int i = 1024, *p = &i, &r = i;

类型修饰符(type modifier) 仅应用于单个标识符。

定义多个变量的两种风格:

    类型修饰符和标识符相邻;
int *p1, *p2; // both p1 and p2 are pointers to int
    基本数据类型和类型修饰符相邻。
int* p1; // p1 is a pointer to int
int* p2; // p2 is a pointer to int

const 限定符(qualifier)

const 修饰的变量无法被修改。

const 的默认作用域为本文件。因为 C++ 是单独编译每个文件的,我们要将 const 替换为具体的值,需要知道它的定义,所以每一个文件中都包含了 const 的定义,但是不会导致重复定义的情况出现。

如果我们想要在多个文件中共享 const 变量,但是其初始值不是常量表达式(无法在编译阶段获取表达式的值):

    在一个文件中声明 const 变量,需要 extern 关键字
    在一个文件中定义 const 变量,需要 extern 关键字。
// file_1.cc defines and initializes a const that is accessible to other files
extern const int bufSize = fcn(); // file_1.h
extern const int bufSize; // same bufSizeas defined in file_1.cc

const 的引用无法修改引用的对象。

const 的引用的初始值可以为,

常量对象;
非常量对象;
字面量;
一般表达式(类型可以不匹配)。

只要初始值可以转换为引用的类型。

double dval = 3.14;
const int &ri = dval;

等价于

double dval = 3.14;
const int temp = dval; // create a temporary const int from the double
const int &ri = temp; // bind ri to that temporary

const 的指针无法修改指向的对象。

const 的指针可以指向非 const 的对象。

const 指针:指针本身无法被修改。

const 指针:必须被初始化。

const 指针的声明,将 const 放在标识符前面,而不是基本数据类型前面。

顶层 const:对象本身是 const,对象本身能否被修改。

底层 const:对象指向的对象是 const,指向对象能否被修改。

对象出现在 = 右侧时,顶层 const 可以被忽略,因为顶层 const 只是阻止对象被修改,但是不阻止对象被拷贝和访问;

对象出现在 = 右侧时,底层 const 必须考虑,因为底层 const 限定了指向对象的操作权限(是否能修改),在拷贝时,只能使得权限不变或者缩小(从可修改到不可修改),反之则不行——可以从 constconst 或者 non-constconst,但是 constnon-const 是不允许的。

参考资料:

extern关键字详解
一分钟了解完C语言中的“ extern”关键字
记录一个非常有趣的题目好 强制修改const变量值
通过指针强制修改const变量,这个结果是什么情况?

constexpr 和常量表达式

常量表达式是以下几种:

字面量
使用常量表达式初始化的 const 对象
表达式中的所有子表达式都是常量表达式

NOTE:

const 对象不一定都是常量表达式
non-const 对象一定不是常量表达式

const 语义接近 readonly——只读变量; constexpr 的语义接近常量(可以在编译阶段就确定)。

如果你只将变量用作常量表达式,推荐加上 constexpr 关键字。

字面量类型:所有可以使用 constexpr 的类型被称为字面量类型。

字面量类型包括:

算数类型
引用类型
指针类型
其他一些

字面量类型不包括:

Sales_item
IO
string 类型

NOTE:constexpr 用于指针类型的声明时,constexpr 会添加一个顶层 const

const int * p = nullptr;  // p is a pointer to a const int
constexpr int * q = nullptr; // q is a const pointer to int

如上的两个语句有不同的语义。

复杂类型

复杂类型的两个特点:

复杂类型很长,写起来容易出错;
复杂类型可能包含很多参数,难以理解它的意义和用途。

参考资料:

C++ const 和 constexpr 的区别? - Codebowl靓仔的回答 - 知乎

constexpr对编译时间影响大吗?

类型别名

定义类型别名的两种方式

typedef

typedef double wages; // wages is a synonym for double
typedef wages base, *p; // base is a synonym for double, p for double *

typedef 中的类型声明符可以包含类型修饰符,可以用来定义复合类型的别名。

using

using SI = Sales_item; // SI is a synonym for Sales_item
using SP = Sales_item*; // SP is a synonym for Sales_item*

指针类型别名和 const 混用时,别名作为一个基本数据类型出现在声明中,const 是顶层 const,表示对象不可变。

auto 关键字,类型指定符

当我们想要通过一个变量来保存表达式的值时,如果遇到表达式值的类型过于复杂,可以使用 auto 关键字来自动推导出变量的类型。

我们可以用 auto 来定义多个变量,多个变量必须有相同的基本数据类型。

auto i = 0, * p = &i; // ok: i is int and p is a pointer to int
auto sz = 0, pi = 3.14; // error: inconsistent types for sz and pi

一些特殊规则:

对于引用类型,auto 会使用引用对象的类型
对于顶层 constauto 会忽略,对象本身是否可变;如果想要推导出的类型有高层 const,必须显式地指定。

const auto f = ci; // deduced type of ci is int; f has type const int

对于底层 constauto 会保留,指向对象是否可变

可以通过 auto 来定义一个引用,引用指向的对象的顶层 const 不会被忽略。

auto &g = ci; // g is a const int& that is bound to ci
auto &h = 42; // error: we can’t bind a plain reference to a literal
const auto &j = 42; // ok: we can bind a const reference to a literal

通过 auto 来定义多个变量时,如果变量包含修饰符,会改变 auto 的推导结果。

指针修饰符:返回表达式指向的对象的类型。顶层 const 保留。
引用修饰符:返回表达式的类型。顶层 const 保留。

auto k = ci, &l = i;
auto &m = ci, * p = &ci; // m is a const int&; p is a pointer to const int
auto &n = i, * p2 = &ci; // error: type deduced from i is int; type deduced from &ci is const int

decltype 关键字,类型指定符

有的时候,我们想用推导出表达式的类型,但是却不想用这个表达式来初始化变量。

decltype 返回操作对象的类型,但是不会对其进行求值。

decltype(f()) sum = x; // sum has whatever type f returns

NOTE:

decltype 返回的类型会保留顶层 const,这与 auto 的有所不同。
decltype 针对引用类型会返回引用类型,而不是引用类型指向的对象。
decltype 解指针引用会返回引用类型。
decltype((variable)) 会返回引用类型。
decltype 针对赋值表达式也会返回引用类型。

参考资料

c++11 decltype(*p) 得到的结果是T&的设计思路?

C++11中的decltype和declval表示什么意思,它们是如何使用的,会在什么时候使用?

What is the difference between auto and decltype(auto) when returning from a function?

The relationship between auto and decltype

C++ Primer 5th 阅读笔记:变量和基本类型的相关教程结束。

《C++ Primer 5th 阅读笔记:变量和基本类型.doc》

下载本文的Word格式文档,以方便收藏与打印。