一些语言的公共特性
-
内建类型,如整型,字符型等;
- 变量,为值绑定的一个名字;
- 表达式和语句,操作值。
- 分支和循环,允许我们条件执行和重复执行;
- 函数,定义抽象计算单元。
扩展语言的方式
- 自定义类型;
- 标准库。
本章重点
- 内建类型;
- 简要介绍自定义类。
类型
- 定义了数据的意义;
- 定义了数据的操作;
从二进制的角度看,类型定义了数据占用几个 bit
,以及如何解释这些 bit
。
基本内建类型
- 算术类型
- 整型
- 字符型
- 布尔型
- 浮点型
- 特殊类型:void
算术类型
- 整型 (integral types
-
bool
: 两个值true
,false
。 -
char
:可以包含basic character set
中的字符对应的数字。大小等于一个机器字节(single machine byte。 -
wchar_t
,char16_t
,char32_t
。用于extended character sets
。wchar_t
可以包含最大extended character sets
中字符对应的数字。(Windows 2 字节;Unix 4 字节)char16_t
,char32_t
用于 Unicode 字符。
char 的进一步讨论,见 Byte是8位吗?—C语境中的Byte及C语言的char类型
- 浮点型 (floating-point types
标准没有定义具体的数据格式。一般使用的都是 IEEE 格式。
符号
- 有符号:
- 无符号:
unsigned int/unsigned
,unsigned short
,unsigned long
,unsigned long long
,unsigned char
。 - 特殊:
char
有无符号看编译器的实现。
signed int/int
,signed short/short
,signed long/long
,signed long long/long long
,signed char
。标准没有定义具体的数据格式。一般为补码。
算术类型的经验法则
- 不包含负数,使用无符号数。
- 使用
int
来进行整数运算。short
太小,long
一般和int
一样大。如果数字太大使用long long
。 - 不要在算术运算中使用
char
和bool
。可以在算术运算中使用signed char
和unsigned char
。 - 浮点数运算使用
double
。float
精度有限且带来执行效率上的提升不大。long double
的计算开销过大,一般不使用。
类型转换
赋值语句
- 左值类型:
- 左值类型:非
bool
右值类型:bool
转换规则:false
->0
,true
->1
- 左值类型:整型
右值类型:浮点型
转换规则:f
->int(f
- 左值类型:浮点型
右值类型:整型
转换规则:z
->z.00
- 左值类型:无符号数
- 右值类型:超出范围的数
转换规则:n
->n % N
;n
是超出范围的数,N
是无符号类型能表示的所有值的个数
bool
右值类型:非
bool
转换规则:
0
-> false
, ≠0
-> true
表达式
如果在算数表达式中同时出现 有符号数
和 无符号数
,所有 有符号数
转换为 无符号数
。
// WRONG: u can never be less than 0; the condition will always succeed
for (unsigned u = 10; u >= 0; --u
std::cout << u << std::endl
有关
有符号数
和无符号数
的一些资料:c++ - Adding two unsigned char variables and result is int - Stack Overflow
- C++中在什么情况下使用无符号类型,为什么? - 知乎
- C++有符号和无符号之间的转换 - 知乎
- 给一个无符号数赋值一个负数,并且该负数绝对值上溢,编译器是如何处理的呢? - 知乎
未定义的行为和实现定义的行为
建议参考以下的文章:
C++中的"未定义的行为"
- C++ 未定义行为
- C++程序员需要知道的未定义行为
字面量
整型
20 的三种表示法
- 十进制:
- 八进制:
024
,0
开头 - 十六进制:
0x14
,0x
开头
20
有符号数。
八进制和十六进制则可以为 有符号数
或者 无符号数
。
十进制字面量的类型为 int
,long
,long long
中可以容纳字面量值的最小类型。
八进制和十六进制的类型为 int
,unsigned int
,long
,unsigned long
,long long
,unsigned long long
中可以容纳字面量值的最小类型。
注意:
-42
不是字面量,42
才是字面量,-
在其中作为相反数的操作符。
浮点型
e 或者 E
来表示。
3.14159
3.14159E0
0.
0e0.001
科学记数法的形式是由两个数的乘积组成,aEb
= a×10^b
。
double。
字符和字符串字面量
- 字符字面量,包含在单引号中的一个字符
- 字符串字面量,包含在双引号中的 0 个或多个字符
"abcd"
。
'a'
;
零字符 '\0'(null character。
// multiline string literal
std::cout << "a really, really long string literal "
"that spans two lines" << std::endl;
转义序列
转义序列用于表示 非打印字符
或者有特殊含义的字符(如,单引号、双引号)。
\ 开头。
-
\x
后面跟 1 或者多个十六进制数字(0-f
)。
\
后面跟 1 到 3 个八进制数字(0-7
);
注意:
如果 \ 后面跟了四个及以上的八进制数,只有前三个字符会被解释成一般化的转义序列;
- 如果 \x 后面跟了多个十六进制数,十六进制数会用尽所有的数来表示一个字符。
Escape sequence for ? in c++
字面量类型
我们可以通过添加前缀(针对字符字面量或者字符串字面量)或者后缀(针对整型字面量或者浮点数字面量)的方式来修改默认的字面量类型。
L 作为后缀时,建议使用大写
L
,而不要使用小写l
,目的是为了区分字母l
和数字1
。
注意:后缀只是指定了字面量能接受的最小类型,如果字面量的值无法被容纳在这个最小类型内,字面量将会尝试下一个更大的类型。
其他字面量
- 指针字面量:
nullptr
。
bool
字面量:true
和 false
;
c++nullptr(空指针常量)、constexpr(常量表达式)
变量和对象的区别
在本书中的变量和对象没有区别!
变量定义
- 变量类型指示符(type specifier
- 一个或者多个变量名(使用逗号隔开)
2.1. 可以为变量指定一个初始值(可选 - 分号
;
结束
int sum = 0, value, units_sold = 0;
Sales_item item;
std::string book("0-201-78345-X";
初始化
- 可以使用之前定的变量来进行初始化;
- 初始化和赋值在 C++ 中是两个不同的操作;
示例:
double price = 109.99, discount = price * 0.16;
double salePrice = applyDiscount(price, discount;
关于初始化与赋值的区别,可以查看 CSDN 初始化与赋值的区别
对于基本数据类型,二者是没有任何区别,对于非基本数据类型,在写法与效率上有许多不同。
列表初始化
int units_sold = 0;
int units_sold = {0};
int units_sold{0};
int units_sold(0;
C++11 中使用花括号来初始化内建类型,如果存在类型转换且具有数据丢失的风险,则编译器将会报错。
long double ld = 3.1415926536;
int a{ld}, b = {ld}; // error: narrowing conversion required
int c(ld, d = ld; // ok: but value will be truncated
关于花括号初始化的更多内容,可以参考: C++11 花括号初始化
默认初始化
变量的初始化取决于:
- 变量的类型
- 变量定义的位置
- 定义在函数外的变量会被初始化为 0
- 定义在函数内的变量不会被初始化(uninitialized
变量声明(Declaration和变量定义(Definition
声明
变量声明指定了变量的类型和名称。
定义
声明。
变量定义指定了变量的类型和名称。
存储空间。
初始值(可选)。
如何声明一个变量?
- 添加
- 不要提供初始值。
extern
关键字;
extern int i; // declares but does not define i
int j; // declares and defines j
任何包含初始值的声明都是定义。
extern double pi = 3.1416; // definition
注意:变量可以被声明多次,但只能被定义一次。
为什么c++要“在头文件中声明,在源文件中定义”? - 知乎!
- C语言关键字extern详解 - 知乎!
标识符
- 由字母、数字、下划线组成;
- 无长度限制;
- 大小写敏感;
语言保留字
标准库保留字
- 不能出现两个连续的下划线,如
- 不能下划线之后跟着大写字母,如
_I
; - 函数外的标识符,不能以下划线开头,如:
__i
;
int _i; // WARNING: DISALLOW!
int main(
{
...
}
关于保留字的参考资料:
C/C++中的保留字_准备开始胡乱学代码的凯的博客-CSDN博客_c++保留字
- C++标准库及其保留字(关键字——附:C++标准文档
命名习惯
- 名称应符合它的用法;
- 变量一般是小写字母,如
index
; - 类名称通常以大写字母开头,如
Sales_item
; - 名字多个单词之间需要加以区分,
- 下划线命名:
student_loan
- 驼峰式命名:
studentLoan
- 下划线命名:
C语言中变量名及函数名的命名规则与驼峰命名法
- 变量命名法
- 四种常用的命名规则:帕斯卡命名法、驼峰命名法、下划线命名法、匈牙利命名法
作用域(Scopes
每个名称都有自己关联的实体,比如,变量、函数、类型等等。
每个名称都对应的作用域。
作用域一般使用花括号来界定。
相同的名称在不同的作用域中可以关联不同的实体。
名称的可见性从声明的地方开始,直到声明所在作用域的结尾结束。
分类
- 全局作用域(global scope:在整个程序可见
- 块作用域(block scope(局部作用域):仅局部可见
嵌套作用域(Nested Scopes
一个作用域可以包含其他作用域。
外部作用域(Outer Scope 包含了内部作用域(Inner Scope。
外部作用域中的名字可以被其内部作用域使用。
外部作用域中的名字可以被其内容作用域重新定义。
作用域操作符(::
:: 左侧为空,其代表全局作用域。
我们可以通过作用域操作符来忽视默认的域规则。
复合类型
复合类型包括:
- 引用;
- 指针;
- 等等。
声明符,一是给了变量的名称,二是给了变量的类型(基于基本数据类型)。
引用
引用的声明符格式为: &var
。
引用的必须初始化。
引用不可修改。
引用的类型和被引用对象的类型必须匹配(但存在例外)。
引用只能用变量初始化,不能用字面量或者符合表达式。
指针
指针本身就是对象。
指针可修改。
指针定义可以不初始化。
指针的声明符格式为: *var
。
指针存储了另一个对象的地址。
我们通过取址符&
(address-of operator 来获取对象的地址。
指针的类型和被指向对象的类型必须匹配(但存在例外)。
四种状态
- 指向一个对象;
- 指向对象的后面一个位置;
- 空指针,不指向任何对象;
- 无效指针。
* 来访问指向的对象。
空指针
空指针不指向任何对象。
空指针的三种表示:
- 字面量
- 宏定义
NULL
- 字面量
nullptr
(推荐使用
0
0。
为什么指针难以调试?
- 指针的值代表一个地址,我们很难区分合法的地址和非法的地址。
- 建议:初始化所有指针,指向一个具体的对象,或者空指针。
- 建议:只在被指向的对象定义后,再定义指针。
- 空指针转换为
- 其他指针转换为
true
。
false
;
void*
指针
void*
指针可以指向任意一个对象。void*
指针不保存指向对象的类型信息。
我们无法通过void*
指针操作其指向的对象。给定一个指针,如何判断这个指针是否已经指向一个合法的对象?
- 引用和指针的区别
- C++:指针与引用的区别
- 【C++入门】函数重载,引用
复合类型的声明
定义语句是一个基本数据类型(base type 跟着一组声明符(declarators。
// i is an int; p is a pointer to int; r is a reference to int int i = 1024, *p = &i, &r = i;
类型修饰符(type modifier 仅应用于单个标识符。
类型修饰符和标识符相邻;
int *p1, *p2; // both p1 and p2 are pointers to int
- 基本数据类型和类型修饰符相邻。
int* p1; // p1 is a pointer to int int* p2; // p2 is a pointer to int
const
限定符(qualifier)const
修饰的变量无法被修改。const
的默认作用域为本文件。因为 C++ 是单独编译每个文件的,我们要将const
替换为具体的值,需要知道它的定义,所以每一个文件中都包含了const
的定义,但是不会导致重复定义的情况出现。const 变量,但是其初始值不是常量表达式(无法在编译阶段获取表达式的值):
在一个文件中声明
const
变量,需要extern
关键字- 在一个文件中定义
const
变量,需要extern
关键字。// file_1.cc defines and initializes a const that is accessible to other files extern const int bufSize = fcn(; // file_1.h extern const int bufSize; // same bufSizeas defined in file_1.cc
const
的引用无法修改引用的对象。const 的引用的初始值可以为,
- 常量对象;
- 非常量对象;
- 字面量;
- 一般表达式(类型可以不匹配)。
double dval = 3.14;
const int &ri = dval;
等价于
double dval = 3.14;
const int temp = dval; // create a temporary const int from the double
const int &ri = temp; // bind ri to that temporary
const
的指针无法修改指向的对象。const
的指针可以指向非const
的对象。const
指针:指针本身无法被修改。const
指针:必须被初始化。const
指针的声明,将const
放在标识符前面,而不是基本数据类型前面。const:对象本身是
const
,对象本身能否被修改。
底层const
:对象指向的对象是const
,指向对象能否被修改。= 右侧时,顶层
const
可以被忽略,因为顶层const
只是阻止对象被修改,但是不阻止对象被拷贝和访问;
对象出现在=
右侧时,底层const
必须考虑,因为底层const
限定了指向对象的操作权限(是否能修改),在拷贝时,只能使得权限不变或者缩小(从可修改到不可修改),反之则不行——可以从const
到const
或者non-const
到const
,但是const
到non-const
是不允许的。extern关键字详解
- 一分钟了解完C语言中的“ extern”关键字
- 记录一个非常有趣的题目好 强制修改const变量值
- 通过指针强制修改const变量,这个结果是什么情况?
constexpr
和常量表达式常量表达式是以下几种:
- 字面量
- 使用常量表达式初始化的
const
对象 - 表达式中的所有子表达式都是常量表达式
NOTE:
-
non-const
对象一定不是常量表达式
const
对象不一定都是常量表达式
const 语义接近 readonly
——只读变量; constexpr
的语义接近常量(可以在编译阶段就确定)。
constexpr 关键字。
constexpr 的类型被称为字面量类型。
字面量类型包括:
- 算数类型
- 引用类型
- 指针类型
- 其他一些
IO
-
string
类型
Sales_item
类
NOTE:当 constexpr
用于指针类型的声明时,constexpr
会添加一个顶层 const
。
const int * p = nullptr; // p is a pointer to a const int
constexpr int * q = nullptr; // q is a const pointer to int
如上的两个语句有不同的语义。
复杂类型
- 复杂类型很长,写起来容易出错;
- 复杂类型可能包含很多参数,难以理解它的意义和用途。
参考资料:
C++ const 和 constexpr 的区别? - Codebowl靓仔的回答 - 知乎
constexpr对编译时间影响大吗?
类型别名
typedef
typedef double wages; // wages is a synonym for double typedef wages base, *p; // base is a synonym for double, p for double *
typedef
中的类型声明符可以包含类型修饰符,可以用来定义复合类型的别名。
using
using SI = Sales_item; // SI is a synonym for Sales_item
using SP = Sales_item*; // SP is a synonym for Sales_item*
指针类型别名和 const
混用时,别名作为一个基本数据类型出现在声明中,const
是顶层 const
,表示对象不可变。
auto
关键字,类型指定符
auto 关键字来自动推导出变量的类型。
我们可以用 auto
来定义多个变量,多个变量必须有相同的基本数据类型。
auto i = 0, * p = &i; // ok: i is int and p is a pointer to int
auto sz = 0, pi = 3.14; // error: inconsistent types for sz and pi
一些特殊规则:
- 对于引用类型,
- 对于顶层
const
,auto
会忽略,对象本身是否可变;如果想要推导出的类型有高层const
,必须显式地指定。const auto f = ci; // deduced type of ci is int; f has type const int
- 对于底层
const
,auto
会保留,指向对象是否可变
auto
会使用引用对象的类型
可以通过 auto
来定义一个引用,引用指向的对象的顶层 const
不会被忽略。
auto &g = ci; // g is a const int& that is bound to ci
auto &h = 42; // error: we can’t bind a plain reference to a literal
const auto &j = 42; // ok: we can bind a const reference to a literal
通过 auto
来定义多个变量时,如果变量包含修饰符,会改变 auto
的推导结果。
- 指针修饰符:返回表达式指向的对象的类型。顶层
- 引用修饰符:返回表达式的类型。顶层
const
保留。
const
保留。
auto k = ci, &l = i;
auto &m = ci, * p = &ci; // m is a const int&; p is a pointer to const int
auto &n = i, * p2 = &ci; // error: type deduced from i is int; type deduced from &ci is const int
decltype
关键字,类型指定符
有的时候,我们想用推导出表达式的类型,但是却不想用这个表达式来初始化变量。decltype
返回操作对象的类型,但是不会对其进行求值。
decltype(f( sum = x; // sum has whatever type f returns
NOTE:
-
decltype
针对引用类型会返回引用类型,而不是引用类型指向的对象。 -
decltype
解指针引用会返回引用类型。 -
decltype((variable
会返回引用类型。 -
decltype
针对赋值表达式也会返回引用类型。
decltype
返回的类型会保留顶层 const
,这与 auto
的有所不同。
c++11 decltype(*p 得到的结果是T&的设计思路?
C++11中的decltype和declval表示什么意思,它们是如何使用的,会在什么时候使用?
What is the difference between auto and decltype(auto when returning from a function?
The relationship between auto and decltype