主要的笔记内容针对于C++相关的内容，主要针对的课程为Stanford CS106L (2020)的笔记，主要为后面的xv6写的前置笔记知识

Lecture 1: Streams I

Streams 主要的作用就是：外部设备 ↔ （字符缓冲区）stream ↔ 你的变量（double、int、struct）

stringstream

std::istringstream: 输入字符串流（从string 中按类型提取）
std::ostringstream: 输出字符串流（往里面放入各种类型，得到string类型）
std::stringstream: 既能读又能写

#include <iostream>
#include <sstream>

int main()
{
    // “16.9 Ounces”, pos at front
    std::istringstream iss("16.9 Ounces");
    double value;
    std::string unit;
    iss >> value >> unit;

    std::cout << "Value: " << value << ", Unit: " << unit << std::endl;
    return 0;
}

// Value: 16.9, Unit: Ounces

上面的例子可以看到输入字符串流中的iss -> 16.9 Ounces后面根据类型进行分类，因为中间遇见了空格进行了两个位置进行分割

// “Ito En Green Tea ”, pos at front
std::ostringstream oss("Ito En Green Tea ");
oss << 16.9 << " Ounce";
std::cout << oss.str() << std::endl;
// 16.9 Ounceen Tea

上面的例子中的输出字符串流，指针进行因为是在字符串的最开始的位置开始的，所以内容会进行覆盖，这里就和PPT中的一个位置是一样的

alt text

如果想从字符串的最后面的位置开始进行拼接，可以使用方式ate或者直接使用+

// “Ito En Green Tea ”, pos at back
std::ostringstream oss("Ito En Green Tea ", std::stringstream::ate);
oss << 16.9 << " Ounce";
std::cout << oss.str() << std::endl;

std::string valuestr = "16.9";
std::string result = "Ito En Green Tea " + valuestr + " Ounce";
std::cout << result << std::endl;

//Ito En Green Tea 16.9 Ounce
//Ito En Green Tea 16.9 Ounce

stringstream formatted i/o（» / «）

<<：把变量转成字符，用于将数据推送到流对象中 >>：从缓冲区读取下一个 token，按变量类型解析

alt text

什么属于空白分隔符：空格，\t，\n等等可以被隔开的片段

//16.9 Ounces .   -38271
std::cout << "Enter a string: ";
std::string input;
std::getline(std::cin, input);

std::istringstream iss(input);

double token1;
std::string token2;
char token3;
bool token4;

iss >> token1 >> token2 >> token3 >> token4;
std::cout << "Token 1: " << token1 << std::endl;
std::cout << "Token 2: " << token2 << std::endl;
std::cout << "Token 3: " << token3 << std::endl;
std::cout << "Token 4: " << token4 << std::endl;

//Enter a string: 16.9 Ounces .   -38271
//Token 1: 16.9
//Token 2: Ounces
//Token 3: .
//Token 4: 1

alt text

#include <iostream>
#include <sstream>

int main()
{
    //16.9 Ounces .   -38271
    std::cout << "Enter a string: ";
    std::string input;
    std::getline(std::cin, input);

    std::istringstream iss(input);

    int token1;
    std::string token2;
    char token3;
    bool token4;

    iss >> token1 >> token2 >> token3 >> token4;
    std::cout << "Token 1: " << token1 << std::endl;
    std::cout << "Token 2: " << token2 << std::endl;
    std::cout << "Token 3: " << token3 << std::endl;
    std::cout << "Token 4: " << token4 << std::endl;
    return 0;
}

上面的例子中写入了cin的情况后面的lecture中会提到，正常的cin遇见空格就会停止读取，使用getline的话遇见的是\n，上面输入的是16.9 Ounces . -38271，那么通过istringstream把字符串包成一个输入流，去解析的时候

token1 : 读int看到 '1''6''.''9'， '.' 对 int 无效，于是停在 ‘.’，结果 token1 = 16
token2 : 跳过 '.' 前的空白，从 '.' 开始读 string，string 对 '.' 是合法字符，会读到 "."（后面空白为止）
token3 : 跳过空白，读下一个 char，得到 'O'
token4 : 读取下一个那么就是U

stringstream positioning functions

oss.str()：把当前缓冲区内容取成 std::string
tellp()/seekp()：输出位置指针（put pointer）
tellg()/seekg()：输入位置指针（get pointer）

#include <iostream>
#include <sstream>

int main()
{
    std::ostringstream oss("ABCDEF");
    oss.seekp(3);
    oss << "Z";
    auto pos = oss.tellp();
    std::cout << "Position before writing Z: " << pos << " " << oss.str() << std::endl;
    return 0;
}

stringToInteger and state bits

goodbit (G)：一切正常，可以继续读写
failbit (F)：上一次操作失败（比如类型不匹配），之后所有操作都会被卡死
eofbit (E)：读到了缓冲区结尾（EOF）
badbit (B)：严重错误（IO 崩溃、设备坏了之类）

这里了解了一个好的编程方式，主要针对于if else可以直接转化为? :表达式，看起来简洁也好很多

void printStateBits(const istream& iss) {
    cout << "State bits: ";
    
    cout << (iss.good() ? "G" : "-");
    cout << (iss.fail() ? "F" : "-");
    cout << (iss.eof() ? "E" : "-");
    cout << (iss.bad() ? "B" : "-");
    cout << '\n';
}

对于要实现的stringToInteger如下所示：

#include <iostream>
#include <sstream>

int stringtoint(const std::string& str)
{
    std::istringstream iss(str);
    int value;
    char remain;
    
    if (!(iss >> value) || (iss >> remain)) {
        throw std::domain_error("not a pure integer");
    }

    return value;
}

int main()
{
    std::cout << "input str: ";
    std::string input;
    std::getline(std::cin, input);
    int number = stringtoint(input);
    std::cout << "Converted integer: " << number << std::endl;
    return 0;
}

Lecture 2: Streams II

这个鬼调试搞了半天！因为cppdbg不太兼容console，导致会卡死很裂开，换成lldb可以了

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "codeLLDB",
            "type": "lldb",
            "request": "launch",
            "program": "${fileDirname}/${fileBasenameNoExtension}",
            "args": [],
            "cwd": "${fileDirname}",
            "preLaunchTask": "build c++",
            "terminal": "integrated" 
        }
    ]
}

cout && cin && getline

cin：标准输入流（从终端/键盘方向来，但不是“直接从键盘读”） cout：标准输出流（往终端打印，但不是“立刻显示”）

stream = buffer + position pointer + state bits 的抽象

cin在读我们键盘输入的内容，当我们的键盘回车后，系统会把这一行(包括 \n)交给cin的buffer cin >> x并不是直接读键盘，而是buffer里面有内容就从buffer中读，buffer中没有内容才会卡住等带我们的输入，相当于只是从buffer中按照规则取字符，并移动读指针

cin >> 规则:

先 consume all whitespaces （空格、换行 \n、tab……），比如读取字符前面有这些的话会略过这些然后开始读
读取 token一般是到空白位置
对于int/double这种基本类型，会尽可能读出一个变量所需的最大字符，从86.2提取int，会得到86，读指针停在小数点.

#include <iostream>

int main()
{
    std::string name;
    int age;
    std::string response;

    std::cin >> name;
    std::cin >> age;

    std::cout << name << age;
    std::cin >> response;


    return 0;
}

这个例子中假设我输入的是loxic null那么当age的位置的时候，想读int后，会先跳过空白读取的时候，读int失败，fall bit被打开，fallbit开了后，后面的cin都会失败

cout这里开始补充一下，比如我们代码是cout << "hello"，这个并不能保证立刻出现在终端中，因为它可能先进入cout的输出缓冲区，这里补充一下输入(cin)操作都会 flush cout，endl以及std::flush都会强制刷新

#include <iostream>

int main()
{
    std::cout << "Hello, World!";
    std::flush(std::cout);
    return 0;
}

对于cin的问题，cin会把整行输入放进buffer，但>>是按空白分token抽取，这里会很容易出现问题

这里引入了一个新的东西叫做getline，会读取到\n

#include <iostream>
#include <sstream>

int getInteger(const std::string& prompt = "integer: ",
               const std::string& reprompt = "Please enter a valid ")
{
    while(true)
    {
        std::cout << prompt;
        std::string line; int value; char trash;
        if(!std::getline(std::cin, line)) throw std::domain_error("[shortened]");

        std::istringstream iss(line);
        if(iss >> value && !(iss >> trash)) return value;
        std::cout << reprompt;
    }

}

int main()
{
    std::cout << getInteger() << std::endl;
    return 0;
}

>>和getline混用的话，这里要注意下，>>会把分隔符留在缓冲区内，而getline不会跳过最开始的空白区域，直接从当前的位置读取到\n 所以最好不用混着使用，如果要使用记得使用ignore()

#include <iostream>
#include <sstream> 

int main()
{
    std::istringstream iss("16.9 Ounces\n Pack of 12");

    std::string str;
    iss >> str;

    std::string line;
    std::getline(iss, line);

    std::cout << "First word: " << str << std::endl;
    std::cout << "Remaining line: " << line << std::endl;

    return 0;
}

First word: 16.9
Remaining line:  Ounces

输出结果是，会发现getline读取给line变量的时候会有空格，那么加上一个iss.ignore()去除第一个字符就可以把空格去掉

去看一下源码会知道很多 alt text

我们的输入会通过sentry来进行检查，这里会按照skipws跳过前导的空白

alt text

后面可以看到时sgetc取出来检查再进行sbumpc消费，所以到空格的时候检查没通过就不会消费，就会导致了分割的剩余

promptUserForFile challenge

写一个函数：提示用户输入文件名，尝试打开ifstream，如果打不开就reprompt，最后返回有效文件名

#include <iostream>
#include <sstream> 
#include <fstream>

std::string promptUserForFile(std::ifstream& stream,
                              std::string prompt = "input your file name: ",
                              std::string reprompt = "false again, ") 
{
    std::string filename;

    while(true)
    {
        std::cout << prompt;
        if(!getline(std::cin,filename)) throw std::domain_error("input error");
        
        stream.clear();
        stream.open(filename);

        if (stream.is_open()) {
            return filename;
        }

        std::cout << reprompt;
    }
}

int main()
{
    std::ifstream file;
    std::cout << promptUserForFile(file) << std::endl;
    return 0;
}

modern c++ types

size_t

size_t 多用于索引/大小，无符号的整数，一般str.size()的返回类型通常是size_t（无符号），处理字符串的时候要小心如果字符串是空串的时候，一定要注意会不会出现无符号下溢的情况

// 有警告：signed 和 unsigned 比较
for (int i = 0; i < str.size(); ++i) { ... }

// 正确写法
for (size_t i = 0; i < str.size(); ++i) { ... }

// 这个函数对空字符串会出bug！
string chopBothEnds(const string& str) {
    for (size_t i = 1; i < str.size()-1; ++i) { // str.size()-1 下溢！
        result += str[i];
    }
}

trip: 如果想调试g++ -g -o xxx xxx.cpp

alt text

auto

让编译器自动推导类型：

auto x = 3.14;          // double
auto name = "Avery";     // const char*（C字符串，不是string！）
auto name2 = string{"Avery"};  // string
auto copy = vec;         // 完整拷贝
auto& ref = vec;         // 引用，不拷贝

auto 会丢弃 const 和引用

const string& s = getStr();
auto x = s;       // x 是 string（不是 const string&），会拷贝
const auto& y = s; // 这样才保留 const 引用

用 auto 的时机：

迭代器类型太长时
类型从上下文很明显时
lambda 表达式（必须用 auto）
函数返回类型（尽量别用，可读性差）

pair && tuple

#include <iostream>

int main()
{
    //两个值的组合
    auto var1 = std::make_pair(1, 2);
    //多个值的组合
    auto var2 = std::make_tuple(3, 4, "hi", 5);

    //取的方法
    std::cout << "var1: " << var1.first << ", " << var1.second << std::endl;
    std::cout << "var2: " << std::get<0>(var2) << ", " << std::get<1>(var2) << ", " << std::get<2>(var2) << ", " << std::get<3>(var2) << std::endl;

    //拷贝
    auto [a ,b] = var1;
    std::cout << "a: " << a << ", b: " << b << std::endl;

    //引用，为了防止被篡改，加上const
    const auto& [x, y, z, w] = var2;

    std::cout << "x: " << std::get<0>(var2) << std::endl;

    return 0;
}

struct

#include <iostream>

struct Discount {
    double discountFactor;
    int expirationDate;
    std::string nameOfDiscount;
};  

int main()
{
    
    auto coupon = Discount{0.9, 30, "New Years"};  // 统一初始化
    coupon.discountFactor = 0.8;

    auto [factor, date, name] = coupon;  // 结构化绑定
    std::cout << "Discount Factor: " << factor << std::endl;
    std::cout << "Expiration Date: " << date << std::endl;
    std::cout << "Name of Discount: " << name << std::endl;
}

References

string tea = "Ito-En";
string copy = tea;   // copy 是独立副本
string& ref = tea;   // ref 是 tea 的别名

tea[1] = 'a';   // tea 变了，ref 也变（因为是同一个东西）
copy[2] = 'b';  // 只改 copy，tea 不变
ref[3] = 'c';   // 改 ref 就是改 tea

永远不要返回局部变量的引用

char& bad(string& s) {
    string local = s;
    return local[0];  // 函数结束 local 被销毁，引用悬空！
}

类型转换

double d = 3.4;
int i = static_cast<int>(d);  // 显式转换，i = 3
double d2 = 6;                 // 隐式提升，d2 = 6.0

Uniform Initialization

用 {} 来初始化几乎所有东西：

vector<int> vec{3, 1, 4, 1, 5, 9};
pair<int, int> p{1, 2};
return {min, max};  // 函数返回 pair 时

Lecture 3: Sequence Containers

what about STL

其实这节课，一直在介绍STL带来的方便和比较好的东西 STL:

容器（Containers） — 存放数据的"盒子"
迭代器（Iterators） — 用来遍历容器的"指针"
算法（Algorithms） — 对容器中的数据做操作（排序、查找等）
函子/仿函数（Functors） — 像函数一样使用的对象
适配器（Adaptors） — 在容器基础上做限制，形成新的数据结构（如栈、队列）

Sequence Containers

序列容器就是"按顺序存放元素"的容器

std::vector<T>

vector 就是一个可以自动扩容的数组, 可以把它想象成一个能自动变长的书架

std::vector<int> vec;   //空vector
std::vector<int> vec(5); // 5个元素都是0
std::vector<int> vec(5, 10); // 5个元素都是10
std::vector<int> vec{1, 2, 3}; // 初始化列表

使用方法：

//创建
std::vector<int> vec(3);   //空vector
vec = {1 ,3 ,7};

//vector添加元素只能添加在尾部
vec.push_back(9);   //添加元素
std::cout << "第一个元素: " << vec.front() << std::endl;  //访问第一个元素
std::cout << "最后一个元素: " << vec.back() << std::endl;   //访问最后一个元素
std::cout << "下标访问: " << vec[0] << std::endl; //不检查越界
std::cout << "at访问: " << vec.at(0) << std::endl;  //检查越界

//删除元素
vec.pop_back();    //删除最后一个元素
vec.erase(vec.begin());   //删除第一个元素

//其他使用方法
vec.clear();  //清空vector
vec.size();   //获取vector大小
vec.empty();  //检查vector是否为空

遍历vector的方法

vector<string> v = {"A", "B", "C"};

// 方式1：经典 for 循环（注意用 size_t）
for (size_t i = 0; i < v.size(); ++i) {
    cout << v[i] << endl;
}

// 方式2：范围 for 循环（更简洁，推荐！）
for (string elem : v) {
    cout << elem << endl;
}

// 方式3：引用遍历（避免拷贝，性能更好）
for (const string& elem : v) {
    cout << elem << endl;
}

这是是推荐方式2和3的，告别之前c写法的方式1，对于2和3的区别就是string elem每次循环都会拷贝一个元素出来，而const string& elem 不是拷贝而是引用，那么如果vector里面元素很多的话，肯定是引用遍历速度是最快的

关于vector 的性能问题：push_front，课程里引入了一个问题，为什么vector里没有push_front

如果有push_front的话，假设如果有 n 个元素，就需要挪 n 次 → 时间复杂度 O(n)，很慢（疯狂动物城里的闪电是吧！）

所以 vector 故意不提供 push_front，避免不小心写出低效的代码

std::deque<T>

所以引出了一个新的东西：叫做双端队列，解决了 vector 不能高效头部插入的问题

#include <iostream>
#include <deque>

int main()
{
    std::deque<int> deq{1, 2, 3, 4, 5};
    deq.push_back(6); // Adds 6 to the end of the deque
    deq.push_front(0); // Adds 0 to the front of the deque

    // 打印每个元素的地址，观察 deque 的分块内存布局
    for(const auto& elem : deq) {
        printf("Element: %d, Address: %p\n", elem, (void*)&elem);
    }

    deq.pop_back(); // Removes the last element (6)
    deq.pop_front(); // Removes the first element (0)

    std::cout << deq.front() << std::endl; // Outputs the first element (1)
    std::cout << deq.back() << std::endl; // Outputs the last element (5)
    return 0;
}

Element: 0, Address: 0x909000ffc
Element: 1, Address: 0x1008ce390
Element: 2, Address: 0x1008ce394
Element: 3, Address: 0x1008ce398
Element: 4, Address: 0x1008ce39c
Element: 5, Address: 0x1008ce3a0
Element: 6, Address: 0x1008ce3a4

deque 不是像 vector 那样用一整块连续内存，而是用多个小块内存，通过一个索引表把它们串起来

所以：头部插入时，只要在第一个块的前面加元素就行（或者分配一个新块），不需要移动其他元素 → O(1)

那么大部分时候用 vector 就够了，只有当你确实需要频繁在头部插入/删除时，才用 deque，deque对数据在中间位置的取值的效率并没有 vector 快

Container Adaptors

适配器是在已有容器上面加了使用限制，让它变成特定的数据结构

为什么要加限制: 因为限制能防止误用，让代码意图更清晰，当你看到代码用了 stack，立刻就知道这里是后进先出的逻辑

stack = deque + 限制（只允许 push_back 和 pop_back，只能看 top） queue = deque + 限制（只允许 push_back 和 pop_front）

stack

栈像盘子一样，满足的要求为只能从顶部放入，顶部取出，后进先出的原则

#include <iostream>
#include <stack> 

int main()
{
    std::stack<int> myStack;
    myStack.push(1); // [1]
    myStack.push(2); // [1, 2]
    myStack.push(3); // [1, 2, 3]

    std::cout << "Top element: " << myStack.top() << std::endl; // Output: 3

    myStack.pop(); // [1, 2]
}

这个样子来说，底层实际上就是deque，但是只暴露了 push_back(push), pop_back(pop), back(top)的接口

queue

队列就像排队买奶茶，先来的先服务，先来先出

#include <iostream>
#include <queue>

int main()
{
    std::queue<int> q;
    q.push(1);
    q.push(2);
    q.push(3);

    std::cout << "Front element: " << q.front() << std::endl; // Output: 1
    std::cout << "Back element: " << q.back() << std::endl; // Output: 3

    q.pop(); // Remove the front element (1)
}

本质上是对 deque 的封装：用 push_back 入队，用 pop_front出队

Lecture 4: Associative Containers

关联容器和序列容器最大的特点就是：关联容器没有"顺序"的概念，数据不是通过下标访问的，而是通过"键"（key）访问的

C++ 提供了4种关联容器：

std::map<T1, T2> 有序的键值对（key-value），key 自动排序
std::set<T> 有序的集合，只有 key，没有 value
std::unordered_map<T1, T2> 无序的键值对，基于哈希表
std::unordered_set<T> 无序的集合，基于哈希表

map 和 set是有序的：

内部用平衡二叉搜索树（通常是红黑树）实现
key 必须支持 <（小于号）比较
遍历时按 key 排好序输出
适合需要范围查询的场景

unordered_map 和 unordered_set 是无序的：

内部用哈希表实现
key 必须有对应的 hash 函数
单个元素的查找更快（平均 O(1) vs O(log n)）
遍历顺序不确定

如果你只需要快速查找某个 key 是否存在或获取对应的 value，用 unordered 版本，如果需要有序遍历，用有序版本

std::map<T1, T2>

std::map<string, int> mymap;

// 插入
mymap["hello"] = 1;

// 两种访问方式的区别——非常重要！
mymap.at("hello");  // key 不存在时抛异常（安全）
mymap["hello"];     // key 不存在时会自动创建一个默认值的条目！（危险）

mymap[“newkey”] 如果 “newkey” 不存在，会自动插入一个 value 为默认值（int 的话是0）的键值对 mymap.count(key)，返回0表示不存在，返回1表示存在

#include <iostream>
#include <map>

int main()
{
    std::map<std::string, int> map_value;

    map_value["one"] = 1;
    map_value["rrr"] = 2;

    std::cout << map_value.count("one") << std::endl;

    map_value.erase("one");

    std::map<std::string, int>::iterator i = map_value.begin();

    while(i != map_value.end())
    {
        std::cout << i->first << i->second << std::endl;
        ++i;
    }

    return 0;
}

std::set<T>

set 本质上就是一个只有 key 没有 value 的 map 可以理解为：set 中的每个元素的"存在"就是它的 value（在就是 true，不在就是 false）

set 的方法和 map 基本一样，只是没有 [] 和 .at() 这种用key取value的操作

#include <iostream>
#include <set>


int main()
{
    std::set<int> set_value;

    set_value.insert(1);
    set_value.insert(2);
    set_value.insert(3);

    std::cout << set_value.count(3) << std::endl;

    set_value.erase(3);

    std::cout << set_value.count(3) << std::endl;

    return 0;
}

Iterators

为什么要有迭代器，序列容器可以用 for(int i = 0; i < size; i++) 来遍历，但关联容器没有下标，没有"第几个"的概念，怎么遍历，可以使用迭代器，迭代器就像一个"指针"，它指向容器中的某个元素，可以把它想象成一个书签——它告诉你当前在哪个位置

迭代器把非线性的集合（比如树结构的 set）变成一个可以线性遍历的序列

创建迭代器：
set<int>::iterator iter = mySet.begin();  // 指向"第一个"元素

解引用：
cout << *iter << endl;  // 用 * 号取出迭代器指向的值

推进（前进到下一个元素）：
++iter;  // 向前移动一步

比较（判断是否结束）：
if (iter == mySet.end()) {
    // 已经遍历完了
}


set<int>::iterator iter;
for (iter = mySet.begin(); iter != mySet.end(); ++iter) {
    cout << *iter << endl;
}

mySet.end() 指向的是最后一个元素的后面一个位置（past-the-end），不是最后一个元素本身

迭代器map 和 set的区别就是，map 迭代器是一个 std::pair的结构

#include <iostream>
#include <map>
#include <set>

int main()
{
    std::map<int, std::set<int>> myMap;
    myMap[1].insert(10);
    myMap[1].insert(20);
    myMap[2].insert(30);

    std::map<int, std::set<int>>::iterator it = myMap.begin();
    std::set<int>::iterator setIt;
    while (it != myMap.end())
    {
        std::cout << "Key: " << it->first << " Values: ";
        for (setIt = it->second.begin(); setIt != it->second.end(); ++setIt)
        {
            std::cout << *setIt << " ";
        }
        std::cout << std::endl;
        ++it;
    }
    

    return 0;
}

Lecture 5: Advanced Containers and Iterators

Lecture 1: Streams I#

stringstream#

stringstream formatted i/o（» / «）#

stringstream positioning functions#

stringToInteger and state bits#

Lecture 2: Streams II#

cout && cin && getline#

promptUserForFile challenge#

modern c++ types#

size_t#

auto#

pair && tuple#

struct#

References#

类型转换#

Uniform Initialization#

Lecture 3: Sequence Containers#

what about STL#

Sequence Containers#

std::vector<T>#

std::deque<T>#

Container Adaptors#

stack#

queue#

Lecture 4: Associative Containers#

std::map<T1, T2>#

std::set<T>#

Iterators#

Lecture 5: Advanced Containers and Iterators#

Lecture 1: Streams I

stringstream

stringstream formatted i/o（» / «）

stringstream positioning functions

stringToInteger and state bits

Lecture 2: Streams II

cout && cin && getline

promptUserForFile challenge

modern c++ types

size_t

auto

pair && tuple

struct

References

类型转换

Uniform Initialization

Lecture 3: Sequence Containers

what about STL

Sequence Containers

std::vector<T>

std::deque<T>

Container Adaptors

stack

queue

Lecture 4: Associative Containers

std::map<T1, T2>

std::set<T>

Iterators

Lecture 5: Advanced Containers and Iterators