golang 数据二 (切片)

在项目开发过程中，更多的场景是需要一个长度可以动态更新的数据存储结构，切片本身并非是动态数组或数组指针，他内部通过指针引用底层数组，并设定相关属性将数据读写操作限定在指定区域内。比如：

/runtime/slice.go

type slice struct {
	array unsafe.Pointer
	len   int
	cap   int
}

切片初始化

切片有两种基本初始化方式：

切片可以通过内置的make函数来初始化，初始化时len=cap，一般使用时省略cap参数，默认和len参数相同，在追加元素时，如果容量cap不足时，将按len的2倍动态扩容。

通过数组来初始化切片，以开始和结束索引位置来确定最终所引用的数组片段。

//make([]T, len, cap) //T是切片的数据的类型，len表示length，cap表示capacity
{
    s := make([]int,5)      //len: 5  cap: 5
    s := make([]int,5,10)    //len: 5  cap: 10
    s := []int{1,2,3}
} 

{
    arr := [...]int{0,1,2,3,4,5,6,7,8,9}
    s1 := arr[:]
    s2 := arr[2:5]
    s3 := arr[2:5:7]
    s4 := arr[4:]
    s5 := arr[:4]
    s6 := arr[:4:6]

    fmt.Println("s1: ",s1, len(s1),cap(s1))
    fmt.Println("s2: ",s2, len(s2),cap(s2))
    fmt.Println("s3: ",s3, len(s3),cap(s3))
    fmt.Println("s4: ",s4, len(s4),cap(s4))
    fmt.Println("s5: ",s5, len(s5),cap(s5))
    fmt.Println("s6: ",s6, len(s6),cap(s6))
}
输出：
s1:  [0 1 2 3 4 5 6 7 8 9] 10 10
s2:  [2 3 4] 3 8
s3:  [2 3 4] 3 5
s4:  [4 5 6 7 8 9] 6 6
s5:  [0 1 2 3] 4 10
s6:  [0 1 2 3] 4 6

通过上例说明cap 是表示切片所引用数组片段的真实长度，len是表示已经赋过值的最大下标(索引)值加1.

注意下面两种初始化方式的区别：

{
    var a  []int
    b := []int{}
    fmt.Println(a==nil,b==nil)

    fmt.Printf("a: %#v\n", (*reflect.SliceHeader)(unsafe.Pointer(&a)))
    fmt.Printf("b: %#v\n", (*reflect.SliceHeader)(unsafe.Pointer(&b)))
    fmt.Printf("a size %d\n", unsafe.Sizeof(a))
    fmt.Printf("b size %d\n", unsafe.Sizeof(b))
}
输出：
true false
a: &reflect.SliceHeader{Data:0x0, Len:0, Cap:0}
b: &reflect.SliceHeader{Data:0x5168b0, Len:0, Cap:0}
a size 24
b size 24
说明：
1. 变量b的内部指针被赋值，即使该指针指向了runtime.zerobase，但它依然完成了初始化操作
2. 变量a表示一个未初始化的切片对象，切片本身依然会分配所需的内存

切片之间不支持逻辑运算符，仅能判断是否为nil，比如：

{
    var a  []int
    b := []int{}
    fmt.Println(a==b) //invalid operation: a == b (slice can only be compared to nil)
}

reslice

在原slice的基础上进行新建slice，新建的slice依旧指向原底层数组，新创建的slice不能超出原slice

的容量，但是不受其长度限制，并且如果修改新建slice的值，对所有关联的切片都有影响，比如:

{
    s := []string{"a","b","c","d","e","f","g"}

    s1 := s[1:3]        //b,c
    fmt.Println(s1, len(s1),cap(s1))
    s1_1 := s1[2:5]        //c,d,e
    fmt.Println(s1_1, len(s1_1),cap(s1_1))
}
输出：
[b c] 2 6
[d e f] 3 4

append

向切片尾部追加数据，返回新的切片对象; 数据被追加到原底层数组，如果超出cap限制，则为新切片对象重新分配数组，新分配的数组cap是原数组cap的2倍，比如：

{
    s := make([]int,0,5)
    s = append(s , 1)
    s = append(s , 2,3,4,5)
    fmt.Printf("%p, %v, %d\n", s,s, cap(s))
                                                                                                                                                                                                                   
    s = append(s , 6)       //重新分配内存
    fmt.Printf("%p, %v, %d\n", s, s, cap(s))
}
输出：
0xc420010210, [1 2 3 4 5], 5
0xc4200140a0, [1 2 3 4 5 6], 10

如果是向nil切片追加数据，则会高频率的重新分配内存和数据复制，比如:

{
    var s []int
    fmt.Printf("%p, %v, %d\n", s,s, cap(s))
    for i:= 0; i < 10;i++{
        s = append(s, i)
        fmt.Printf("%p, %v, %d\n", s, s, cap(s))
    }
}

所以为了避免程序运行中的频繁的资源开销，在某些场景下建议预留出足够多的空间。

copy

两个slice之间复制数据时，允许指向同一个底层数组，并允许目标区间重叠。最终复制的长度以较短的切片长度(len)为准，比如：

{
    s1 := []int{0, 1, 2, 3, 4, 5 ,6}
    s2 := []int{7, 8 ,9}
    copy(s1,s2)
    fmt.Println(s1,len(s1),cap(s1))
    s1 = []int{0, 1, 2, 3, 4, 5 ,6}
    s2 = []int{7, 8 ,9} 
    copy(s2,s1)
    fmt.Println(s2,len(s2),cap(s2))
}

那么可不可以在同一切片之间复制数据呢？

在项目开发过程中，如果slice长时间引用一个大数组中很小的片段，那么建议新建一个独立的切片，并复制出所需的数据，以便原数组内存可以被gc及时释优化回收。