golang 数据二 (切片)

2023-06-08,,

在项目开发过程中,更多的场景是需要一个长度可以动态更新的数据存储结构,切片本身并非是动态数组或数组指针,他内部通过指针引用底层数组,并设定相关属性将数据读写操作限定在指定区域内。比如:

/runtime/slice.go

type slice struct {
	array unsafe.Pointer
	len   int
	cap   int
}

切片初始化

切片有两种基本初始化方式:

切片可以通过内置的make函数来初始化,初始化时len=cap,一般使用时省略cap参数,默认和len参数相同,在追加元素时,如果容量cap不足时,将按len的2倍动态扩容。

通过数组来初始化切片,以开始和结束索引位置来确定最终所引用的数组片段。

//make([]T, len, cap) //T是切片的数据的类型,len表示length,cap表示capacity
{
    s := make([]int,5)      //len: 5  cap: 5
    s := make([]int,5,10)    //len: 5  cap: 10
    s := []int{1,2,3}
} 

{
    arr := [...]int{0,1,2,3,4,5,6,7,8,9}
    s1 := arr[:]
    s2 := arr[2:5]
    s3 := arr[2:5:7]
    s4 := arr[4:]
    s5 := arr[:4]
    s6 := arr[:4:6]

    fmt.Println("s1: ",s1, len(s1),cap(s1))
    fmt.Println("s2: ",s2, len(s2),cap(s2))
    fmt.Println("s3: ",s3, len(s3),cap(s3))
    fmt.Println("s4: ",s4, len(s4),cap(s4))
    fmt.Println("s5: ",s5, len(s5),cap(s5))
    fmt.Println("s6: ",s6, len(s6),cap(s6))
}
输出:
s1:  [0 1 2 3 4 5 6 7 8 9] 10 10
s2:  [2 3 4] 3 8
s3:  [2 3 4] 3 5
s4:  [4 5 6 7 8 9] 6 6
s5:  [0 1 2 3] 4 10
s6:  [0 1 2 3] 4 6

通过上例说明cap 是表示切片所引用数组片段的真实长度,len是表示已经赋过值的最大下标(索引)值加1.

注意下面两种初始化方式的区别:

{
    var a  []int
    b := []int{}
    fmt.Println(a==nil,b==nil)

    fmt.Printf("a: %#v\n", (*reflect.SliceHeader)(unsafe.Pointer(&a)))
    fmt.Printf("b: %#v\n", (*reflect.SliceHeader)(unsafe.Pointer(&b)))
    fmt.Printf("a size %d\n", unsafe.Sizeof(a))
    fmt.Printf("b size %d\n", unsafe.Sizeof(b))
}
输出:
true false
a: &reflect.SliceHeader{Data:0x0, Len:0, Cap:0}
b: &reflect.SliceHeader{Data:0x5168b0, Len:0, Cap:0}
a size 24
b size 24
说明:
1. 变量b的内部指针被赋值,即使该指针指向了runtime.zerobase,但它依然完成了初始化操作
2. 变量a表示一个未初始化的切片对象,切片本身依然会分配所需的内存

切片之间不支持逻辑运算符,仅能判断是否为nil,比如:

{
    var a  []int
    b := []int{}
    fmt.Println(a==b) //invalid operation: a == b (slice can only be compared to nil)
}

reslice

在原slice的基础上进行新建slice,新建的slice依旧指向原底层数组,新创建的slice不能超出原slice

的容量,但是不受其长度限制,并且如果修改新建slice的值,对所有关联的切片都有影响,比如:

{
    s := []string{"a","b","c","d","e","f","g"}

    s1 := s[1:3]        //b,c
    fmt.Println(s1, len(s1),cap(s1))
    s1_1 := s1[2:5]        //c,d,e
    fmt.Println(s1_1, len(s1_1),cap(s1_1))
}
输出:
[b c] 2 6
[d e f] 3 4

append

向切片尾部追加数据,返回新的切片对象; 数据被追加到原底层数组,如果超出cap限制,则为新切片对象重新分配数组,新分配的数组cap是原数组cap的2倍,比如:

{
    s := make([]int,0,5)
    s = append(s , 1)
    s = append(s , 2,3,4,5)
    fmt.Printf("%p, %v, %d\n", s,s, cap(s))
                                                                                                                                                                                                                   
    s = append(s , 6)       //重新分配内存
    fmt.Printf("%p, %v, %d\n", s, s, cap(s))
}
输出:
0xc420010210, [1 2 3 4 5], 5
0xc4200140a0, [1 2 3 4 5 6], 10

如果是向nil切片追加数据,则会高频率的重新分配内存和数据复制,比如:

{
    var s []int
    fmt.Printf("%p, %v, %d\n", s,s, cap(s))
    for i:= 0; i < 10;i++{
        s = append(s, i)
        fmt.Printf("%p, %v, %d\n", s, s, cap(s))
    }
}

所以为了避免程序运行中的频繁的资源开销,在某些场景下建议预留出足够多的空间。

copy

两个slice之间复制数据时,允许指向同一个底层数组,并允许目标区间重叠。最终复制的长度以较短的切片长度(len)为准,比如:

{
    s1 := []int{0, 1, 2, 3, 4, 5 ,6}
    s2 := []int{7, 8 ,9}
    copy(s1,s2)
    fmt.Println(s1,len(s1),cap(s1))
    s1 = []int{0, 1, 2, 3, 4, 5 ,6}
    s2 = []int{7, 8 ,9} 
    copy(s2,s1)
    fmt.Println(s2,len(s2),cap(s2))
}

那么可不可以在同一切片之间复制数据呢?

在项目开发过程中,如果slice长时间引用一个大数组中很小的片段,那么建议新建一个独立的切片,并复制出所需的数据,以便原数组内存可以被gc及时释优化回收。

《golang 数据二 (切片).doc》

下载本文的Word格式文档,以方便收藏与打印。