Swift 值语义(二)

5/5/2022 swiftios

在上篇的介绍中,我相信你已经知道值语义是什么了,接下来我们来看看值语义被破坏的案例,以及相应的解决方案。

1_N4CTsUuCT8mu7k2YlADqxQ

# 没有值语义的问题

要了解值语义的好处,让我们看看没有值语义的类型会导致什么问题。

首先我们聊聊嵌套类型,当嵌套值类型和引用类型的时候会有四种不同的组合。

  • 一个引用类型嵌套了另外一个引用类型,没有特别之处,任何一个内部或者外部值的引用都能操纵他指向的对象,只要其中一个引用操纵值使其改变,其他引用指向的值也随着变化。

    class Inner {
        var value = 1
    }
    
    class Outer {
        var value = 1
        var inner = Inner()
    }
    
    var outer1 = Outer()
    var outer2 = outer1
    outer1.value = 2
    outer2.inner.value = 3
    
    outer2.value // 2
    outer1.inner.value // 3
    
  • 一个值类型嵌套了另外一个值类型,会使值所占的内存区域变大。内部值是外部值的一部分。如果你把外部值放到一块新的存储空间里,所有的值包括内部值都会被拷贝。如果你把内部值放进一块新的存储空间中,只有内部值会被拷贝。

    struct Inner {
        var value = 1
    }
    
    struct Outer {
        var value = 1
        var inner = Inner()
    }
    
    var outer1 = Outer()
    var outer2 = outer1
    outer1.value = 2
    outer1.inner.value = 3
    
    outer2.value // 1
    outer2.inner.value // 1
    
  • 一个引用类型嵌套了一个值类型,会扩大这个引用类型所占内存。任何外部值的引用都可以操纵一切,包括嵌套的内部值。内部值的任何改变对于引用外部值的指针来说都是可见的。如果你把内部值放进一块新的存储区,就会在那块存储区拷贝一份新的值。

    struct Inner {
        var value = 1
    }
    
    class Outer {
        var value = 1
        var inner = Inner()
    }
    
    var outer1 = Outer()
    var outer2 = outer1
    outer1.value = 2
    outer1.inner.value = 3
    
    outer2.value // 2
    outer2.inner.value // 3
    
    var copyInnter = outer2.inner
    copyInnter.value = 10
    
    outer2.inner.value // 3, 说明copyInnter是独立修改
    
  • 一个值类型嵌套了一个引用类型,这个就非常有趣了。可以打破值语义而不被察觉。当你把一个引用类型嵌套进一个值类型中,外部值被放进一块新的内存区域时就会被拷贝,但是拷贝的对象仍然指向原始的那个嵌套对象。

    class Inner {
        var value = 1
    }
    
    struct Outer {
        var value = 1
        var inner = Inner()
    }
    
    var outer1 = Outer()
    var outer2 = outer1
    outer1.value = 2
    outer1.inner.value = 3
    
    outer2.value // 1,独立的
    outer2.inner.value // 3,跟outer1共享
    

    通常这里很容易引发问题,如果我们不去看Outer的代码声明,就会误以为 outer2 是 outer1 的完全拷贝(深拷贝),理所当然的觉得修改outer.inner.value值对outer2没有影响,进而写出不安全的代码。这通常应该避免,因为在值类型上使用引用类型属性会引入堆分配,引用计数和隐式数据共享,影响值类型的性能和其他优点。

# 值类型嵌引用类型

正如上文所述,当类型内部含有一个或多个可变引用,如果没有好的代码约束,很容易写出不安全的代码。通常,我们对值类型的拷贝都希望是深拷贝。而直接通过赋值且不做任何处理的话,这样是无法实现的。那么我们该怎么办?

# 自定义 clone 方法

我们自定义一个Clonable的协议。需要拷贝的类型都进行实现这个协议。

protocol Clonable {
    func clone() -> Self
}

final class Inner: Clonable {
    var value: Int
    
    init(value: Int = 1) {
        self.value = value
    }

    func clone() -> Inner {
        return Inner(value: value)
    }
}

struct Outer: Clonable {
    var value = 1
    var inner = Inner()
    
    func clone() -> Outer {
        return Outer(value: value, inner: inner.clone())
    }
}

var outer1 = Outer()
var outer2 = outer1.clone()
outer1.value = 2
outer2.inner.value = 3

outer1.value // 2
outer1.inner.value // 1
outer2.value  // 1
outer2.inner.value // 3

我们显示调用clone()来实现对Outer的深拷贝。 这么做还不如直接将Outer定义为一个类,语义反而变得清晰。当然抛开这些观点,Swift 对于这个问题有没有更好的解决方案?

# 写时复制

在混合类型中保留价值语义的诀窍是定义该类型,使其调用方无法看到修改对所含引用类型属性的影响。怎么理解?

这个例子使可变参考类型成为私有,并提供了一个控制读写的接口。


class Inner{
    var value: Int
    
    init(value: Int = 1) {
        self.value = value
    }
}

struct Outer {
    var value = 1
    private var inner = Inner() // 声明为私有
    
    var innerValue: Int {
        get {
            inner.value
        }
        set {
           inner = Inner(value: newValue)
        }
    }
}

var outer1 = Outer()
var outer2 = outer1
outer1.value = 2
//outer2.inner.value = 3
outer2.innerValue = 3

outer1.value // 2
outer1.innerValue // 1
outer2.value  // 1
outer2.innerValue // 3

对于可以访问私有成员的代码来说,这个结构包含可变的引用型属性inner,破坏了值语义。但是对于具有内部访问权限的客户来说,该类型的行为就像一个具有值语义的结构,有两个属性,即valueinnerValue

每当用户修改innerValue时,就会创建一个新的Inner实例,而这能保持Outer值的独立性。

如果Inner是一个巨类,每当从Outer实例只读取inner的时候,都是读取共享那个inner实例。那么对于多个Outer实例来说,将节省大量的inner内存占用,因为没有修改所以不会产生新对象的创建,节省了复制存储的计算成本。

一旦你对innerValue赋值,就会创建新的Inner实例。创建会延迟到需要的时候,从而最大限度地减少了即时的存储和计算成本。

但每次对innerValue进行赋值,都会创建新的Inner实例,特别是如果只有一个实例,多次调用innerValue,那么性能是非常低下的。Swift 提供了写时复制机制,如果对象没有在其他地方引用,就地进行修改。这个优化比创建一个新的实例和丢弃旧的实例更高效。

为了使其发挥作用,需要一种方法来告诉它是否唯一地引用了一个给定的实例。函数isKnownUniquelyReferenced就提供了这样的功能:

class Inner{
    var value: Int
    
    init(value: Int = 1) {
        self.value = value
    }
}

struct Outer {
    var value = 1
    private var inner = Inner() // 声明为私有
    
    var innerValue: Int {
        get {
            inner.value
        }
        set {
            if isKnownUniquelyReferenced(&inner) {
                print("just change \(newValue)")
                inner.value = newValue
            } else {
                print("create change \(newValue)")
                inner = Inner(value: newValue)
            }
        }
    }
}

var outer1 = Outer()
var outer2 = outer1
outer1.value = 2
outer2.innerValue = 3
outer2.innerValue = 4

outer1.value // 2
outer1.innerValue // 1
outer2.value  // 1
outer2.innerValue // 4

通过上面的修改后,作为Outer的使用者,再也不需要操心引用类型是深拷贝还是浅拷贝的问题了。

# 理解

就语言的语义来说,只有在数据被改变的时候他们的差异会有影响。但是如果你的数据是不可变的,那么值类型和引用类型的差别就不存在了,至少问题就转向性能而不是语法了。

写时复制让我们能够在创建值类型的自定义结构体的同时,保持像对象和指针那样的高效操作。作为结构体的使用者,不需要操心其内部引用属性是否破话了值语义的问题。得益于写时复制,大量的不必要的复制操作都可以被移除。

结构体应该是具有值语义的。当在一个结构体中使用类时,需要保证它确实是不可变的。如果办不到这一点,则需要(像上面那样的)额外的操作步骤。或者就干脆使用一个类,这样数据的使用者就不会期望它表现得像一个值。

最后:不管在设计一个值类型或者引用类型,都应该让类型的语义单一。

# 参考

上次更新: 5/7/2022, 4:33:59 PM