坦白来讲,这章如果不仔细读两遍的话,不是那么好懂。
其实这章只要理解了作者说的“对象”和“数据结构”这两个概念,就好懂了,说下我的理解:
“对象”:暴露行为(方法),隐藏数据(成员private,没有get/set)。
“数据结构”:暴露数据(成员public,或者有get/set),没有明显的行为(方法)。
好,进入正题:
将变量设置为私有(private)有一个理由:我们不想其他人依赖这些变量。但是还是有很多程序员给对象自动添加get/set方法,将私有变量公之于众、如同他们根本就是公共变量一般。
一、数据抽象
举例,如下是两段表示Point的数据结构的代码。
public class Point {
public double x;
public double y;
}
public interface Point {
double getX();
double getY();
void setCartesian(double x, double y);
double getR();
double getTheta();
void setPolar(double r, double theta);
}
第二段代码的精妙之处在于,你不知道该实现会是在矩阵坐标系中还是极坐标系中,或者可能是其他的什么坐标系。然而,该接口还是明白无误的呈现出了Point这种数据结构。而段代码要求我们直接对x,y坐标进行操作,这其实暴露了Point的内部结构。实际上,即使变量设置成private,但因为我们也通过get、set方法使用变量,其结构仍然暴露了。
隐藏实现并非只是在变量之间放上一个函数层(比如get/set方法)那么简单。隐藏实现关乎抽象。类并不是简单地用get和set方法将其变量推向外部了,而是暴露了抽象接口,以便用户无需了解数据的实现就能操作数据本体。
举个例子解释上面这段话,假设要计算机动车的剩余油量百分比,有以下两段代码:
public interface Vehicle {
double getFuelTankCapacityInGallons();
double getGallonsOfGasoline();
}
public interface Vehicle {
double getPercentFuelRemaining();
}
以上两段代码第二种更好。段代码中直接暴露了燃油车的数据结构,你可以直接看出方法是哪些字段的get方法。而第二段代码中采用了百分比计算方法的抽象,隐藏了机动车的数据结构,直接获取剩余油量百分比。
写代码的过程中,我们不愿意暴露数据细节,更愿意以抽象形态表述数据(例如上面获取剩余油量百分比的方法)。无脑地添加get/set方法,是坏的选择。
二、数据、对象的反对称性
对象把数据隐藏于抽象之后,暴露操作数据的函数。数据结构暴露其数据,没有提供有意义的函数。举例说明:
下面这段代码是过程式代码的范例。Geometry类操作了三个形状类。形状类都是简单的数据结构,没有任何行为(方法)。所有行为都在Geometry类中。
public class Square {
public Point topLeft;
public double side;
}
public class Rectangle {
public Point topLeft;
public double height;
public double width;
}
public class Circle {
public Point center;
public double radius;
}
public class Geometry {
public final double PI = 3.141592653589793;
public double area(Object shape) throws NoSuchShapeException {
if (shape instanceof Square) {
Square s = (Square) shape;
return s.side * s.side;
} else if (shape instanceof Rectangle) {
Rectangle r = (Rectangle) shape;
return r.height * r.width;
} else if (shape instanceof Circle) {
Circle c = (Circle) shape;
return PI * c.radius * c.radius;
}
throw new NoSuchShapeException();
}
}
想想看,如果给Geometry类添加一个primeter()函数会怎样?现有的形状类根本不会受到影响。另一方面,如果添加一个新形状,那就得修改Geometry类中的所有函数来处理它了!
再来看下面这段面向对象方法的解决方案,这里area()方法是多态的,不需要有Geometry类。所以添加一个新形状的类,现有的函数一个也不会受到影响,而当添加新函数时所有的形状都得做修改。
public class Square implements Shape {
private Point topLeft;
private double side;
public double area() {
return side * side;
}
}
public class Rectangle implements Shape {
private Point topLeft;
private double height;
private double width;
public double area() {
return height * width;
}
}
public class Circle implements Shape {
private Point center;
private double radius;
public final double PI = 3.141592653589793;
public double area() {
return PI * radius * radius;
}
}
对象与数据之间的二分原理:过程式代码(使用数据结构的代码)便于在不改动既有数据结构的前提下添加新函数,面向对象代码便于在不改动既有函数的前提下添加新类。
反过来说也说得通:过程式代码难以添加新数据结构,因为必须修改所有函数,面向对象代码难以添加新函数,因为必须修改所有类。所以,对于面向对象较难的事,对于过程式代码却较容易,反之亦然。这个就是数据和对象的反对称性。
在任何一个复杂系统中,都会需要添加新数据类型而不是新函数的时候。这时,对象和面向对象就比较合适。另一方面,也会有想要添加新函数而不是数据类型的时候。在这种情况下,过程式代码和数据结构更合适。可根据需求选择。
三、迪米特法则
迪米特法则(Law of Demeter)又叫作少知识原则,英文简写为: LoD。迪米特法则认为一个类对于其他类知道的越少越好,就是说一个对象应当对其他对象有尽可能少的了解,只和朋友通信,不和陌生人说话。
如上一节所说,对象隐藏数据,暴露操作。这也就意味着对象不应该通过get/set方法暴露其内部结构,因为这样更像是暴露结构而不是隐藏内部结构。
举个例子:
下面这个代码违反了迪米特法则,因为它调用了getOptions()方法返回值的getScratchDir()方法,又调用了getScratchDir()方法返回值的getAbsolutePath()方法。
final String outputDir = ctxt.getOptions().getScratchDir().getAbsolutePath();
get方法把这个问题搞复杂了。如果我们用下面代码这种形式,就不涉及到违反迪米特法则的问题了。
final String outputDir = ctxt.options.scratchDirs.absolutePath;
所以这里可以做个小总结:如果数据结构只简单地拥有公共变量,没有函数;对象拥有私有变量和公共方法,那么就很容易判断是不是符合迪米特法则,问题就不容易混淆。
但是很不幸,有些代码一半是对象、另一半是数据结构。这将会导致这种代码既增加了添加新函数的难度,又增加了添加新数据结构的难度,两边不讨好。所以应该尽量避免这种结构的代码。
四、数据传送对象(DTO)
为精炼的数据结构,是一个只有公共变量、没有函数的类。这种数据结构有时被称为数据传送对象(Data Transfer Object,DTO)。DTO非常有用,尤其是在与数据库通信等应用场景下,用于将原始数据转化为数据库中数据。
Active Record是一种特殊形式的DTO形式。它们拥有公共变量的数据结构,但通常也会有类似save、find这样的方法。Active Record是一种领域模型模式,特点是一个模型类对应关系型数据库中的一个表,而模型类的一个实例对应表中的一行记录。这类数据结构中不应该塞进业务方法,不然会导致数据结构和对象混杂,造成之前提到过的两面不讨好的问题。
参考
《代码整洁之道》