关系型数据库的几种常用主键

2020-09-22 11:03

一般来说关系型数据库，绝大多数表都有数据库主键。数据库主键的创建，一般有如下几种形式: 1. 使用数据库自增长主键的语法。有些数据库，比如 MS SQL Server, MySQL ,都有对应的语法，可以在创建数据库表的时候，指定某个字段为自增长主键。Oracle , PostgreSQL 则使用 sequence ，来达到类似的作用。

以下是 MS SQL Server 示例:


create table tb(id int identity(1,1) primary key );

以下是 PostgreSQL 示例:


--serial 并不是psql的类型，只是一个宏，
create table tablename ( colname serial );
--等价于
CREATE SEQUENCE tablename_colname_seq;
CREATE TABLE tablename (
    colname integer NOT NULL DEFAULT nextval('tablename_colname_seq')
);
ALTER SEQUENCE tablename_colname_seq OWNED BY tablename.colname;

自增长数据库主键，一般是 int/long 之类的整数/长整数。理论上有数据最大容量限制。

在 java/c# 代码中，可将这种主键字段，转换为 long.

2. 使用数据库的 GUID/UUID 之类的语法。

一般是数据字段类型 + 数据库内置函数设置默认值，来定义一个列，作为表的主键。

以下是 MS SQL Server 示例:


CREATE TABLE dbo.Globally_Unique_Data
(
    GUID UNIQUEIDENTIFIER
        CONSTRAINT Guid_Default DEFAULT
        NEWSEQUENTIALID() ROWGUIDCOL,
    Employee_Name VARCHAR(60)
    CONSTRAINT Guid_PK PRIMARY KEY (GUID)
);

在 java/c# 代码中，可将这种主键字段，转换为 string.

3. 使用字符串作为表主键，在java/c# 代码中生成 uuid ，填充数值。

以下是 MS SQL Server 示例:


CREATE TABLE [dbo].[tt_process_request](
    [process_request_uuid] [varchar](40) NOT NULL,
...
    [created_time] [datetime] NULL,
    [created_by] [varchar](50) NULL,
    [updated_time] [datetime] NULL,
    [updated_by] [varchar](50) NULL,
    [updated_cnt] [bigint] NULL,
 CONSTRAINT [PK_tt_process_request] PRIMARY KEY CLUSTERED 
(
    [process_request_uuid] ASC
);

C# 生成 uuid 的代码示例:


string fileUuid = System.Guid.NewGuid().ToString();

Java 生成 uuid 的代码示例如下:


public String createUuid() {
	return UUID.randomUUID().toString().replaceAll("-", "");
}

代码生成的 uuid, 中间有 - 分割数据，可以保留，也可以替换/去掉。

4. 使用字符型字段作为数据库表主键，对应某个业务数据。比如合同号: PS21152357。

这类数据中，往往其中的某几位，有一定的业务业务含义，比如，此处 "PS" 为合同号的标识。其它位数，为顺序号。

需要编写在 java/c# 代码中，来生成这种编号，并做并发防范。

总结：

方法4 ，一般称之为“业务主键”。对应的， 1-3 为“逻辑主键”。

总体而言，应尽量避免使用“业务主键”。因为使用这种主键，有时并非系统自动生成，而是人工录入(比如，数据源头在 ERP，现要在另一个系统中录入数据)，人工录入存在一定的出错几率，如果录入出错需要更改主键数据，则外键也要一并更改，往往比较麻烦。

1-3 的三种“逻辑主键”，我更倾向于第三种。

方法3" 使用字符串作为表主键，在java/c# 代码中生成 uuid ，填充数值"，不用考虑不同数据库间的差异，可以认为任何数据库都支持。使用起来也简单。

如果是使用自动生成代码工具，要看情况吧。可能有的工具，处理不了。我自己编写的工具，处理起来没问题。

至于 uuid 字段串，占用磁盘空间，比自增长整数/长整数占用的大的问题，其实我觉得并不是大问题。

这不会导致整个系统，磁盘空间需求，增加 1/4 或更多。一般可以忽略。

另，

数据库主键的定义，在某些数据库中，往往会自动带上"按此字段进行顺序存储"之类的语法。比如，SQL Server ，以下是示例:


CREATE TABLE [dbo].[tt_process_request](
    [process_request_uuid] [varchar](40) NOT NULL,
...,
 CONSTRAINT [PK_tt_process_request] PRIMARY KEY CLUSTERED 
(
    [process_request_uuid] ASC
)
) ;

这可以通过更改创建表的 SQL, 使用 PRIMARY KEY NONCLUSTERED 语法


CREATE TABLE dbo.Department
(
    xxx VARCHAR(10) NOT NULL PRIMARY KEY NONCLUSTERED,
    ...
)
;

然后再找一个字段，添加 CLUSTERED INDEX ，来解决此问题。


CREATE CLUSTERED INDEX IX_TestTable_TestCol1   
    ON dbo.TestTable (TestCol1);

当然，数据库表也可以既没有 CLUSTERED key、也没有 CLUSTERED index 。

这种情况下，表的数据存储，按 insert 的时间顺序，从先到后。大多数情况下，这种数据存放方式，是可以接受的。

数据显示时，再按照某个时间字段(交易数据, 比如销售单的销售时间)，或者业务数据主键(主数据/系统配置等)，进行查询排序，查询到排序后的数据，显示给用户。

欢迎转载，转载请注明出处: https://www.zheguisoft.com/staff_blogs/jacklondon_chen/2022, 及 https://www.cnblogs.com/jacklondon/p/create_primary_key_for_relationship_database.html