PostgreSQL 与 12306 抢火车票的思考-阿里云开发者社区

背景

马上春节了, 火车票又到了销售旺季, 一票难求依旧。

抢火车票是很有意思的一个课题，对IT人的智商以及IT系统的健壮性，尤其是数据库的功能和性能都是一种挑战。

为什么这么说呢，我们一起来缕一缕。

售票系统的需求

铁路售票系统最基本的需求，查询余票、余票统计、购票、车次变化等。

下面分析一下这些需求。

查询余票

你如果要买从北京到上海的火车票，通常会查一下哪些车次还有余票。

过滤条件很多，比如

1. 源、目的、中转站

2. 车次类型

3. 出发时段

4. 到达时段

5. 席别

6. 过滤掉没有余票的车次

输出还要考虑到排序、分页。

查询余票通常不是实时的、或者说不一定是准确的，有可能是分时统计的结果。

即使是实时统计的结果，再高并发的抢票期间，你看到的信息对你来说也可能是很快就会失效的。

查询余票的另一个需求是路径规划, 自动适配(中转站点s)

这个功能以前可能没有，但是总有一天会暴露出来，特别是车票很紧张的情况下。

就比如从北京到上海，直达的没有了，系统可以帮你看看转一趟车的，转2趟车的，转N趟车的。（当然，转的越多越复杂）。

而且在转车这个角度来讲，实际上已经扯上路径规划了，怎么转是最快的，（里面还涉及转车的输入要求（比如用户要求在一线城市转车，或者必须要转高铁））。

关于路径规划，可以参考一下pgrouting。

《聊一聊双十一背后的技术 - 物流, 动态路径规划》

设计痛点

通常来说，用户可能会查询很多次，才选到合适日期的合适车次的票。

查询量比较大，春节期间更甚。

余票信息需要统计，查询会耗费较多的CPU, IO。

余票统计

对于售票系统来说，查询余票实际上是一个统计操作。

统计操作相比键值查询，不但消耗大量的IO还消耗CPU资源。

为了减少实时查询余票的开销，通常会分时进行统计，更新最新的统计信息。

用户查询余票信息时，查到的是统计后的结果。

我们可以看到12306主页的余票大盘数据

设计痛点

余票信息需要统计，查询会耗费较多的CPU,IO。

购票

购票相对于查询余票来说，从请求量来分析，比查询请求更少，因为通常来说，用户可能会查询很多次，才选到合适日期的合适车次的票。

但是由于购票是一个写操作，所以设计的关键是降低粒度，减少锁冲突，减少数据扫描量。

另外还需要考虑的是

1. 同一趟车次的同一个座位，在不同的维度可能会被多次售卖

1.1 时间维度

1.2 空间维度，不同的起始站点

2. 票价

票价一般和席别绑定，按区间计费。

另一个需求是尽量的将票卖出去，减少空洞座位。

打个比方，从北京到上海的车，中间经过（天津、徐州、南京、无锡、苏州），如果天津到南京段有人买了，剩下的没有被购买的段应该还可以继续被购买。

设计痛点

1. 为了减少购票系统的写锁冲突，例如同一个座位，尽量不出现因为一个会话在更新它，其他会话需要等待的情况。

（比如A用户买了北京到天津的，B用户买了天津到上海的同一趟车的同一个座位，那么应该设计合理的合并操作（如数据库内核改进）或者从设计上避免锁等待）

车次新增、删除、变更

春节来临时、通常需要对某些热门线路增加车次。

及车次的新增、删除和变更需求。

在设计数据库时，应该考虑到这一点。

设计痛点

车次的变更简直是牵一发而动全身，比如余票统计会跟着变化，查询系统也要跟着变化。

还有初始化信息的准备，例如为了加快购票的速度，可能会将车次的数据提前准备好（也许是每个座位一条记录）。

对账需求

这个属于对账系统，票可能是经过很多渠道卖出去的，例如支付宝、去哪儿、携程、铁老大的售票窗口、银行的代理窗口、客运机构等等。

这里就涉及到实际的销售信息与资金往来的对账需求。

通常这个操作是隔天延迟对账的。

退票、改签需求

退票和改签也是比较常见的需求，特别是现在APP流行起来，退改签都很方便。

这就导致了用户可能会先买好一些，特别是春节期间，用户无法预先知道什么时候请假回家，所以先买几张不同日期的，到时候提前退票或者改签。

改签和退票就涉及到位置回收（对数据库来说也许是UPDATE数据），改签还涉及购票同样的流程。

设计痛点

与购票类似

取票

这个就很简单了，就是按照用户ID，查询已购买，未打印的车票。

其他需求

票的种类

学生票、团体票、卧铺、站票

这里特别是站票，站票是有上限的，需要控制一趟车的站票人数

站票同样有起点和终点，但是有些用户可能买不到终点的票，会先买一段的，然后补票或者就一直在车上不下车，下车后再补票。

先上车后补票

这个手段极其恶劣，不过很多人都是这么干的，未婚先孕，现在的年轻人啊。。。。

通常会考虑容积率，避免站票太多。

痛点小结

1. 通常来说，用户可能会查询很多次，才选到合适日期的合适车次的票。

查询量比较大，春节期间更甚。

2. 余票信息需要统计，查询会耗费较多的CPU, IO。

3. 为了减少购票系统的写锁冲突，例如同一个座位，尽量不出现因为一个会话在更新它，其他会话需要等待的情况。

4. 车次的变更简直是牵一发而动全身，比如余票统计会跟着变化，查询系统也要跟着变化。

还有初始化信息的准备，例如为了加快购票的速度，可能会将车次的数据提前准备好（也许是每个座位一条记录）。

数据库设计

综合以上痛点和需求分析，我们在设计时应尽量避免锁等待，避免实时余票查询。

PostgreSQL亮点特性

PostgreSQL是全世界最高级的开源数据库，几乎适用于任何场景。

有很多特性是可以用来加快开发效率，满足架构需求的。

针对铁路售票系统，我罗列一下用到了哪些特性。

1. 使用varbit存储每趟车的每个座位途径站点是否已销售。

例如 G1921车次，从北京到上海，途径天津、徐州、南京、苏州。包括起始站，总共6个站点。那么使用6个比特位来表示。

'000000'

如果我要买从天津到徐州的，这个值变更为(下车站的BIT不需要设置)

'010000'

这个位置还可以卖从北京到天津，从徐州到终点的任意站点。

余票统计也很方便，对整个车次根据BIT做聚合计算即可。

统计任意组合站点的余票（北京-天津, 北京-徐州, 北京-南京, 北京-苏州, 北京-上海, 天津-徐州, 天津-南京, ......, 苏州-上海）

count(varbit) returns record

统计指定起始站点的余票（start: 北京, end: 南京；则返回的是北京-南京的余票）

count(varbit, start, end) returns record

以上两个需求，开发对应的聚合函数即可，其实就是一些指定范围的bitand的count操作。

2. 使用数组存储每趟车的起始站点

使用数组来存储，好处是可以使用到数组的GIN索引，快速的检索哪些车次是可以搭乘的。

例如查询从北京到南京的车次。

select 车次 from table where column @> array['北京','南京'];

这条SQL是可以走索引的，效率非常高。

3. skip locked

这个特性是跳过已被锁定的行，比如用户要购买某一趟从北京到南京的车票，其实是一次UPDATE，SET BIT的操作。

但是很可能其他用户也在购买，可能就会出现锁冲突，为了避免这个情况发生，可以skip locked，跳过锁冲突，直接找另一个座位。

select * from table
where column1='车次号' -- 指定车次
and column2='车次日期' -- 指定发车日期
-- and mod(pg_backend_pid(),100) = mod(pk,100) -- 提高并发，如果有多个连接并发的在更新，可以直接分开落到不同的行，但是可能某些pID卖完了，可能会找不到票，建议不要开启这个条件
and column4='席别' -- 指定席别
and getbit(column3, 开始站点位置, 结束站点位置-1) = '0...0' -- 获取起始位置的BIT位，要求全部为0
order by column3 desc -- 这个目的是先把已经卖了散票的的座位拿来卖，也符合铁大哥的思想，尽量把起点和重点的票卖出去，减少空洞
for update
skip locked -- 跳过被锁的行，老牛逼了，不需要锁等待
limit ?; -- 要买几张票

4. cursor

如果要查询大量记录，可以使用cursor，减少重复扫描。

5. 路径规划

如果用户选择直达车已经无票了，可以自动计算转一趟，若干趟车的最佳搭乘路线。

选择途径站点即可。

参考一下pgrouting，与物流的动态路径规划需求一致。

《聊一聊双十一背后的技术 - 物流, 动态路径规划》

6. 多核并行计算

开源也支持多核并行计算的，在生成余票统计时，为了提高生成速度，可以将更多的CPU加入进来并行计算，快速得到余票统计。

7. 资源隔离

PostgreSQL为进程模型，所以可以控制每个进程的资源开销，包括(CPU,IOPS,MEMORY,network)，在铁路售票系统中，查询和售票是最关键的需求，使用这种方法，可以在关键时刻保证关键业务有足够的资源，流畅运行。

这个思想和双十一护航也是一样的，在双十一期间，会关掉一些不必要的业务，保证主要业务的资源，以及它们的流畅运行。

8. 分库分表

铁路数据也达到了海量数据的级别，但是还好铁路的数据是比较好分区的，例如按照车次就可以很好的分区。

PostgreSQL的分库分表方案很多，例如plproxy, pgpool-II, pg-xl, pg-xc, citus等等.

9. 递归查询

铁路有非常典型的上下文相关特性，例如一趟车途径N个站点，全国铁路组成了一个很大的铁路网。

递归查询可以根据某一个节点，向上或者向下递归搜索相关的站点。

10. MPP

基于PostgreSQL的MPP产品很多，例如Postgres-XL, Greenplum, Hawq, REDSHIFT, paraccl, 等等。

使用PG可以和这些产品很好的融合，保持语法一致。

降低数据分析的开发成本。

数据库设计(伪代码)

1. 列车信息表 :

create table train     
(id int primary key, --主键    
go_date date, -- 发车日期    
train_num name, -- 车次    
station text[] -- 途径站点数组    
);

2. 位置信息表 :

create table train_sit     
(id serial8 primary key, -- 主键    
tid int references train (id), --关联列车ID    
bno int, -- 车厢或bucket号    
sit_level text, -- 席别  
sit_no int,  -- 座位号  
station_bit varbit  -- 途径站点组成的BIT位信息, 已售站点用1表示, 未售站点用0表示. 购票时设置起点和终点-1, 终点不设置   
);

3. 测试数据模型, 1趟火车, 途径14个站点.

insert into train values (1, '2013-01-20', 'D645', array['上海南','嘉兴','杭州南','诸暨','义乌','金华','衢州','上饶','鹰潭','新余','宜春','萍乡','株洲','长沙']);

4. 插入测试数据, 共计200W个车厢或bucket, 每个车厢98个位置.

insert into train_sit values (id, 1, id, '一等座', generate_series(1,98), repeat('0',14)::varbit) from generate_series(1,1000000) t(id);    
insert into train_sit values (id, 1, id, '二等座', generate_series(1,98), repeat('0',98)::varbit) from generate_series(1000001,2000000) t(id);

5. 创建取数组中元素位置的函数 (实际生产时可以使用C实现) :

create or replace function array_pos (a anyarray, b anyelement) returns int as $$    
declare    
  i int;    
begin    
  for i in 1..array_length(a,1) loop    
    if b=a[i] then    
      return i;    
    end if;    
    i := i+1;    
  end loop;    
  return null;    
end;    
$$ language plpgsql;

6. 创建购票函数 (伪代码) :

下单，更新

create or replace function buy     
(    
inout i_train_num name,     
inout i_fstation text,     
inout i_tstation text,    
inout i_go_date date,    
inout i_sits int, -- 购买多少张  
out o_slevel text,    
out o_bucket_no int,    
out o_sit_no int,    
out o_order_status boolean    
)     
declare  
  vid int[];  

begin  

-- 锁定席位  

open cursor for  
select array_agg(id) into vid[] from table   
  where column1='车次号'   -- 指定车次  
  and column2='车次日期'   -- 指定发车日期  
  -- and mod(pg_backend_pid(),100) = mod(pk,100)   -- 提高并发，如果有多个连接并发的在更新，可以直接分开落到不同的行，但是可能某些pID卖完了，可能会找不到票，建议不要开启这个条件  
  and column4='席别'  -- 指定席别  
  and getbit(column3, 开始站点位置, 结束站点位置-1) = '0...0'  -- 获取起始位置的BIT位，要求全部为0  
  order by column3 desc   -- 这个目的是先把已经卖了散票的的座位拿来卖，也符合铁大哥的思想，尽量把起点和重点的票卖出去，减少空洞  
  for update  
  skip locked  -- 跳过被锁的行，老牛逼了，不需要锁等待  
  limit ?;     -- 要买几张票  

  if array_lengty(vid,1)=? then  -- 确保锁定行数与实际需要购票的数量一致   

    -- 购票，更新席别，设置对应BIT=1  
    update ... set column3=set_bit(column3, 1, 开始位置, 结束位置) where id = any(vid);  
  end if;  

end;  
$$ language plpgsql;

测试(old 输出) :

digoal=# select * from buy('D645','杭州南','宜春','2013-01-20', 10);    
 i_train_num | i_fstation | i_tstation | i_go_date  | o_slevel | o_bucket_no | o_sit_no | o_order_status     
-------------+------------+------------+------------+----------+-------------+----------+----------------    
 D645        | 杭州南     | 宜春       | 2013-01-20 | 一等座   |       35356 |        9 | t    
(1 row)

7. 余票统计(伪代码)

表结构

create table ? (  
 车次  
 发车日期  
 起点  
 到站  
 余票  
);

统计SQL

select 车次,发车日期,count(varbit, 起点, 到站) from table where 车次=? 发车日期=?;

阿里云PostgreSQL varbit, array类型增强

在铁路购票系统中，有几个需求需要用到bit和array的特殊功能。

1. 余票统计

统计指定bit范围=全0的计数

不指定范围，查询任意组合的bit范围全=0的计数

2. 购票

指定bit位置过滤、取出、设置对应的bit值

根据数组值取其位置下标

回顾一下我之前写的两篇文章，也是使用varbit的应用场景，有异曲同工之妙

《基于阿里云 RDS PostgreSQL 打造实时用户画像推荐系统》

《门禁广告销售系统需求剖析与 PostgreSQL数据库实现》

PostgreSQL的bit, array功能已经很强大，阿里云RDS PostgreSQL的bitpack也是用户实际应用中的需求提炼的新功能，大伙一起来给阿里云提需求。

打造属于国人的PostgreSQL.

小结

本文从铁路购票系统的需求出发，分析了购票系统的痛点，以及数据库设计时需要注意的事项。

PostgreSQL的10个特性，可以很好的满足铁路购票系统的需求。

1. 照顾到余票查询的实时性、购票的锁竞争、以及分库分表的需求。

2. 购票时，如果是中途票，会尽量选择已售的中突破，减少位置空洞的产生，保证更多的人可以购买到全程票。

3. 使用bit描述了每一个站点是否被售出，不会出现有票不能卖的情况。

PostgreSQL 与 12306 抢火车票的思考

标签

背景

售票系统的需求

查询余票

设计痛点

余票统计

设计痛点

购票

设计痛点

车次新增、删除、变更

设计痛点

对账需求

退票、改签需求

设计痛点

取票

其他需求

票的种类

先上车后补票

痛点小结

数据库设计

PostgreSQL亮点特性

数据库设计(伪代码)

阿里云PostgreSQL varbit, array类型增强

小结

热门文章

最新文章

相关电子书