LOADING

缓存加载中...

3.24

2025/3/24 论文

 

1.osdi2024 :Massively Parallel Multi-Versioned Transaction Processing

idea:multi-version优化,GPU多版本确定性transaction数据库:epic.
事务批->epoch(分解为init和exe阶段)。

init阶段:读写集来初始化并发操作控制。根据写集分配版本,不会干扰事务执行。
exe阶段:并发执行事务并进行同步。epic根据事务顺序&已知读写顺序及计算每个读/写操作版本号——>可以直接访问版本,无需版本搜索。
gc:下一个epoch中的事务在当前的epoch之后再串行化,所以只有记录的最终写入对下一个epoch中的事务可见。因此一个epoch结束时,除了最后一个版本外其他版本都过时。epic将所有中间记录版本与最后一个

epic初始化开销大,需要大量内存/带宽。Epic的初始化阶段具有高度的并行性。随着通用GPU计算的迅速普及,Epic利用现代GPU架构提供的线程并行性显著加速初始化阶段。尽管GPU事务执行表现良好,但它受到GPU内存容量的限制。因此,Epic还支持更大数据集的CPU执行模型,其中初始化阶段在GPU上运行,而执行阶段在CPU上运行。
使用 epoch ID 来管理版本的时间顺序,确保读后写(RAW)依赖关系能够正确同步。


2.MARLP: Time-series Forecasting Control for Agricultural Managed Aquifer Recharge

idea:多周期模式+启发式算法——>因果模型。好水。

knowledge

  • multi-periodic pattern:日,月,年等不同长度的周期综合性模式。本质是:在序列生成模型中引入多个具有不同转移步长的隐变量。

  • 启发式算法:一般用来解决NP-hard问题。希望在合理的时间内得到足够接近的结果。
    P问题:时间复杂度可以用多项式表示的问题。NP问题:时间复杂度为阶乘/指数等无法用多项式表示的问题。
    约化:问题B的算法来解决A。
    NPC问题:NP,所有NP都能约化为这个问题。NP难问题:所有的NP问题都能约化到它,但是它不一定是一个NP问题。

    常用的包含:模拟退火(SA),遗传算法(GA),蚁群算法(ACO),人工神经网络(ANN)等。


3.LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry

idea:最后一公里的物流数据集。数据集也能发a,长见识。


4.Optimizing Time Series Queries with Versions

idea:物联网数据库版本化时间序列数据管理。
根据versioned管理update,
knowledge
WAL:write-ahead-log。基于预写日志。