Fukabori.fm

技術を深掘りして楽しむPodcastです。

8. AWS Aurora、GCP Spannerへ辿り着くまでのDBの進化

2018年10月27日

MP3ファイルをダウンロード

内容紹介

kumagiさんをゲストに、AWS Aurora、GCP Spannerに辿り着くまでのデータベースの進化についてお話いただきました

出演者

iwashi
iwashi
kumagi
kumagi

話したネタ

  • 山喜旅館でたまたま会って急遽収録
  • これまでデータベースがぶつかってきた問題について
  • メモリが高価、HDDはメモリに比べれば安いのでそれを使っていく
  • HDDはシーケンシャルアクセスならランダムアクセスより早い
  • IBMのInformation Management System(IMS)
  • CPUとメモリの間のキャッシュ、メモリとHDDの間のキャッシュの違いとは?
  • バッファプールをHDDに対するキャッシュとして使う
  • IBM ARIESの公開
  • WAL / Write Ahead Logging
  • ログの中にundo/redoの両方が必要
  • ログシーケンスナンバによるリカバリ
  • バッファプールを食わせるデータ量を増やすのが最適化の一歩
  • マルチコア時代への突入、メモリのビット単価の低下
  • インメモリDBの問題
  • 論文ジェネレータとは?
  • データベースは研究のトレンドとしては人気がなかった
  • Writeが増えたときのトランザクション性能が伸びない問題
  • 垂直分散、水平分散でアプリケーションレイヤが辛くなる話
  • AuroraはARIESからDBを理解した人がフルスクラッチで変えたように見える
  • AuroraはUndoの情報をログに含めず、Redoを含める
  • Auroraの場合は、Redoログを受け取るのがHDDではなくクラウド
  • ページの一貫性を担保する責任をクラウドへ押し付けた
  • メモリをディスクへ書き戻す必要がなくなる
  • Redoログ一辺倒になったのでチェックポイントがいらなくなった
  • データベースのチェックポイントについて
  • Auroraはマルチマスタ化?
  • Auroraのそもそもの思想はシングルマスタ
  • 悲観的に巨大にロックを取る
  • SpannerはRDBではなく、分散KVSに近い
  • Spanサーバの役割
  • Spannerを支えるPaxosとは?
  • 分散合意の難しさ
  • Cockroach DBはAuroraよりベンチマークで1000倍速い?
  • TPCCのレギュレーションについて
  • SpannerとAuroraの使い分けは?
  • 今後のデータベース界隈の展望は?
  • クラウドのDBはOracleの牙城を崩しに行く

(補足:32:45-33:43 は収録都合により、別マイクにて再収録しているため音質が異なります)