Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add v5.2 TPCH report #6869

Merged
merged 2 commits into from
Aug 27, 2021
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion TOC.md
Original file line number Diff line number Diff line change
Expand Up @@ -13,7 +13,7 @@
+ 性能测试报告
+ [Sysbench 性能对比 - v5.1 对比 v5.0](/benchmark/benchmark-sysbench-v5.1.0-vs-v5.0.2.md)
+ [TPC-C 性能对比 - v5.1 对比 v5.0](/benchmark/v5.1-performance-benchmarking-with-tpcc.md)
+ [TPC-H 100 性能对比 - v5.1 MPP 对比 Greenplum / Apache Spark](/benchmark/v5.1-performance-benchmarking-with-tpch.md)
+ [TPC-H 100 性能对比 - v5.2 MPP 对比 Greenplum / Apache Spark](/benchmark/v5.2-performance-benchmarking-with-tpch.md)
+ [与 MySQL 的兼容性](/mysql-compatibility.md)
+ [使用限制](/tidb-limitations.md)
+ [荣誉列表](/credits.md)
Expand Down
Original file line number Diff line number Diff line change
@@ -1,16 +1,16 @@
---
title: TiDB TPC-H 100 性能对比测试报告 - v5.1 MPP 模式对比 Greenplum 6.15.0 以及 Apache Spark 3.1.1
title: TiDB TPC-H 100 性能对比测试报告 - v5.2 MPP 模式对比 Greenplum 6.15.0 以及 Apache Spark 3.1.1
Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

---

# TiDB TPC-H 性能对比测试报告 - v5.1 MPP 模式对比 Greenplum 6.15.0 以及 Apache Spark 3.1.1
# TiDB TPC-H 性能对比测试报告 - v5.2 MPP 模式对比 Greenplum 6.15.0 以及 Apache Spark 3.1.1

## 测试概况

本次测试对比了 TiDB v5.1 MPP 模式下和主流分析引擎例如 Greenplum 和 Apache Spark 最新版在 TPC-H 100 下的性能表现。结果显示,TiDB v5.1 MPP 模式下相对这些方案有 2-3 倍的性能提升。
本次测试对比了 TiDB v5.2 MPP 模式下和主流分析引擎例如 Greenplum 和 Apache Spark 最新版在 TPC-H 100 下的性能表现。结果显示,TiDB v5.2 MPP 模式下相对这些方案有 2-3 倍的性能提升。

TiDB v5.0 中新引入了 [TiFlash](/tiflash/tiflash-overview.md) 组件的 MPP 模式,这大幅增强了 TiDB HTAP 形态。本文的测试对象如下:
TiDB v5.0 中引入的 [TiFlash](/tiflash/tiflash-overview.md) 组件的 MPP 模式,在 v5.1 和 v5.2 中进行了功能优化,这大大幅增强了 TiDB HTAP 形态。本文的测试对象如下:

+ TiDB v5.1 MPP 执行模式下的列式存储
+ TiDB v5.2 MPP 执行模式下的列式存储
+ Greenplum 6.15.0
+ Apache Spark 3.1.1 + Parquet

Expand All @@ -27,15 +27,15 @@ TiDB v5.0 中新引入了 [TiFlash](/tiflash/tiflash-overview.md) 组件的 MPP

| 服务类型 | 软件版本 |
|:----------|:-----------|
| TiDB | 5.1 |
| TiDB | 5.2 |
| Greenplum | 6.15.0 |
| Apache Spark | 3.1.1 |

### 配置参数

#### TiDB v5.1 配置
#### TiDB v5.2 配置

v5.1 的 TiDB 集群除以下配置项外均使用默认参数配置。所有 TPC-H 测试表均以 TiFlash 列存进行同步,无额外分区和索引。
v5.2 的 TiDB 集群除以下配置项外均使用默认参数配置。所有 TPC-H 测试表均以 TiFlash 列存进行同步,无额外分区和索引。

在 TiFlash 的 `users.toml` 配置文件中进行如下配置:

Expand Down Expand Up @@ -84,7 +84,7 @@ Apache Spark 测试使用 Apache Parquet 作为存储格式,数据存储在 HD
>
> 以下测试结果均为 3 次测试的平均值,单位均为秒。

| Query ID | TiDB v5.1 | Greenplum 6.15.0 | Apache Spark 3.1.1 + Parquet |
| Query ID | TiDB v5.2 | Greenplum 6.15.0 | Apache Spark 3.1.1 + Parquet |
| :-------- | :----------- | :------------ | :-------------- |
| 1 | 8.08 | 64.1307 | 52.64 |
| 2 | 2.53 | 4.76612 | 11.83 |
Expand All @@ -109,6 +109,6 @@ Apache Spark 测试使用 Apache Parquet 作为存储格式,数据存储在 HD
| 21 | 24.44 | 39.08594 | 34.83 |
| 22 | 1.23 | 7.67476 | 4.59 |

![TPC-H](/media/tidb-v5-tpch-100-vs-gp-spark.png)
![TPC-H](/media/tidb-v5.2-tpch-100-vs-gp-spark.png)

以上性能图中蓝色为 TiDB v5.1,红色为 Greenplum 6.15.0,黄色为 Apache Spark 3.1.1,纵坐标是查询的处理时间。纵坐标数值越低,表示 TPC-H 性能越好。
以上性能图中蓝色为 TiDB v5.2,红色为 Greenplum 6.15.0,黄色为 Apache Spark 3.1.1,纵坐标是查询的处理时间。纵坐标数值越低,表示 TPC-H 性能越好。
Binary file removed media/tidb-v5-tpch-100-vs-gp-spark.png
Binary file not shown.
Binary file added media/tidb-v5.2-tpch-100-vs-gp-spark.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.