首页 > 资讯 > 精选 >如何解决报表关联计算中的性能问题

486

分享到

如何解决报表关联计算中的性能问题

2023-06-02 14:06:29 486人浏览泡泡鱼

摘要

报表开发过程中经常要在报表中完成数据关联计算，有时为了降低报表制作复杂度，会将关联关系放到可视的报表模板中完成；而有时则必须在报表中完成关联，如多数据源、异构数据源的情况。在报表中做关联往往导致报表效率不高，计算过慢，从而引发性能问题。为此

报表开发过程中经常要在报表中完成数据关联计算，有时为了降低报表制作复杂度，会将关联关系放到可视的报表模板中完成；而有时则必须在报表中完成关联，如多数据源、异构数据源的情况。在报表中做关联往往导致报表效率不高，计算过慢，从而引发性能问题。为此，润乾报表提供了高性能数据关联方式（需要结合集算器实现），可以显著提升报表的计算效率。这里就通过一个常见的多源关联分片报表实例来说明润乾报表的实现过程：

报表说明

根据销售情况等信息按照时间、地区、销售人员、产品等维度汇总销售额，报表样式如下：

如何解决报表关联计算中的性能问题

以下为实现过程。

编写计算脚本

首先使用集算器编写脚本，完成数据关联，并为报表返回关联后的结果集。

	A
1	=connect(“demo”)
2	=A1.query(“SELECT 客户. 地区, 客户. 城市, 订单明细. 数量, 订单明细. 折扣, 订单明细. 单价, 订单. 雇员 ID, 订单. 订购日期, 订单明细. 产品 ID FROM 订单明细, 订单, 客户 WHERE 客户. 客户 ID = 订单. 客户 ID AND 订单. 订单 ID = 订单明细. 订单 ID and 订单. 订购日期 is not null”)
3	=A1.query(“SELECT 类别. 类别 ID, 类别. 类别名称 FROM 类别”)
4	=A1.query(“SELECT* from 雇员”)
5	=A1.query(“SELECT 产品. 类别 ID, 产品. 产品 ID FROM 产品”)
6	>A5.switch(类别 ID,A3: 类别 ID)
7	>A2.switch(雇员 ID,A4: 雇员 ID)
8	>A2.switch(产品 ID,A5: 产品 ID)
9	=A2.new(year( 订购日期): 年,month(订购日期): 月, 地区, 城市, 单价 * 数量: 金额, 雇员 ID. 职务: 职务, 雇员 ID. 雇员 ID: 雇员 ID, 雇员 ID. 姓氏 + 雇员 ID. 名字: 姓名, 产品 ID. 类别 ID. 类别 ID: 类别 ID, 产品 ID. 类别 ID. 类别名称: 类别名称 )
10	return A9

A1：连接数据源；

A2-A5：执行 sql，分别取订单、产品等库表数据；

A6-A8：使用 switch 将多表数据完成关联，关联结果存入 A2 格中；

A9：根据已关联结果创建新序表，结果集通过 A10 返回报表。

编制报表

在润乾报表设计器中新建报表模板后，数据集选择“集算器”，在数据集编辑窗口指定上述编辑好的 dfx 文件，完成数据集创建。

编辑报表模板表达式：

如何解决报表关联计算中的性能问题

不同于报表模板中的低效关联，集算报表是事先在集算脚本中完成关联，报表模板只需从结果集取数，从而获得更高的性能。

为了对照，我们再按照传统的报表中实现关联的方式做一下：

报表中实现关联

数据集

ds1: SELECT 客户. 地区, 客户. 城市, 订单明细. 数量, 订单明细. 折扣, 订单明细. 单价, 订单. 雇员 ID, 订单. 订购日期, 订单明细. 产品 ID FROM 订单明细, 订单, 客户 WHERE 客户. 客户 ID = 订单. 客户 ID AND 订单. 订单 ID = 订单明细. 订单 ID and 订单. 订购日期 is not null

ds2: SELECT 类别. 类别 ID, 类别. 类别名称 FROM 类别

ds3: SELECT * from 雇员

ds4: SELECT 产品. 类别 ID, 产品. 产品 ID FROM 产品

报表模板

如何解决报表关联计算中的性能问题

对比效果

本例的源表数据为 40 多万条，基于同样的取数 sql，两种关联方式的运行时间如下表所示：

如何解决报表关联计算中的性能问题

可以看到，润乾报表在处理关联计算类报表时有明显的优势。这是因为在报表中实现关联只能使用遍历算法，针对单条主记录去寻找关联的子记录，因此效率不高；而集算器采用了更高效的 hash 关联方案，事先将所有子记录按对应码 hash 到主记录上（代码中的 switch 函数就利用了 hash 关联技术），因而能获得一倍以上的性能提升（如果只算关联能快出 5-10 倍）。

此外，集算器也非常适合处理异构数据源的数据关联，如常见的跨库计算、文件和数据库混合计算等情况。

下附运行日志和测试机配置。

【附 1】运行日志

报表中关联

[2018-09-15 11:32:59] : [INFO] - 开始运算报表，首先取数……

[2018-09-15 11:32:59] : [DEBUG] - 下面开始打出 sql

[2018-09-15 11:32:59] : [DEBUG] - ds1=SELECT 客户. 地区, 客户. 城市, 订单明细. 数量, 订单明细. 折扣, 订单明细. 单价, 订单. 雇员 ID, 订单. 订购日期, 订单明细. 产品 ID FROM 订单明细, 订单, 客户 WHERE 客户. 客户 ID = 订单. 客户 ID AND 订单. 订单 ID = 订单明细. 订单 ID and 订单. 订购日期 is not null

[2018-09-15 11:33:35] : [DEBUG] - 下面开始打出 sql

[2018-09-15 11:33:35] : [DEBUG] - ds2=SELECT 类别. 类别 ID, 类别. 类别名称 FROM 类别

[2018-09-15 11:33:35] : [DEBUG] - 下面开始打出 sql

[2018-09-15 11:33:35] : [DEBUG] - ds3=SELECT * from 雇员

[2018-09-15 11:33:35] : [DEBUG] - 下面开始打出 sql

[2018-09-15 11:33:35] : [DEBUG] - ds4=SELECT 产品. 类别 ID, 产品. 产品 ID FROM 产品

[2018-09-15 11:33:35] : [INFO] - 取数结束, 开始运算

[2018-09-15 11:34:58] : [INFO] - 计算结束：

dfx 中关联

[2018-09-15 11:56:33] : [INFO] - 开始运算报表，首先取数……

[2018-09-15 11:57:11] : [INFO] - 取数结束, 开始运算

[2018-09-15 11:57:26] : [INFO] - 计算结束：

【附 2】测试机配置

测试机型：Dell Inspiron 3420

CPU：Intel Core i5-3210M @2.50GHz *4

RAM：4G

HDD：西数 WDC(500G 5400 转 / 分)

操作系统：Win7(X64) SP1

JDK：1.6

数据库：oracle11g R2

润乾报表版本：2018

--结束END--

本文标题: 如何解决报表关联计算中的性能问题

本文链接: https://lsjlt.com/news/230208.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

如何解决报表关联计算中的性能问题

报表说明

编写计算脚本

编制报表

报表中实现关联

对比效果

【附 1】运行日志

报表中关联

dfx 中关联

【附 2】测试机配置

如何解决报表关联计算中的性能问题

如何解决mysql性能问题

JavaScript如何解决浮点计算的问题

解决pytorch中的kl divergence计算问题

Android开发中如何解决计算器的sin、cos及tan值计算问题

如何解决js数字计算误差的问题

RiSearch PHP 如何解决中文分词与索引的关联问题

如何解决计算机中磁盘被写保护的问题

MySQL中如何解决慢查询和性能问题

如何在Oracle中查找和解决性能问题

如何解决OpenStack云的互联问题

Python中的浮点数计算精度问题是如何解决的？

mysql关联两张表时的编码问题及解决办法

如何解决VBS中字符串连接的性能问题

如何解决WEB性能测试中的验证码问题

Mybatis无主键的关联数据去重问题如何解决

如何解决css3中calc在less编译时被计算的问题

如何解决golang中关闭chan的问题

如何解决php无法计算浮点数问题

pandas计算相关系数corr返回空的问题解决

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南