首页 > 资讯 > 后端开发 > 其他教程 >系统高吞吐量下的数据库重复写入问题分析解决

851

分享到

系统高吞吐量下的数据库重复写入问题分析解决

2024-04-02 19:04:59 851人浏览安东尼

摘要

目录问题分析数据库上解决从程序上保证数据不重复总结问题分析为了提高系统的吞吐量，很多环节下对于数据库的写入是多线程，甚至是多进程的。为了保证写入成功，在很多情况下需要多次重试。这就

问题分析

为了提高系统的吞吐量，很多环节下对于数据库的写入是多线程，甚至是多进程的。为了保证写入成功，在很多情况下需要多次重试。这就会带来一个问题，数据重复，同一条数据会被记录多次。有些情况下数据重复无伤大雅，但是很多情况系统是无法容忍数据重复的。因此这个问题需要解决。我个人觉得解决这一问题有两个方向：第一，从数据库上保证数据不重复，第二，从程序上保证数据不重复。

数据库上解决

主要包括：主键，唯一性索引，甚至是临时表。程序上解决无非就是要保证同步，这两种方式能解决很多情况下的数据重复。但是有些情况可能比较棘手，使用者两种方法有时并不能很好的解决，或实现起来比较复杂，如下面的数据

假如下表主要字段如下：

id　　studentId　　teacherId　　states　

状态（states）是有多种的（0，1，2，3），状态可以转换，但是状态为,0的一个只能由一个，其它字段是可以重复的。这个其实就是保证某一种状态下的数据不重复。

首先唯一性索引不能够起作用，因为无法建立唯一性索引。主键也没有效果，没法通过这些字段生成可区分的id。所以这两种方法都失效了。还有一种方法就是临时表，在临时表中插入一条能够区分的数据（比如studentId，teacherId组合），无论是唯一索引还是主键都可以。写入时首先写临时表，临时表写入成功则插入一条数据，然后清空临时表。这在严格保证数据不重复的情况下是能够起作用的，但是比较繁琐，需要处理一个临时表。

另外的一个办法就是根据我们的业务场景，在一个时间段内（比如1分钟）不会出现两条相同数据写入。这样我们可以使用studentIdTeacherid加上精确到分钟的时间来构成一个唯一id，重试时间间隔一般都极短（秒级别），这样通过id来保证数据的唯一性。

从程序上保证数据不重复

如果从程序上来保证数据不重复，则更加复杂。第一种办法是对写入过程加锁，确保只有一次写入成功代码如下（伪代码）:

Lock lock =new WriteLock();
public void write(Data data){
try{
     if(lock.tryLock() ){
               dataRepository.save(data);
               if(dataRepository.numberOf(data)>1){//在写入的时候检测如果数据库中有该数据抛出异常。再次保证数据不重复。
                   throw new DataException
            }
　　　　　　
     }  
　　}finally{
     lock.unlock();
　　}
}

这种方式首先会存在效率问题，所有的数据都要顺序写入会导入效率下降。我们只需要保证同一条数据不能并发写入而不是不同数据。另外这种方式还会存在一定概率的重复，因为网络问题和数据库或ORM框架的缓存问题，会导致写入检测时并不能发现数据库的更新。比如使用hibernate，两次线程调用write方法会使用两个session，从而使得第一次写入缓存的数据无法在下一次操作中看到。在write方法中多次调用numberOf方法也是不起用的，由于session的缓存，后面的查询会使用第一次的缓存结果，在第一次查询后的数据库变化，后面的查询仍然无法觉察。

针对写入效率低的问题，这里可以采用数据锁，即通过一种方法比如使用data的hashcode来映射来获取锁，这样不同的数据会获取到不同的锁，解决了所有数据的顺序写入问题。但是跟第一种情况一样仍会存在数据重复问题。

对于多进程的情况，如微服务部署多个的情况，上面的同步会失效。对于这种情况唯一的解决办法就是使用上面所说的数据库同步或者构造一个环节锁，类似于令牌的方法。只有获取到令牌才有写入资格，写入成功后销毁针对该数据的“令牌“。这种实现其实也比较简单，如使用一个Redis的HashMap,每次写入首先获取该数据对应的value，通过value来判断该数据是否写入，来保证数据不重复。

总结

上面无论哪种方法，针对本文所提到的数据，解决重复问题都是不容易的。要么实现起来比较复杂，要么还是不能100%保证数据不重复。针对我们的业务场景：state为0的状态下数据能有一条，且0的状态不会持续太久，后面的操作会将其修改。而且多线程重试并不是每次都发生的，多进程情况下，每次数据写入也多是只通过其中一个节点，针对这种情况其实可以采取更简单的处理方式，不做过多的顺序限制只在写入时检查数据库，如果真的因为数据更新或者并发导致了多次写入也没有关系（这种情况很少），后续的操作时再删除多写入的数据。这是一种乐观的处理方式，但是对于很多情况是可以解决数据重复问题的。

以上是我个人对于只有某种状态的数据不能重复写入问题的处理方法的思考。主要是从数据库和程序上来控制及如果场景允许使用乐观（后续补救）的方法。仅供参考，更多关于高吞吐量系统的数据库重复写入解决的资料请关注编程网其它相关文章！

--结束END--

本文标题: 系统高吞吐量下的数据库重复写入问题分析解决

本文链接: https://lsjlt.com/news/146854.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

系统高吞吐量下的数据库重复写入问题分析解决

目录

问题分析

数据库上解决

从程序上保证数据不重复

总结

系统高吞吐量下的数据库重复写入问题分析解决

如何解决数据写入mysql数据库的问号问题

时序数据库TDengine写入查询的问题分析

java并发请求下数据插入重复问题的解决方法

Mysql批量插入数据时该如何解决重复问题详解

怎么解决java并发请求下数据插入重复问题

数据库的读写分离能解决什么问题

解决Window10系统下Node安装报错的问题分析

Spring Boot实战解决高并发数据入库之 Redis 缓存+MySQL 批量入库问题

PHP 防抖技术：解决高并发场景下的数据重复提交问题

python解决数据库写入时float自动变为整数的问题

XP系统连接12C数据库的问题及解决方法！！

Unix系统下的大数据分析：跨平台分布式解决方案？

PHP trait DTO：解决分布式系统中数据传输问题的解决方案

如何使用Go语言解决分布式系统中的数据分布问题？

怎么解决MySQL分页时使用 limit+order by出现数据重复的问题

MongoDB技术开发中遇到的数据库维护问题解决方案分析

分布式计算技术在Unix系统下的应用：解决大数据难题？

如何利用Java关键字和API解决分布式系统中的数据一致性问题？

笔记本电脑中的Win7/Win8系统下无法实现自动待机屏保问题分析解决方法介绍

c语言怎么计算字符串长度

c++排序函数sort怎么使用

C++中beginthreadex线程启动不了怎么解决

c语言swap函数如何调用

c++中使用swap函数报错怎么解决

c++中decltype的用法是什么

c语言中sizeof语句怎么使用

C语言怎么实现对文件夹加密

c语言怎么将小数转换成整数

C++中coledatetime函数的用法是什么