作者:ronghao 来源:BlogJava 酷勤网收集 2008-06-29
测试在SQL Server 2000上进行,对工作流操作的相关方法在单元测试里进行多线程并发。测试发现sqlserver出现死锁的情况相当多,一些典型的情况:
1、对同一张表先insert再update是很快会引起死锁的,不管操作的是否是同一记录
解决方法:对于同一记录,需要调整hibernate的映射策略,使得一次insert完成操作。对于不同的记录需要在代码中手动flush,使得update先于insert。
2、对两张表进行多次update操作时,两张表交替update也会很快引起死锁
解决方法:在代码中手动flush,保证对两张表的update不会出现交替的情况。
3、部分大范围扫描的select和update混合也会导致死锁
解决方法:优化sql,尽量减少sql语句,通过给po增加持久化字段的方式减少关联查询
经过优化,大部分情况下数据库死锁的情况得以避免,另外奇怪的是通过事件探查器在死锁时并未发现锁升级的事件。但是在一些特殊情况下(例如多个并发汇聚的直接联合),死锁依旧发生。最后不得不对方法进行synchronized关键字同步,这个通过synchronized flush完成。业务方法不必同步,最后批量操作数据库时进行同步。
换oracle进行测试,在未synchronized的情况下,未发生死锁情况。由此可见sqlserver与oracle锁实现机制存在很大的差别。对sqlserver鄙视之。另,同事说,sqlserver2005后性能和机制发生了很大的变化,未测试。
补充一下我的一个最简单情况下的测试用例:
PO:
String id;
String name;
int num;
.}
映射文件 hibernate3:
<class table="WFMS_TESTPO" name="com.eway.workflow.test.po.TestPO">
<id name="id" column="ID"><generator class="uuid" /></id>
<property name="name" column="NAME" type="string"/>
<property name="num" column="NUM" type="integer"/>
</class>
</hibernate-mapping>
被测试方法(都配置有事务):
TestPO po = new TestPO();
po.setName("ronghao");
po.setNum(num);
theadTestDao.save(po);
po.setName("haorong");
}
public void testSaveByJdbc(int num) {
String sql = "insert into WFMS_TESTPO (ID,NAME,NUM) values (?,'RONGHAO',?)";
Object[] params = new Object[]{num,num};
jdbcTemplate.update(sql, params);
sql="update WFMS_TESTPO set name='haorong' where id=?" ;
params = new Object[]{num};
jdbcTemplate.update(sql, params);
}
测试用例:
TheadtestTemplate template = new TheadtestTemplate();
template.execute(new TheadtestCallback() {
public void doInThead(int suquence) {
// theadTestManager.testSave(suquence);
theadTestManager.testSaveByJdbc(suquence);
}
}, 10);
}
测试结果:不论是hibernate还是jdbc,并发情况下都很快就会引起SQL Server 2000的死锁,换用两种数据库驱动jtds和jturbo死锁的情况没有变化。
结论:SQL Server 2000数据库的lock配置策略,不支持,或者数据库本身,就不支持对不同的行做同时操作(或者支持不完善),所谓的行锁支持很不完善,死锁情况非常容易发生。
补充:我对数据库的一些实现机制也并不是很了解,所以这里也只能列出现象而不能解释死锁的根本原因。
FeedBack:
2、悲观并发、乐观并发生来以久,各有优缺点,搞清楚再来鄙视。
2、对两张表进行多次update操作时,两张表交替update也会很快引起死锁
3、部分大范围扫描的select和update混合也会导致死锁
如果连这些问题都解决不了,你觉得是数据库问题,还是你的问题呢?
别拿那么多名词出来吓人,这个招数我上小学的时候用来吓唬老师的,现在已经不用了。
就捡最后一个说吧,乐观锁,如果你控制不了,还是就不要用了,您还就是老老实实的本分点,使用数据库本地提供的锁功能吧,牺牲点数据库的性能,也总比你数据更新失败要好,如果你非要使用hibernate的乐观锁,请控制好,内存中的数据和数据库中的数据一致性。
我想你并没有弄明白问题的关键。乐观锁和悲观锁的作用是防止多个事务对同一数据操作产生冲突的两种策略。而我的问题是多个线程(即多个事务)并发操作不同的数据。不知道明不明白意思。
ps:以前我也把这两者的概念经常混淆。
我倒真的认为是数据库的原因。
一个简单的例子:很简单的po:
String id;
String name;
两个字段,执行操作:
TestPO po=new TestPO();
po.setName("ronghao");
dao.save(po);
dao.flush();
po.setName("haorong");
配置事务,单元测试两个线程并发,SQL Server 2000下马上死锁。
当然,我并没有用jdbc直接测试
如果不是多线程,那么配置事务还有何用,如果所有操作都在同一个流水线上,那么配置事务不是浪费人民的感情嘛?
如果使用悲观锁,导致你保存失败,那么说明你事务配置的问题,或者至少说明你测试用例的事务配置有问题,要不你直接试试 jdbc 并且硬编码事务看看。
否则 SQL Server 2000 真的不要玩了,两个线程都是死锁。。。
你的说法没有错。我想问题的原因在于死锁的原因你我的理解有差异。
你理解的是对数据库表同一记录并发操作引起数据库死锁,这个显然是应用程序应该控制和避免的。
而我的意思是并发操作某一动作,例如同时启动100个工作流流程,这个尽管操作的是同一张表但是显然是针对不同的记录,此时,乐观锁、悲观锁都是没有意义的。
当然,我对数据库的一些实现机制也并不是很了解,所以这里也只能列出现象而不能解释死锁的根本原因。
补充说明一下,在我的测试中,不会出现两个线程互相修改冲突的情况,甚至select也不会冲突,因为流程实例ID一开始就将所有的数据区分开来。我是并发启动多个流程,然后并发提交这些流程。
如果每个线程只处理 某一个或一些独立 流程id相关的数据,而没有交叉数据,那么还会出现这种现象。
1.使用jdbc做这种测试,排除是否是hibernate的使用或者hibernate本身对2000支持的问题问题。(jdbc驱动也很关键。)
2.查阅sql2000 对行锁的支持程度。
哈哈,正如你说的,我想问题在这里:
当然,如果你的数据库的lock配置策略,不支持,或者数据库本身,就不支持对不同的行做同时操作(或者支持不完善),所谓的行锁,那么肯定会像你所说的那样发生死锁。
这也是我想表达的。我想有时间应该请个专业的DBA来,我也查过了SQLSERVER的锁机制,但是具体到这里理解还是存在问题。
另外你对乐观锁的理解也很到位。如果是多个事务同时提交一个流程,乐观锁就会起作用。
好的,谢谢你的意见。我会用jdbc做这个测试。
我估计楼主缺少在sybase,db2下的工作经验, 所以才会这么激动。不同数据库的设计本身是有相当大差异的,很难说好坏,我印象中,缺省情况下对锁的处理比较不伤脑筋的就是oracle了,其他的不管是sybase还是db2都不是缺省就可以很轻松做到高并发的,但是处理的好,至少db2 可以做到不输给oracle的高并发。 至于sql server ,tpc网站上去翻一下,可以发现sql server也是常客。
但是早期oracle的开发, 嗯, 我觉得在很多方面其实倒不如db2这样的数据库省事,比如大表和小表在sql中的位置,都会显著影响sql性能。再比如sql是简单好,还是复杂好,这2个数据库也是相反的。
这只能说明不同数据库的机制是有很大差异的,用好一个数据库需要点时间对他进行比较深入的理解。现代程序员往往被各种框架屏蔽了底层,有时候也不是什么好事,以前项目中就有专门组织DBA对程序员进行数据库方面的培训,目的也就是为了弥补这个问题。
对于锁的问题,在oracle9i&10g编程艺术那本书里,作者有很深入的介绍,也列举了其他数据库的处理情况。作者从其他数据库转向使用oracle的时候,对这个问题,貌似和楼主一样震惊,呵呵。当年我也有个项目,被db2的锁机制,搞的的死去活来,呵呵。
简单的说,摇身要是高可靠性数据库都只是知道写sql这么简单, 人家DBA还怎么活?
呵呵,你的意见非常中肯。

