`
wbj0110
  • 浏览: 1553306 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

BTrace实际案例分析

阅读更多

问题表象

问题描述

1.最近有项目组的童鞋反馈,web页面频繁出现假死的状态。

2.web页面的假死出现是概率事件,且无法确定假死的引发原因。

3.是在一定的操作之后出现的,但是无法确定究竟是哪些操作引发这些操作。

问题分析

初步分析

我们都知道web容器一般都是单实例多线程的方式工作的,当页面发起请求后,tomcat发分配一个线程进行当前请求的处理,当出现页面假死,说明是由于某种原因导致了线程在等待某种资源,可以是IO、网络响应、数据库连接、等待锁等等,所以需要首先确定该线程是在等待什么资源。

 

经过初步分析,可以知道是线程阻塞导致web不能够及时返回给页面响应,导致页面出现假死的情况。所以首先确定导致线程阻塞的原因。

 

确定线程是由于什么原因导致的阻塞其实也是比较简单的,可以使用jstack工具,到出现阻塞现象后,使用jstack工具查看器堆栈,看下是等待什么。也可以使用Eclipsedebug功能,将当前线程suspend。在这里我采用第二种方式。

 

操作步骤

在本地以Debug方式启动Tomcat应用,模拟一些操作,尽量将假死项目重现,开发人员根据以往的映像去操作一些功能,过了若干时间后,果然出现了假死现象。由于是debug方式启动所以查看其debug视图,发现启动了3http线程,下图中红色部分标示的位置。



 

通过右击suspend挂起线程,发现有一个线程确实被阻塞掉了



 

观察堆栈可以确定是到连接池中去获取连接,但是当前连接池中无可用的连接,导致线程阻塞出现页面假死现象。

进一步分析

很明显这个是由于连接泄露导致无可用连接,所引起的线程阻塞,页面假死。查看连接池配置:

driver=oracle.jdbc.driver.OracleDriver

url=jdbc:oracle:thin:@127.0.0.1:1521:orcl

username=****

password=****

active=20

minidle=20

maxidle=20

maxwait=-1

出现连接泄露问题是较为难定位的问题,因为问题的表象离问题的根源较远,并没有直接的联系,所以只能凭经验和感觉去分析,另外出现该情况应当尽量将连接池连接个数配置改小,这样可以有效的拉近问题表象和问题根源之间的距离,减小问题重现的成本和最大化问题重现的概率。然后根据BTrace来进行分析。但是我们这里有BTrace这个利器来进行动态诊断。

诊断思路

只要跟踪所有的调用过BasicDataSource.getConnection这个方法的地方,然后在看看那些方法调用以后没有关系连接,而关闭连接的地方并非是Connectionclose方法,需要对连接池的工作原理有一定的了解。




 
 

如上图,连接池持有Connection代理的引用,用来维护Connection,而Connection代理实现了JDBC,通过Connection代理来操作驱动程序,在oracle中是oracle.jdbc.driver.T4CConnection



 

实际上连接池主要是通过PoolableConnection作为代理类,持有T4CConnection的引用,完成对数据的操作,并且自己实现了java.sql.Connection接口,我们看下close方法的具体实现。

 

 

Java代码  收藏代码
  1. /** 
  2.      * Returns me to my pool. 
  3.      */  
  4.      public synchronized void close() throws SQLException {  
  5.         if (_closed) {  
  6.             // already closed  
  7.             return;  
  8.         }  
  9.   
  10.         boolean isUnderlyingConectionClosed;  
  11.         try {  
  12.             isUnderlyingConectionClosed = _conn.isClosed();  
  13.         } catch (SQLException e) {  
  14.             try {  
  15.                 _pool.invalidateObject(this); // XXX should be guarded to happen at most once  
  16.             } catch(IllegalStateException ise) {  
  17.                 // pool is closed, so close the connection  
  18.                 passivate();  
  19.                 getInnermostDelegate().close();  
  20.             } catch (Exception ie) {  
  21.                 // DO NOTHING the original exception will be rethrown  
  22.             }  
  23.             throw (SQLException) new SQLException("Cannot close connection (isClosed check failed)").initCause(e);  
  24.         }  
  25.   
  26.         if (!isUnderlyingConectionClosed) {  
  27.             // Normal close: underlying connection is still open, so we  
  28.             // simply need to return this proxy to the pool  
  29.             try {  
  30.                 _pool.returnObject(this); // XXX should be guarded to happen at most once  
  31.             } catch(IllegalStateException e) {  
  32.                 // pool is closed, so close the connection  
  33.                 passivate();  
  34.                 getInnermostDelegate().close();  
  35.             } catch(SQLException e) {  
  36.                 throw e;  
  37.             } catch(RuntimeException e) {  
  38.                 throw e;  
  39.             } catch(Exception e) {  
  40.                 throw (SQLException) new SQLException("Cannot close connection (return to pool failed)").initCause(e);  
  41.             }  
  42.         } else {  
  43.             // Abnormal close: underlying connection closed unexpectedly, so we  
  44.             // must destroy this proxy  
  45.             try {  
  46.                 _pool.invalidateObject(this); // XXX should be guarded to happen at most once  
  47.             } catch(IllegalStateException e) {  
  48.                 // pool is closed, so close the connection  
  49.                 passivate();  
  50.                 getInnermostDelegate().close();  
  51.             } catch (Exception ie) {  
  52.                 // DO NOTHING, "Already closed" exception thrown below  
  53.             }  
  54.             throw new SQLException("Already closed.");  
  55.         }  
  56. }  

  

 

 

而获取连接的代码是通过PoolingDataSource的getConnection进行获取的代码如下:

 

Java代码  收藏代码
  1. /** 
  2.      * Return a {@link java.sql.Connection} from my pool, 
  3.      * according to the contract specified by {@link ObjectPool#borrowObject}. 
  4.      */  
  5.     public Connection getConnection() throws SQLException {  
  6.         try {  
  7.             Connection conn = (Connection)(_pool.borrowObject());  
  8.             if (conn != null) {  
  9.                 conn = new PoolGuardConnectionWrapper(conn);  
  10.             }   
  11.             return conn;  
  12.         } catch(SQLException e) {  
  13.             throw e;  
  14.         } catch(NoSuchElementException e) {  
  15.             throw new SQLNestedException("Cannot get a connection, pool error " + e.getMessage(), e);  
  16.         } catch(RuntimeException e) {  
  17.             throw e;  
  18.         } catch(Exception e) {  
  19.             throw new SQLNestedException("Cannot get a connection, general error", e);  
  20.         }  
  21.     }  

 

可以非常清楚的看到,就是通过该方法释放连接到连接池中,供后续的业务代码进行调用。

到这里基本的思路已经出来了,只要跟踪PoolingDataSource的getConnection方法和PoolableConnection的close方法就可以知道究竟哪些业务代码只调用了获取连接而没有调用close方法进行释放连接,导致连接泄露。

BTrace利器

通过编写BTrace脚本进行分析跟踪,只要业务代码在调用完getConnection方法后调用了close就说明没有问题,也就是getConnection方法和close方法成对出现,如果只调用了getConnection方法而没有调用close方法那就说明该业务代码有连接泄露。

 

 

Java代码  收藏代码
  1. import com.sun.btrace.annotations.*;  
  2. import static com.sun.btrace.BTraceUtils.*;  
  3.   
  4. @BTrace public class BTraceConnection {  
  5.       
  6.     @Export private static long openedCount;  
  7.       
  8.     @Export private static long closedCount;  
  9.       
  10.     @OnMethod(clazz="/.*PoolingDataSource/", method="getConnection", location=@Location(kind.RETURN))  
  11.     public static void m(@return Object obj) {  
  12.             openedCount++;  
  13.                 println("One connection is opened!");  
  14.                 println(obj);  
  15.             Threads.jstack();  
  16.     }  
  17.       
  18.     @OnMethod(clazz="/.*PoolableConnection/", method="close")  
  19.     public static void d(@Self Object obj) {  
  20.             closedCount++;  
  21.                 println("One connection is closed!");  
  22.                 println(obj);  
  23.             Threads.jstack();  
  24.     }  
  25.       
  26.     @OnExit  
  27.     public static void f(){  
  28.           print("Total opened connection:");  
  29.           println(openedCount);  
  30.           print("Total closed connection:");  
  31.           println(closedCount);   
  32.     }  
  33.       
  34. }  

  

 

 

 

将连接池个数修改为3,启动应用,使用jps输出应用pid

 

 

运行命令btrace <pid> BTraceConnection.java > trace.log

日志分析

输出结果

 

 

Java代码  收藏代码
  1. One connection is opened!  
  2. org.apache.commons.dbcp.PoolingDataSource$PoolGuardConnectionWrapper@1d6fc56  
  3. org.apache.commons.dbcp.BasicDataSource.getConnection(BasicDataSource.java:1044)  
  4. ..................  
  5. com.***************************.dao.UserDAO.checkUserState(UserDAO.java:142)  
  6. ..................  
  7. java.lang.Thread.run(Thread.java:619)  
  8. One connection is opened!  
  9. ..................  
  10. Total opened connection:61  
  11. Total closed connection:57  

  

 

 

部分无用内容有删减,发现总共获取了61connection,释放了57connectioncom.***************************.dao.UserDAO.checkUserState(UserDAO.java:142)该方法没有释放连接,最终定位出了有问题的方法。

分享到:
评论

相关推荐

    btrace release-1.2.5.1

    btrace btrace btrace btrace

    btrace扩展功能工具

    1.btrace扩展是在btrace已由功能上进行的扩展,原有功能和使用方式依然没变。目前版本扩展了两个功能:接口时间监控和接口时间调用树监控。扩展之后的btrace功能使用时都不需要写btrace脚本。 2.使用接口时间监控...

    btrace工具

    Btrace:java性能调优及问题追踪工具 Btrace:java性能调优及问题追踪工具

    BTrace安装包 btrace-bin-1.3.11.3.zip + btrace-src-1.3.11.3.zip

    btrace-bin直接解压缩配置环境变量后即可运行使用。 java监控调试工具虚拟机监控程序,利用BTrace可以在线监控java程序状态。 BTrace是一种安全,动态的Java跟踪工具。BTrace通过动态(字节码)检测正在运行的Java...

    btrace1.3.9

    btrace1.3.9最新版本转过来

    btrace1.3.9.zip

    btrace1.3.9 jdk1.8 maven 编译构建 http://github.com/btraceio/btrace

    jdk1.8-Btrace.rar

    java 在线检测插件Btrace, 无需重启服务,即可在线定位问题

    BTrace监控远程服务器使用实例

    自己做的BTrace监控,Linux服务器上的tomcat工程,压缩包包含BTrace开发所需的jar包 BTrace简单示例代码 jvisualvm.exe如果远程服务器监控JVM虚拟机信息

    btrace安装包

    btrace安装包,linux和windows通用,1.3.9版本。可以直接解压缩配置环境变量后运行使用

    Btrace 官方zip包

    Btrace用来做项目检测,访问过的类方法统计,无侵略性,JDK1.6

    java程序运行跟踪利器Btrace分享

    你还在为各种意想不到的状况烦恼吗?不知如何去及时了解jvm的运行情况吗?java线程、内存使用情况等都可以通过Btrace进行跟踪分析,了解系统运行情况,方便易用!

    btrace api 1.2.chm

    btrace api 1.2 文档,从网上扒下来自己做的,其他地方貌似都没有chm,提供给大家使用 btrace是一个跟踪、监控java程序的小工具,能够在不改变源代码的情况下监控很多东西,比如:方法运行时间、输入输出参数、抛出...

    btrace workbench

    btrace workbench 插件jar包打包下载,jvisualvm的插件

    btrace-release-1.3.11.3.zip

    Btrace Java 发布版本,Java 虚拟机监控程序

    jvisualvm btrace插件离线安装

    jvisualvm btrace插件离线安装,如果jvisualvm不能安装btrace,则可进行离线安装。 这里收集了安装btrace所需要的依赖包,直接添加 即可安装

    btrace调试工具

    BTrace通过动态(字节码)检测类运行Java程序。BTrace插入跟踪行动运行Java程序的类和hotswaps跟踪程序类。 因此,也就成为我们线上跟踪生产代码的有力工具!

    jvisualvm-btrace离线安装包

    jvisualvm-btrace离线安装包。 jvisualvm btrace插件离线安装包1.2.85版本,目前官网不支持国内在线下载。 含相关依赖包:jsyntaxpane-lib.nbm、net-java-btrace-api.nbm、net-java-btrace-visualvm.nbm、...

    btrace_extend-master

    btrace_extend-master,解压后上传至服务器即可以使用btrace命令

    BTrace的安装包Windows

    BTrace

    BTrace自我总结测试代码

    BTrace自我学习测试代码总结,包含List对象参数,自定义对象的参数的监控。

Global site tag (gtag.js) - Google Analytics