1、可能标题说的很不明白,其实就是这样一个情况,一个工程项目错误日志出现GetConnectionTimeoutException: wait millis 90000, active 22000的异常,如下:

图片描述

2、最先想到的是提高数据库本身的最大连接数,查看一下数据库连接数是否过小,平衡一下工程的使用量级别和并发级别,其中查询数据库的小语句如下:

select value as processes_max from v$parameter where name ='processes';  --数据库允许的最大连接数  结果4000

select count(*) as process_now from v$process; --当前进程连接数

select value as session_max from v$parameter where name ='sessions'; --数据库最大session数

select count(*) as session_now from v$session;  --当前的session连接数
 
select count(*) as active_now from v$session where status='ACTIVE'; --并发连接数

3、但是当把数据库最大连接数也调整到合理的数字了,并且druid的基本配置也是没有什么毛病,这个可以网上搜索,有很多druid的常规配置文章参考。如果还有连接数不够的异常出现,这就要考虑是否程序本身存在没有回收的连接数、会话数等开支,日积月累在某个时刻,比如访问量高峰达到了饱和。那么可以添加druid的配置来帮助你监测,哪里没有回收。

      <!-- 超过时间限制是否回收 -->  
        <property name="removeAbandoned" value="true" />  
        <!-- 超时时间;单位为秒。180秒=3分钟   -->
        <property name="removeAbandonedTimeout" value="180" />  
        <!-- 关闭abanded连接时输出错误日志   -->
        <property name="logAbandoned" value="true" />

4、这回注意抓取和分析日志,如下

图片描述

5、结果进入具体的java类排查代码,发现存在session没有回收的问题。解决掉。