Removing pgpool from the equation and simply doing a direct postgres connection, it seems like the issue still occurs.  If opensips is idle on the avpops db for some time (sounds like about 30 minutes), and you try to execute an arbitrary query to that connection from the routing script, it just keeps passing to the next child without returning data from the query until it runs out of children to execute the process, and so it just kind of &quot;hangs&quot;.<br>
<br>This is with maximum logging enabled.  You can see where the first process attempts to parse the message.  When we get to the db lookup, the task immediately goes to the next process without actually having the first process stop, and it hangs on the &quot;SELECT&quot; statement.  I can at this point however directly connect to my postgres backend and do the query manually.<br>
<br>This repeats for all the SIP receiving processes, until none are left.  At this point, the proxy stops responding to any messages.<br><br>Is there some sort of connection timeout like parameter involving avp_ops that I&#39;m missing?  It seems like I can troubleshoot so far that a) if the proxy is never idle, this doesn&#39;t seem to happen, and b) if the proxy is idle (processing 0 messages), it happens after about 30 minutes and requires a restart of opensips to function correctly.<br>
<br><br><br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_msg: SIP Request:<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_msg:  method:  &lt;INVITE&gt;<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_msg:  uri:     &lt;sip:+13129576830@1.2.3.4:5060;transport=udp&gt;<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_msg:  version: &lt;SIP/2.0&gt;<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: flags=2<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK4dbf.e8b09c62.0&gt;; state=16<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via: end of header reached, state=5<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: via found, flags=2<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: this is the first via<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:receive_msg: After parse_msg...<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:receive_msg: preparing to run routing scripts...<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: Starting processing for method INVITE<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: flags=100<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK4dbf.2d03d153.0&gt;; state=16<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via: end of header reached, state=5<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: via found, flags=100<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: parse_headers: this is the second via<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK506071629460-1207609494153&gt;; state=16<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_via: end of header reached, state=5<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_headers: via found, flags=100<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_to: end of header reached, state=10<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:parse_to: display={}, ruri={<a href="http://sip:+13129576830@4.79.212.229:5060">sip:+13129576830@4.79.212.229:5060</a>}<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:get_hdr_field: &lt;To&gt; [38]; uri=[<a href="http://sip:+13129576830@4.79.212.229:5060">sip:+13129576830@4.79.212.229:5060</a>]<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:get_hdr_field: to body [&lt;<a href="http://sip:+13129576830@4.79.212.229:5060">sip:+13129576830@4.79.212.229:5060</a>&gt;#015#012]<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:get_hdr_field: cseq &lt;CSeq&gt;: &lt;1&gt; &lt;INVITE&gt;<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:maxfwd:is_maxfwd_present: value = 67<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: Entering rewrite-ruri block: ruri-user is +13129576830<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: regex search turned up true!!<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: request user: 13129576830<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: this is the phone number: 13129576830<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: Original User is +13129576830<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: Is the avp phone_number still set? 13129576830<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:avpops:ops_dbquery_avps: query [SELECT account_id FROM customer.phone_numbers WHERE phone_number = &#39;13129576830&#39;]<br>
Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:db_postgres:db_postgres_submit_query: 0x76e170 PQsendQuery(SELECT account_id FROM customer.phone_numbers WHERE phone_number = &#39;13129576830&#39;)<br>Apr 20 02:54:30 opensipsibp /sbin/opensips[22832]: DBG:core:db_new_result: allocate 48 bytes for result set at 0x776640<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_msg: SIP Request:<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_msg:  method:  &lt;INVITE&gt;<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_msg:  uri:     &lt;sip:+13129576830@1.2.3.4:5060;transport=udp&gt;<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_msg:  version: &lt;SIP/2.0&gt;<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: flags=2<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK4dbf.e8b09c62.0&gt;; state=16<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via: end of header reached, state=5<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: via found, flags=2<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: this is the first via<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:receive_msg: After parse_msg...<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:receive_msg: preparing to run routing scripts...<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: Starting processing for method INVITE<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: flags=100<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK4dbf.2d03d153.0&gt;; state=16<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via: end of header reached, state=5<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: via found, flags=100<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: parse_headers: this is the second via<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via_param: found param type 232, &lt;branch&gt; = &lt;z9hG4bK506071629460-1207609494153&gt;; state=16<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_via: end of header reached, state=5<br>
Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_headers: via found, flags=100<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_to: end of header reached, state=10<br>Apr 20 02:54:31 opensipsibp /sbin/opensips[22833]: DBG:core:parse_to: display={}, ruri={<a href="http://sip:+13129576830@4.79.212.229:5060">sip:+13129576830@4.79.212.229:5060</a>}<br>
<br><br><br><br><div class="gmail_quote">On Fri, Apr 17, 2009 at 5:32 PM, Bobby Smith <span dir="ltr">&lt;<a href="mailto:bobby.smith@gmail.com">bobby.smith@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
An example of what happens -- on processing a call right before a database lookup (the select query below in the previous message):<br><br>00:00:00 pgpool: opensips my_database localhost(46362) SELECT<br>postgres   445   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46383) SELECT<br>

postgres   446   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   447   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   448   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>

postgres   449   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   450   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   451   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46366) SELECT<br>

postgres   452   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46371) SELECT<br>postgres   453   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   454   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46367) SELECT<br>

postgres   455   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46372) SELECT<br>postgres   456   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46393) idle<br>postgres   457   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46391) SELECT<br>

postgres   458   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46377) SELECT<br>postgres   459   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46378) SELECT<br>postgres   460   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46374) SELECT<br>

postgres   461   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   462   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46387) SELECT<br>postgres   463   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>

postgres   464   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46380) SELECT<br>postgres   465   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   466   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46385) SELECT<br>

postgres   468   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46389) SELECT<br>postgres   469   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46361) SELECT<br>postgres   471   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>

postgres   473   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   474   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   475   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>

postgres   476   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   477   438  0 09:00 ?        00:00:00 pgpool: wait for connection request<br>postgres   478   438  0 09:00 ?        00:00:00 pgpool: opensips my_database localhost(46365) SELECT<br>

<br>I have 32 &quot;available&quot; connections, 16 of which are occupied by opensips children processes.  On this one query, it looks like &quot;every&quot; opensips process does the same processing to *all* the pgpool connections.  This is just for a single INVITE.  I don&#39;t know if the database lookup is failing or not, but it looks like the next child processes the message until none are left?<br>

<br>It will kind of just float here in this state for some time now -- I&#39;ve got a heartbeat script that can come back and clean this up (transparent to the endusers as we&#39;re in a failover setup), but I would like to know how to go about troubleshooting this particular type of issue.<br>

<br>I know it&#39;s not the database dying or pgpool losing it&#39;s connections, as I have logging enabled on both.<br><br>Any suggestions on troubleshooting, or has anyone tried this sort of configuration before?<br><br>

Thanks much in advance.<div><div></div><div class="h5"><br><br><div class="gmail_quote">On Thu, Apr 16, 2009 at 4:39 PM, Bobby Smith <span dir="ltr">&lt;<a href="mailto:bobby.smith@gmail.com" target="_blank">bobby.smith@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
All,<br><br>We&#39;re currently (successfully) testing a configuration of Opensips as a stateless proxy.  I wanted to be able to execute an arbitrary database query to a database that&#39;s NOT the opensips database, when I realized the power of the avp_db_query( ) function in avpops.  The database is a backend postgres database in an basic failover configuration (16 max connections cached, primary db, failover to secondary db for those connections).<br>


<br>Currently, opensips has 16 children processes.  In the configuration, we have the following:<br><br>modparam(&quot;avpops&quot;, &quot;db_url&quot;, &quot;postgres://opensips:opensips@localhost:9999/my_database&quot;)<br>


modparam(&quot;avpops&quot;, &quot;avp_table&quot;, &quot;&quot;)<br><br>A few of the issues I&#39;m concerned about or experiencing with the operation of it.<br><br>a) Why is that second parameter necessary (avp_table)?  It feels like if I have to set this that it&#39;s always going to keep open connections with the database, and indeed, it is.  When I ps -ef, it shows I have 16 pgpool connections that are idle to my_database.  The problem that this is causing is that, if for some reason one of the connections has an issue and dies or times out, this happens in the logs:<br>


<br>Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: ERROR:db_postgres:db_postgres_store_result: 0x76e008 - invalid query, execution aborted<br>Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: ERROR:db_postgres:db_postgres_store_result: 0x76e008: PGRES_FATAL_ERROR<br>


Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: ERROR:db_postgres:db_postgres_store_result: 0x76e008: server closed the connection unexpectedly#012#011This probably means the server terminated abnormally#012#011before or while processing the request.#012<br>


Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: ERROR:core:db_do_raw_query: error while storing result<br>Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: ERROR:avpops:db_query_avp: cannot do the query<br>Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: Database Error!  No Lookup!<br>


Apr 16 05:46:02 serinbound1 /sbin/opensips[30773]: Query Executed:  Account Number is &lt;null&gt;<br><br>The query I&#39;m executing (from the config):  <br>avp_db_query(&quot;SELECT value FROM schema.table WHERE value = &#39;$avp(s:string_a)&#39;&quot;, &quot;$avp(s:string_b)&quot;);<br>


<br>When these error messages pop up, pgpool still has active database connections to postgres, but not held by opensips.  I can use one of the pooled connections to connect to the backend database and execute a query, but for some reason opensips cannot.<br>


<br>And, having a restart work (scripted), I occasionally see the following:<br><br>Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:db_postgres:db_postgres_new_connection: server closed the connection unexpectedly#012#011This probably means the server terminated abnormally#012#011before or while processing the request.#012<br>


Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:db_postgres:db_postgres_new_connection: cleaning up 0x76e090=pkg_free()<br>Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:core:db_do_init: could not add connection to the pool<br>


Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:avpops:avpops_db_init: cannot initialize database connection<br>Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:core:init_mod_child: failed to initializing module avpops, rank -1<br>


Apr 16 03:59:05 serinbound2 /sbin/opensips[23105]: ERROR:core:start_timer_processes: init_child failed for timer proc<br>Apr 16 03:59:05 serinbound2 /sbin/opensips[23083]: INFO:core:handle_sigs: child process 23105 exited normally, status=255<br>


Apr 16 03:59:05 serinbound2 /sbin/opensips[23083]: INFO:core:handle_sigs: terminating due to SIGCHLD<br>Apr 16 03:59:05 serinbound2 /sbin/opensips[23107]: INFO:core:sig_usr: signal 15 received<br><br>At this point, the application crashes.<br>


<br>Any suggestions or workarounds for this?  More specifically, I&#39;d like opensips to not have to grab the DB connection if it doesn&#39;t need it at that time performing a lookup (as i&#39;m not really using avp&#39;s in the lookup, just to save the results), also, I&#39;d like to see it not crash completely if it loses that connection.  Instead, just send a error message back and allow me to insert a statement like:<br>


<br>               if(! what i expect the value of the saved avp from teh database query to be)<br>                {<br>                        sl_send_reply(&quot;500&quot;, &quot;Internal Server Error&quot;);<br>                        exit;<br>


                }<br><br>Thanks for your help, I know this was fairly detailed but without much in terms of logging.<br><br><br>
</blockquote></div><br>
</div></div></blockquote></div><br>