<html>
 <body>
  <div style="font-family: Verdana, Arial, Helvetica, Sans-Serif;">
   <table bgcolor="#f9f3c9" width="100%" cellpadding="8" style="border: 1px #c9c399 solid;">
    <tr>
     <td>
      This is an automatically generated e-mail. To reply, visit:
      <a href="https://reviewboard.asterisk.org/r/1813/">https://reviewboard.asterisk.org/r/1813/</a>
     </td>
    </tr>
   </table>
   <br />





<blockquote style="margin-left: 1em; border-left: 2px solid #d0d0d0; padding-left: 10px;">
 <p style="margin-top: 0;">On March 22nd, 2012, 6:14 p.m., <b>Mark Michelson</b> wrote:</p>
 <blockquote style="margin-left: 1em; border-left: 2px solid #d0d0d0; padding-left: 10px;">
  <pre style="white-space: pre-wrap; white-space: -moz-pre-wrap; white-space: -pre-wrap; white-space: -o-pre-wrap; word-wrap: break-word;">No.

>From RFC 4235 Section 4.1: &quot;Versions start at 0, and increment by one for each new document sent to a subscriber. Versions are scoped within a subscription.&quot;

When the phone reSUBSCRIBEs with a new call-id, that is a new subscription, and so the version starts back at 0 again. The fact that the phone you are using is trying to compare the version of a new subscription against the version of a previous subscription is just completely wrong.

Now, in Asterisk, we try to work around some vendor&#39;s improper behavior, and it can probably be done here as well, just not in the way you have done it. What you have done is to make dialog-info subscriptions never expire. This means that you are purposely adding a sip_pvt reference leak into the code in the case that a subscription times out. If I understand things correctly, if you perform multiple reboots on your phones, then the number of active subscriptions in Asterisk will stack more and more. I&#39;m willing to bet that if you run &#39;sip show subscriptions&#39; in your setup after a few reboots of those phones, you&#39;d see a LOT more subscriptions than there should be. In addition, if you look at the SIP traffic after a few reboots, there are probably way more NOTIFYs than necessary going to the phones on every state change.

I honestly have no idea how the code change you&#39;ve presented causes things to work. When your phone reboots, I can see that a new subscription is created based on the fact that the XML has a new call-id. With your change, the old subscription that normally would have timed out does not now. What this means is that Asterisk is maintaining two subscriptions for the phone. Asterisk, on every dialog state change, will be sending two NOTIFYs to the phone. One will be for the old subscription, with a version the phone likes. The other NOTIFY will be for the new subscription, with a version starting at 0 and incrementing on each new NOTIFY. Now, here&#39;s where things get weird. The phone is presumably honoring the NOTIFYs for the old subscription, but not the NOTIFYs for the new subscription. Why? Does the phone still have knowledge of the old subscription despite the reboot? Does the phone just accept any unsolicited dialog-info NOTIFY? If the phone knows about the old subscription, and it also knows that it has created a new subscription, then why doesn&#39;t the phone unsubscribe from the old one? Why is it trying to apply a per-dialog version to multiple dialogs? Seriously, WTF?

I have a possible solution for this that is safer, but I don&#39;t know the specific mechanics behind the brokenness of these phones. Currently, the version reported in dialog-info is obtained from the sip_pvt, meaning each subscription maintains its own independent version counter. We could create an option so that for phones like yours, we store the version in the sip_peer instead. This way, if the peer resubscribes, then the version reported in the new subscription will continue from the same point it was in the old subscription. This would allow for the old subscription to still time out and have its resources released properly. If implementing this also causes BLF to be reported properly to your phones, then I&#39;d be willing to accept such a change into Asterisk. Just expect some strongly worded vitriol in the sample config file about how such an option should never have to exist in the first place :)</pre>
 </blockquote>







</blockquote>

<pre style="white-space: pre-wrap; white-space: -moz-pre-wrap; white-space: -pre-wrap; white-space: -o-pre-wrap; word-wrap: break-word;">Working with the senario that a phone has restarted due to loss of power for some reason.
Trusting a phone to unsubscribe to a previous subscription is just wrong, it won&#39;t know what it&#39;s previous call-id was.

The cleaner removed the power. Then plugged it back in... so many senarios :)
So the phone has just finished booting. 

   -- Registered SIP &#39;GXP0001&#39; at 192.168.5.141:5066
[Mar 23 23:54:15] NOTICE[23637]: chan_sip.c:13138 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;e607e6a8e79400dd@192.168.5.141&quot;&gt; version=0 terminated
astrid-test*CLI&gt; sip show subscriptions
Peer             User             Call ID          Extension        Last state     Type            Mailbox    Expiry
192.168.5.141    GXP0001          e607e6a8e79400d  8601GXP0001@tru  Idle           dialog-info+xml &lt;none&gt;     000300
192.168.5.141    GXP0001          5a1f3df6ce2e4fc  8601GXP0001@tru  Idle           dialog-info+xml &lt;none&gt;     000300
192.168.5.141    GXP0001          052f0371d160f58  --               &lt;none&gt;         mwi             8612       000300
3 active SIP subscriptions

[Mar 23 23:56:45] NOTICE[23637]: chan_sip.c:13138 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;e607e6a8e79400dd@192.168.5.141&quot;&gt; version=1 terminated
    -- Registered SIP &#39;GXP0001&#39; at 192.168.5.141:5064
[Mar 23 23:58:25] NOTICE[23637]: chan_sip.c:13133 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;5a1f3df6ce2e4fcf@192.168.5.141&quot; direction=&quot;recipient&quot;&gt; version=2 terminated
[Mar 23 23:58:25] NOTICE[23637]: chan_sip.c:3868 __sip_autodestruct: ALEC TIMEOUT of SIP subscription 5a1f3df6ce2e4fcf@192.168.5.141

astrid-test*CLI&gt; sip show subscriptions
Peer             User             Call ID          Extension        Last state     Type            Mailbox    Expiry
192.168.5.141    GXP0001          e607e6a8e79400d  8601GXP0001@tru  Idle           dialog-info+xml &lt;none&gt;     000300
192.168.5.141    GXP0001          052f0371d160f58  --               &lt;none&gt;         mwi             8612       000300
2 active SIP subscriptions

>From this, I take it as call-id of &#39;5a1f3df6ce2e4fc&#39; has been killed off, and with my change the phone wasn&#39;t sent the timeout to the device.

I&#39;m wondering why we didn&#39;t finish up with 2 MWI subscriptions, there may be a clue there, did the code kill off the previous mwi subscription when another for the same device arrived, or did the phone unsubscribe.
</pre>
<br />








<p>- Alec</p>


<br />
<p>On March 13th, 2012, 5:35 p.m., Alec Davis wrote:</p>






<table bgcolor="#fefadf" width="100%" cellspacing="0" cellpadding="8" style="background-image: url('https://reviewboard.asterisk.org/media/rb/images/review_request_box_top_bg.png'); background-position: left top; background-repeat: repeat-x; border: 1px black solid;">
 <tr>
  <td>

<div>Review request for Asterisk Developers.</div>
<div>By Alec Davis.</div>


<p style="color: grey;"><i>Updated March 13, 2012, 5:35 p.m.</i></p>




<h1 style="color: #575012; font-size: 10pt; margin-top: 1.5em;">Description </h1>
<table width="100%" bgcolor="#ffffff" cellspacing="0" cellpadding="10" style="border: 1px solid #b8b5a0">
 <tr>
  <td>
   <pre style="margin: 0; padding: 0; white-space: pre-wrap; white-space: -moz-pre-wrap; white-space: -pre-wrap; white-space: -o-pre-wrap; word-wrap: break-word;">Some phones (Grandstream GXP20XX series 1.2.5.3 firmware) if rebooted, loose the BLF lights due to the new subscription&#39;s &quot;version&quot; being less than the previous subscription&#39;s &quot;version&quot;.
This happens the instant that asterisk timeouts the previous subscription - which has the much larger &quot;version&quot; sequence number.

The only way for the lights to start working again, is for the current subscription&#39;s &quot;version&quot; number to increment past the previous old &quot;version&quot; number.
That period of time could be huge, if the phone isn&#39;t rebooted for days.

The workaround has been to reboot the phone twice, within a few minutes of each reboot.
  1st time wait for the BLF&#39;s to fail (then reboot again) - which is the timeout period - a few minutes.
  2nd time the lights will work, then fail, then after a few minutes start working again.

This fix prevents the old subscription timeout from updating the phones &quot;version&quot; number. 

This issue doesn&#39;t affter the GXP21XX series.

Attempt to show issue byway of example below with some debug output showing call-id and version number.

astrid-test*CLI&gt; core show hints

    -= Registered Asterisk Dial Plan Hints =-
            8601GXP0001@trusted             : Custom:q8601_a8612    State:InUse           Watchers  1
Debug output:

===Set the BLF state to InUse
- Executing [s@macro-custom-agent-inout:13] Set(&quot;SIP/GXP0001-00000005&quot;, &quot;DEVICE_STATE(Custom:q8601_a8612)=INUSE&quot;) in new stack
...
[Mar 14 11:01:39] NOTICE[10819]: chan_sip.c:13136 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;3c65aed02ae1d5df@192.168.5.141&quot;&gt; version=5

=============
Reboot the phone, it gets a new BLF subscription.
=============
[Mar 14 11:02:30] NOTICE[10826]: chan_sip.c:13136 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;79956c0168125400@192.168.5.141&quot;&gt; version=0
===The BLF has correct state of InUse.

...
[Mar 14 11:05:00] NOTICE[10826]: chan_sip.c:13136 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;79956c0168125400@192.168.5.141&quot;&gt; version=1
===The BLF still has correct state of InUse.

...
The timeout &#39;last notification&#39;
[Mar 14 11:05:09] NOTICE[10826]: chan_sip.c:13131 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;3c65aed02ae1d5df@192.168.5.141&quot; direction=&quot;recipient&quot;&gt; version=6
[Mar 14 11:05:09] NOTICE[10826]: chan_sip.c:3868 __sip_autodestruct: ALEC TIMEOUT of SIP subscription 3c65aed02ae1d5df@192.168.5.141
===The BLF has incorrectly gone Idle.

...
[Mar 14 11:15:01] NOTICE[10826]: chan_sip.c:13136 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;79956c0168125400@192.168.5.141&quot;&gt; version=5
===The BLF is still incorrect at Idle.

    -- Registered SIP &#39;GXP0001&#39; at 192.168.5.141:5066
[Mar 14 11:17:31] NOTICE[10826]: chan_sip.c:13136 state_notify_build_xml: ALEC &lt;dialog id=&quot;8601GXP0001&quot; call-id=&quot;79956c0168125400@192.168.5.141&quot;&gt; version=6
===The BLF now has correct state of InUse.
</pre>
  </td>
 </tr>
</table>


<h1 style="color: #575012; font-size: 10pt; margin-top: 1.5em;">Testing </h1>
<table width="100%" bgcolor="#ffffff" cellspacing="0" cellpadding="10" style="border: 1px solid #b8b5a0">
 <tr>
  <td>
   <pre style="margin: 0; padding: 0; white-space: pre-wrap; white-space: -moz-pre-wrap; white-space: -pre-wrap; white-space: -o-pre-wrap; word-wrap: break-word;">In place on a 1.8 deployment for months, our production box with ~80 GXP phones, half of which are the older GXP20XX series.
</pre>
  </td>
 </tr>
</table>




<h1 style="color: #575012; font-size: 10pt; margin-top: 1.5em;">Diffs</b> </h1>
<ul style="margin-left: 3em; padding-left: 0;">

 <li>trunk/channels/chan_sip.c <span style="color: grey">(358608)</span></li>

</ul>

<p><a href="https://reviewboard.asterisk.org/r/1813/diff/" style="margin-left: 3em;">View Diff</a></p>




  </td>
 </tr>
</table>








  </div>
 </body>
</html>