<div dir="ltr"><div class="gmail_quote">On Wed, Jul 6, 2011 at 7:02 AM, Tzafrir Cohen <span dir="ltr">&lt;<a href="mailto:tzafrir.cohen@xorcom.com">tzafrir.cohen@xorcom.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<div><div></div><div class="h5">On Wed, Jul 06, 2011 at 06:15:26AM -0400, A E [Gmail] wrote:<br>
&gt; On Wed, Jul 6, 2011 at 3:21 AM, Tzafrir Cohen &lt;<a href="mailto:tzafrir.cohen@xorcom.com">tzafrir.cohen@xorcom.com</a>&gt;wrote:<br>
&gt;<br>
&gt; &gt; On Tue, Jul 05, 2011 at 08:30:52PM -0400, A E [Gmail] wrote:<br>
&gt; &gt; &gt; hello people,<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; I am running v1.8.4.2 on debian squeeze on a sparc platform...and for<br>
&gt; &gt; some<br>
&gt; &gt; &gt; reason I have noticed that only after a few test calls, the asterisk<br>
&gt; &gt; process<br>
&gt; &gt; &gt; is running between 95% - 99.9% CPU when there&#39;s absolutely nothing on the<br>
&gt; &gt; &gt; system. This is a clean Asterisk system in an internal network with<br>
&gt; &gt; nothing<br>
&gt; &gt; &gt; else on it with no calls on it but it&#39;s still sitting with 96% CPU.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; I&#39;m not a developer so not that ept with using debug tools etc to figure<br>
&gt; &gt; out<br>
&gt; &gt; &gt; why it&#39;s doing that. Could anyone please tell me how I can figure out why<br>
&gt; &gt; &gt; it&#39;s doing this and/or help debug this. Makes no sense for it to be using<br>
&gt; &gt; &gt; CPU with nothing happening on the system<br>
&gt; &gt;<br>
&gt; &gt; The first thing I&#39;d do is run &#39;top&#39;, press shift H, and see what is/are<br>
&gt; &gt; the offending thread(s).<br>
&gt; &gt;<br>
&gt; &gt; Is it a single thread? Two? More?<br>
&gt; &gt;<br>
&gt; &gt; Is it all &quot;user&quot; time? Much of it is &quot;system&quot; time?<br>
&gt; &gt;<br>
&gt; &gt; If you strace the PID of the top thread (strace -p PID), what do you<br>
&gt; &gt; see?<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Hi Tzafrir,<br>
&gt;<br>
&gt; thanks for the comments and suggestions. So I&#39;d done all of that and what<br>
&gt; I&#39;d found was<br>
&gt;<br>
&gt; - After I&#39;d done Shift-h, There was only one / single thread that was taking<br>
&gt; all of the CPU<br>
&gt; - 33% was Sser and 66% was System times<br>
&gt; - when I&#39;d run an strace on the PID of the offending thread it just rolled<br>
&gt; some message past my screen which I couldn&#39;t capture and can&#39;t remember what<br>
&gt; it said :(<br>
<br>
</div></div>Just press ctrl-c .<br>
<div class="im"><br></div></blockquote><div><font class="Apple-style-span" color="#000099">haha I did that but since that I did a 100 other things in my ssh window which is only buffered for 5000 lines and those messages have gone past. </font></div>

<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">
&gt;<br>
&gt; Anyway I&#39;ve killed that process, updated the packages the system, upgraded<br>
&gt; to 1.8.4.4 and will give it another shot and see what happens. Would&#39;ve<br>
&gt; helped if I&#39;d kept the system as it was so people could help me figure out<br>
&gt; what was going on, but the fact that it stopped responding to commands which<br>
&gt; were trying to kill the hung channels, reloading configs, or even trying to<br>
&gt; stop the system wouldn&#39;t work is bizarre. I hope the developers pay<br>
&gt; attention to that.<br>
<br>
</div>Developers need some data to work with :-(<br>
<div><div></div><div class="h5"><br></div></div></blockquote><div><font class="Apple-style-span" color="#000099">Haha of course. Although I have a feeling it&#39;ll happen again as this is the 2nd time this has happened. Will keep the system in that state till we can try and resolve this and capture enough info. if I had better memory, I&#39;d have actually remembered what the message was, but anyway, what I was trying to say was that it&#39;s much more than just taking up all the CPU tells me that some thread has just gone loco. But the fact the CLI and AMI commands become unresponsive when trying to kill these zombie channels or trying to do a &quot;core reload&quot; or &quot;core stop now&quot; etc. tells me that this is a bigger issue than just some thread gone nuts and the channels being hung</font></div>

</div></div>