Can you check the times in vm.log and oned.log (when the shutdown failure occurs) is there any other relevant info in those logs?<div><br></div><div>Cheers<br><br><div class="gmail_quote">On Wed, Oct 27, 2010 at 10:15 PM, Rich Wellner <span dir="ltr"><<a href="mailto:rkw@objenv.com">rkw@objenv.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Leaving the monitor loop at 60 seconds and increasing the shutdown latency to 100 seconds (well more than the guest takes to shutdown) the problem remains.<div class="im">

<br>
<br>
rw2<br>
<br>
On 10/27/10 8:33 AM, Tino Vazquez wrote:<br>
</div><div><div></div><div class="h5"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Rich,<br>
<br>
OpenNebula ceases its monitoring when the VM enters the shutdown<br>
state. What is probably happening is that the VM takes more time to<br>
shutdown than the default timeout, which is 40 seconds (20 iterations<br>
over a 2 seconds sleep), so for OpenNebula is like if the shutdown<br>
failed. This timeout default can be adjusted in<br>
$ONE_LOCATION/bin/remotes/vmm/kvm/shutdown.<br>
<br>
Best regards,<br>
<br>
-Tino<br>
<br>
--<br>
Constantino Vázquez Blanco | <a href="http://dsa-research.org/tinova" target="_blank">dsa-research.org/tinova</a><br>
Virtualization Technology Engineer / Researcher<br>
OpenNebula Toolkit | <a href="http://opennebula.org" target="_blank">opennebula.org</a><br>
<br>
<br>
<br>
On Wed, Oct 27, 2010 at 1:08 AM, Rich Wellner<<a href="mailto:rkw@objenv.com" target="_blank">rkw@objenv.com</a>>  wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hey guys,<br>
<br>
I have monitoring turned down to a minute so that I don't have much latency<br>
on my management while we're doing testing.  As a result, when I do a<br>
shutdown on a vm sometimes the shutdown isn't complete before the next<br>
monitoring update.  What ends up happening is that the state of the machine<br>
goes from running to shutdown, then a bit later to running again.  Finally,<br>
when the guest shutdown actually complete, the state goes to unknow because<br>
One doesn't know why the machine disappeared.<br>
<br>
It would be better if this race condition were handled more elegantly and<br>
One could tolerate that the machine took a while to shutdown.  As is a<br>
manual clean-up has to happen.  I have also confirmed that my one minute<br>
monitor cycle only makes the problem more likely.  If, by coincidence,<br>
someone asks One to shutdown a vm slightly before the monitor thread kicks<br>
off, this issue shows up.  So it seems any machine that is shutdown where<br>
timeToShutdown>  timeUntilMonitorRefresh will end up in an unknown state.<br>
<br>
rw2<br>
<br>
<br>
<br>
_______________________________________________<br>
Users mailing list<br>
<a href="mailto:Users@lists.opennebula.org" target="_blank">Users@lists.opennebula.org</a><br>
<a href="http://lists.opennebula.org/listinfo.cgi/users-opennebula.org" target="_blank">http://lists.opennebula.org/listinfo.cgi/users-opennebula.org</a><br>
<br>
<br>
</blockquote></blockquote>
<br>
_______________________________________________<br>
Users mailing list<br>
<a href="mailto:Users@lists.opennebula.org" target="_blank">Users@lists.opennebula.org</a><br>
<a href="http://lists.opennebula.org/listinfo.cgi/users-opennebula.org" target="_blank">http://lists.opennebula.org/listinfo.cgi/users-opennebula.org</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Dr. Ruben Santiago Montero<br>Associate Professor (Profesor Titular), Complutense University of Madrid<br><br>URL: <a href="http://dsa-research.org/doku.php?id=people:ruben" target="_blank">http://dsa-research.org/doku.php?id=people:ruben</a><br>

Weblog: <a href="http://blog.dsa-research.org/?author=7" target="_blank">http://blog.dsa-research.org/?author=7</a><br>
</div>