<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" id="owaParaStyle"></style>
</head>
<body fpstyle="1" ocsi="0">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;">I am wondering if there are any other big OpenNebula clouds out there using RHEL 6.3 or 6.4, 
<div>Centos 6.3 or 6.4, or Scientific Linux 6.3 or 6.4?</div>
<div><br>
</div>
<div>We are seeing a fairly nasty performance problem, but only on intel-based "Sandy Bridge" or "Ivy Bridge"</div>
<div>based hardware.  If you have N kvm-based virtual machines running (N>=4 as far as I can tell) </div>
<div>and then do a lot of disk and I/O  activity on the hypervisor, for example migrating several more virtual machines to or from the bare metal, and if at least one of those virtual machines is doing some I/O too, there is a failure</div>
<div>mode such that you start seeing sshd processes (from oneadmin monitoring or otherwise) hanging and taking 100%</div>
<div>of CPU. Ping times to virtual machines become very widely varied, in extreme cases the VM can even go </div>
<div>off the network entirely in such a fashion that ifdown/ifup doesn't bring it back and sometimes you can't even kill</div>
<div>it with virsh destroy.  A couple times we have even managed to crash the hypervisor irreversibly so it has to be power cycled.</div>
<div><br>
</div>
<div>If all the surviving virtual machines are shut down, the system then returns to normal and all the hung processes exit.</div>
<div><br>
</div>
<div>Has anyone else seen problems iike this?  If so please let me know.  There seems to be little if anything out there about this bug and that is strange since it has been out there for a while.</div>
<div><br>
</div>
<div>Steve Timm</div>
<div><br>
</div>
<div><br>
</div>
</div>
</body>
</html>