<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Hi all,<br>
    <br>
    Problem solved. It was a bug previously reported and solved by Tino
    Vázquez. After uncommenting several lines in host_error.rb all works
    fine.<br>
    <br>
    Kind Regards,<br>
    <br>
    Carlos.<br>
    <br>
    <div class="moz-cite-prefix">On 12/10/2012 11:54 AM, Carlos Jiménez
      wrote:<br>
    </div>
    <blockquote cite="mid:50C5BF81.3020401@eneotecnologia.com"
      type="cite">
      <meta http-equiv="content-type" content="text/html;
        charset=ISO-8859-1">
      Hi all,<br>
      <br>
      I have one computer running OpenNebula and two hosts with KVM.<br>
      I have configured "HOST_HOOK" and "VM_HOOK" on /etc/one/oned.conf:<br>
      <small><i><br>
        </i><i>HOST_MONITORING_INTERVAL         = 600</i><i><br>
        </i><i>VM_POLLING_INTERVAL            = 600</i><i><br>
        </i><i>HOST_HOOK = [</i><i><br>
        </i><i>    name      = "error",</i><i><br>
        </i><i>    on        = "ERROR",</i><i><br>
        </i><i>    command   = "ft/host_error.rb",</i><i><br>
        </i><i>    arguments = "$ID -r",</i><i><br>
        </i><i>    remote    = "no" ]</i><i><br>
        </i><i>VM_HOOK = [</i><i><br>
        </i><i>   name      = "on_failure_resubmit",</i><i><br>
        </i><i>   on        = "FAILED",</i><i><br>
        </i><i>   command   = "/usr/bin/env onevm resubmit",</i><i><br>
        </i><i>   arguments = "$ID" ]</i></small><br>
      <br>
      I've powered off one of the hosts, with one VM running. The VM
      polling and Host monitoring intervals are set to default. After
      10-15 minutes, the host is detected as failed (ERROR state) but
      the VM is not resubmitted yet. According to the logs, it seems to
      be a problem in the execution of the "recovery" script.<br>
      The failed host ID is 5 and the affected VM ID is 36.<br>
      <br>
      This is the relevant part of the log:<br>
      <small><i><br>
        </i><i>Mon Dec 10 11:47:34 2012 [InM][I]: Monitoring host host2
          (5)</i><i><br>
        </i><i>Mon Dec 10 11:47:34 2012 [InM][I]: Monitoring host host1
          (6)</i><i><br>
        </i><i>Mon Dec 10 11:47:34 2012 [ReM][D]: Req:4576 UID:0 AclInfo
          invoked</i><i><br>
        </i><i>Mon Dec 10 11:47:34 2012 [ReM][D]: Req:4576 UID:0 AclInfo
          result SUCCESS, "<ACL_POOL><ACL><ID>0..."</i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][I]: Command execution
          fail: 'if [ -x "/var/tmp/one/im/run_probes" ]; then
          /var/tmp/one/im/run_probes kvm 5 host2;
          else                              exit 42; fi'</i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][I]: ssh: connect to host
          host2 port 22: No route to host</i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][I]: ExitCode: 255</i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][E]: Error monitoring host
          5 : MONITOR FAILURE 5 -</i><i><br>
        </i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [HKM][D]: Message received: LOG
          I 5 Command execution fail:
          /var/lib/one/remotes//hooks/ft/host_error.rb 5 -r</i><i><br>
        </i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [HKM][D]: Message received: LOG
          I 5 ExitCode: 255</i><i><br>
        </i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [HKM][D]: Message received:
          EXECUTE FAILURE 5 error: -</i><i><br>
        </i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][I]: ExitCode: 0</i><i><br>
        </i><i>Mon Dec 10 11:47:37 2012 [InM][D]: Host 6 successfully
          monitored.</i></small><br>
      <br>
      <br>
      Could you give advice on how to solve this issue?<br>
      Let me know if you need more information.<br>
      <br>
      <br>
      Thanks in advance.<br>
      <br>
      Carlos.<br>
      <br>
      <br>
    </blockquote>
    <br>
  </body>
</html>