Tino<br>I think the original problem was, we were sharing only the NFS path where disk images are stored but not the &lt;vmid&gt;/images directory. After we changed that and defined the path in VM_DIR in oned.conf, suspend and resume is working good. <br>
<br>Since &lt;vmid&gt;/images is accessible by all hosts and even when it gets resumed on different machine, that host is able to access the &lt;vmid&gt;/images directory.<br><br>However the checkpoint file is still getting created. Is there a way to have Opennebula not create the checkpoint file.<br>
<br>Ranga<br><br><div class="gmail_quote">On Mon, Mar 15, 2010 at 4:35 AM, Tino Vazquez <span dir="ltr">&lt;<a href="mailto:tinova@fdi.ucm.es">tinova@fdi.ucm.es</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi there,<br>
<br>
Sorry, but I&#39;m failing to see the<br>
<div class="im"><br>
tm_mv.sh: Will not move, is not saving image<br>
<br>
</div>message anywhere in your logs.<br>
<div class="im"><br>
Regards,<br>
<br>
-Tino<br>
<br>
--<br>
Constantino Vázquez, Grid &amp; Virtualization Technology<br>
Engineer/Researcher: <a href="http://www.dsa-research.org/tinova" target="_blank">http://www.dsa-research.org/tinova</a><br>
DSA Research Group: <a href="http://dsa-research.org" target="_blank">http://dsa-research.org</a><br>
Globus GridWay Metascheduler: <a href="http://www.GridWay.org" target="_blank">http://www.GridWay.org</a><br>
OpenNebula Virtual Infrastructure Engine: <a href="http://www.OpenNebula.org" target="_blank">http://www.OpenNebula.org</a><br>
<br>
<br>
<br>
</div>On Mon, Mar 8, 2010 at 5:04 AM, Rangababu Chakravarthula<br>
<div><div></div><div class="h5">&lt;<a href="mailto:rbabu@hexagrid.com">rbabu@hexagrid.com</a>&gt; wrote:<br>
&gt; Thank you Tino. Sorry for the late reply. Here are the detailed logs. Any<br>
&gt; help is appreciated.<br>
&gt;<br>
&gt; NFS SHARED IMAGES DIRECTORY BETWEEN ALL HOSTS /mnt/sharedimagesdir<br>
&gt;<br>
&gt; Contents of ONED.CONF<br>
&gt;<br>
&gt; VM_DIR=/mnt/sharedimagesdir<br>
&gt; IM_MAD = [<br>
&gt;   name       = &quot;im_kvm&quot;,<br>
&gt;   executable = &quot;one_im_ssh&quot;,<br>
&gt;   arguments  = &quot;im_kvm/im_kvm.conf&quot;,<br>
&gt;   default    = &quot;im_kvm/im_kvm.conf&quot; ]<br>
&gt; VM_MAD = [<br>
&gt;    name       = &quot;vmm_kvm&quot;,<br>
&gt;    executable = &quot;one_vmm_kvm&quot;,<br>
&gt;    default    = &quot;vmm_kvm/vmm_kvm.conf&quot;,<br>
&gt;    type       = &quot;kvm&quot; ]<br>
&gt; TM_MAD = [<br>
&gt;       name       = &quot;tm_nfs&quot;,<br>
&gt;       executable = &quot;one_tm&quot;,<br>
&gt;       arguments  = &quot;tm_nfs/tm_nfs.conf&quot;,<br>
&gt;       default    = &quot;tm_nfs/tm_nfs.conf&quot; ]<br>
&gt;<br>
&gt; WE MODIFIED tm_clone.sh &amp; tm_ln.sh to add SSH<br>
&gt;<br>
&gt;<br>
&gt; SUBMITTED NEW VM<br>
&gt;<br>
&gt; onevm show 433<br>
&gt;<br>
&gt; VID            : 433                UID            : 0<br>
&gt;  STATE          : ACTIVE             LCM STATE      : RUNNING<br>
&gt;  DEPLOY ID      : one-433            MEMORY         : 262144             CPU<br>
&gt;            : 0                  LAST POLL      : 1267828125         START<br>
&gt; TIME     : 03/05 16:12:02     STOP TIME      : 12/31 18:00:00     NET TX<br>
&gt;     : 0                  NET RX         : 0<br>
&gt; ....: Template :....<br>
&gt;   DISK            :<br>
&gt; CLONE=no,SOURCE=/mnt/sharedimagesdir/images/onetest0,TARGET=hda,TYPE=disk<br>
&gt;   GRAPHICS        : LISTEN=0.0.0.0,PORT=6003,TYPE=vnc<br>
&gt;   INPUT           : TYPE=tablet           MEMORY          : 256<br>
&gt;       NAME            : onetest               NIC             :<br>
&gt; BRIDGE=br171,MAC=00:04:c9:5b:44:8a<br>
&gt;   OS              : BOOT=hd               VCPU            : 1<br>
&gt;<br>
&gt;<br>
&gt; ON THE MANAGEMENT NODE<br>
&gt;<br>
&gt; root@ManagementNode:/etc/one/tm_nfs# ls -al /var/lib/one/433/<br>
&gt; total 24<br>
&gt; drwxrwxrwx   2 oneadmin nogroup  4096 2010-03-05 16:12 .<br>
&gt; drwxr-xr-x 437 oneadmin root    12288 2010-03-05 16:26 ..<br>
&gt; -rw-r--r--   1 oneadmin nogroup   549 2010-03-05 16:12 deployment.0<br>
&gt; -rw-r--r--   1 oneadmin nogroup    89 2010-03-05 16:12 transfer.0<br>
&gt;<br>
&gt; /var/log/one/433.log<br>
&gt;<br>
&gt; Fri Mar  5 16:12:11 2010 [DiM][I]: New VM state is ACTIVE.<br>
&gt; Fri Mar  5 16:12:11 2010 [LCM][I]: New VM state is PROLOG.<br>
&gt; Fri Mar  5 16:12:11 2010 [TM][I]: tm_ln.sh: Creating directory<br>
&gt; /mnt/sharedimagesdir/433/images<br>
&gt; Fri Mar  5 16:12:11 2010 [TM][I]: tm_ln.sh: Executed &quot;ssh 10.10.20.190 mkdir<br>
&gt; -p /mnt/sharedimagesdir/433/images&quot;.<br>
&gt; Fri Mar  5 16:12:11 2010 [TM][I]: tm_ln.sh: Executed &quot;ssh 10.10.20.190 chmod<br>
&gt; a+w /mnt/sharedimagesdir/433/images&quot;.<br>
&gt; Fri Mar  5 16:12:11 2010 [TM][I]: tm_ln.sh: Link<br>
&gt; /mnt/sharedimagesdir/images/onetest0<br>
&gt; Fri Mar  5 16:12:11 2010 [TM][I]: tm_ln.sh: Executed &quot;ssh 10.10.20.190 ln -s<br>
&gt; /mnt/sharedimagesdir/images/onetest0<br>
&gt; /mnt/sharedimagesdir/433/images/disk.0&quot;.<br>
&gt; Fri Mar  5 16:12:11 2010 [LCM][I]: New VM state is BOOT<br>
&gt; Fri Mar  5 16:12:11 2010 [VMM][I]: Generating deployment file:<br>
&gt; /var/lib/one/433/deployment.0<br>
&gt; Fri Mar  5 16:12:11 2010 [VMM][I]: Command: scp<br>
&gt; /var/lib/one/433/deployment.0<br>
&gt; 10.10.20.190:/mnt/sharedimagesdir/433/images/deployment.0<br>
&gt; Fri Mar  5 16:12:11 2010 [VMM][I]: Copy success<br>
&gt; Fri Mar  5 16:12:12 2010 [VMM][I]: Connecting to uri: qemu:///system<br>
&gt; Fri Mar  5 16:12:12 2010 [VMM][I]: ExitCode: 0<br>
&gt; Fri Mar  5 16:12:12 2010 [LCM][I]: New VM state is RUNNING<br>
&gt;<br>
&gt;<br>
&gt; onevm list<br>
&gt;<br>
&gt; 433  onetest runn   0  262144    10.10.20.190 00 00:16:44<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; ON THE HOST<br>
&gt;<br>
&gt; root@00238bbda914:/mnt/sharedimagesdir# ls -ltr<br>
&gt; /mnt/sharedimagesdir/433/images/<br>
&gt; total 2<br>
&gt; lrwxrwxrwx  1 oneadmin nogroup  32 2010-03-05 22:08 disk.0 -&gt;<br>
&gt; /mnt/sharedimagesdir/images/onetest0<br>
&gt; -rw-r--r--+ 1 oneadmin nogroup 549 2010-03-05 22:08 deployment.0<br>
&gt; root@00238bbda914:/mnt/sharedimagesdir#<br>
&gt;<br>
&gt;<br>
&gt; /var/log/libvirt/qemu/433.log on HOST<br>
&gt;<br>
&gt; LC_ALL=C PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin<br>
&gt; /usr/bin/kvm -S -M pc-0.11 -m 256 -smp 1 -name one-433 -uuid<br>
&gt; 74c151d6-b1f5-3e41-fc45-e7fdc9247722 -monitor<br>
&gt; unix:/var/run/libvirt/qemu/one-433.monitor,server,nowait -boot c -drive<br>
&gt; file=/mnt/sharedimagesdir/433/images/disk.0,if=ide,index=0,boot=on -net<br>
&gt; nic,macaddr=00:04:c9:5b:44:8a,vlan=0,name=nic.0 -net<br>
&gt; tap,fd=20,vlan=0,name=tap.0 -serial none -parallel none -usb -usbdevice<br>
&gt; tablet -vnc <a href="http://0.0.0.0:103" target="_blank">0.0.0.0:103</a> -vga cirrus<br>
&gt;<br>
&gt; deployment.0 file on HOST<br>
&gt;<br>
&gt; &lt;domain type=&#39;kvm&#39;&gt;<br>
&gt;       &lt;name&gt;one-433&lt;/name&gt;<br>
&gt;       &lt;vcpu&gt;1&lt;/vcpu&gt;<br>
&gt;       &lt;memory&gt;262144&lt;/memory&gt;<br>
&gt;       &lt;os&gt;<br>
&gt;               &lt;type&gt;hvm&lt;/type&gt;<br>
&gt;               &lt;boot dev=&#39;hd&#39;/&gt;<br>
&gt;       &lt;/os&gt;<br>
&gt;       &lt;devices&gt;<br>
&gt;               &lt;emulator&gt;/usr/bin/kvm&lt;/emulator&gt;<br>
&gt;               &lt;disk type=&#39;file&#39; device=&#39;disk&#39;&gt;<br>
&gt;                       &lt;source<br>
&gt; file=&#39;/mnt/sharedimagesdir/433/images/disk.0&#39;/&gt;<br>
&gt;                       &lt;target dev=&#39;hda&#39;/&gt;<br>
&gt;               &lt;/disk&gt;<br>
&gt;               &lt;interface type=&#39;bridge&#39;&gt;<br>
&gt;                       &lt;source bridge=&#39;br171&#39;/&gt;<br>
&gt;                       &lt;mac address=&#39;00:04:c9:5b:44:8a&#39;/&gt;<br>
&gt;               &lt;/interface&gt;<br>
&gt;               &lt;graphics type=&#39;vnc&#39; listen=&#39;0.0.0.0&#39; port=&#39;6003&#39;/&gt;<br>
&gt;               &lt;input type=&#39;tablet&#39;/&gt;<br>
&gt;       &lt;/devices&gt;<br>
&gt;       &lt;features&gt;<br>
&gt;               &lt;acpi/&gt;<br>
&gt;       &lt;/features&gt;<br>
&gt; &lt;/domain&gt;<br>
&gt;<br>
&gt;<br>
&gt; SUSPEND INVOKED<br>
&gt;<br>
&gt;<br>
&gt; onevm list<br>
&gt;<br>
&gt; 433  onetest susp   0  262144    10.10.20.190 00 00:25:08<br>
&gt;<br>
&gt; 433.log<br>
&gt;<br>
&gt; Fri Mar  5 16:35:28 2010 [LCM][I]: New VM state is SAVE_SUSPEND<br>
&gt; Fri Mar  5 16:35:29 2010 [VMM][I]: Connecting to uri: qemu:///system<br>
&gt; Fri Mar  5 16:35:29 2010 [VMM][I]: ExitCode: 0<br>
&gt; Fri Mar  5 16:35:29 2010 [DiM][I]: New VM state is SUSPENDED<br>
&gt;<br>
&gt; Oned.log<br>
&gt;<br>
&gt; Fri Mar  5 16:35:28 2010 [ReM][D]: VirtualMachineAction invoked<br>
&gt; Fri Mar  5 16:35:28 2010 [DiM][D]: Suspending VM 433<br>
&gt; Fri Mar  5 16:35:29 2010 [VMM][D]: Message received: LOG - 433 Connecting to<br>
&gt; uri: qemu:///system<br>
&gt;<br>
&gt; Fri Mar  5 16:35:29 2010 [VMM][D]: Message received: LOG - 433 ExitCode: 0<br>
&gt;<br>
&gt; Fri Mar  5 16:35:29 2010 [VMM][D]: Message received: SAVE SUCCESS 433<br>
&gt;<br>
&gt; ONE THE HOST<br>
&gt;<br>
&gt; root@00238bbda914:/mnt/sharedimagesdir/433/images# ls -ltr<br>
&gt; total 3<br>
&gt; lrwxrwxrwx  1 oneadmin nogroup     32 2010-03-05 22:08 disk.0 -&gt;<br>
&gt; /mnt/sharedimagesdir/images/onetest0<br>
&gt; -rw-r--r--+ 1 oneadmin nogroup    549 2010-03-05 22:08 deployment.0<br>
&gt; -rw-------+ 1 root     root    940894 2010-03-05 22:31 checkpoint<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Tino Vazquez wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Ranga,<br>
&gt;&gt;<br>
&gt;&gt; If you are using a shared repository (i&#39;ll assume you use NFS or a<br>
&gt;&gt; similar distributed FS), then the &quot;&lt;vmid&gt;/images/&quot; is shared between<br>
&gt;&gt; all the remote hosts, so there is no need to move the checkpoint files<br>
&gt;&gt; and they should be available in all the nodes.<br>
&gt;&gt;<br>
&gt;&gt; Please send us the log of the VM that is failing so we can try and<br>
&gt;&gt; reproduce the problem.<br>
&gt;&gt;<br>
&gt;&gt; Regards,<br>
&gt;&gt;<br>
&gt;&gt; -Tino<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Constantino Vázquez, Grid &amp; Virtualization Technology<br>
&gt;&gt; Engineer/Researcher: <a href="http://www.dsa-research.org/tinova" target="_blank">http://www.dsa-research.org/tinova</a><br>
&gt;&gt; DSA Research Group: <a href="http://dsa-research.org" target="_blank">http://dsa-research.org</a><br>
&gt;&gt; Globus GridWay Metascheduler: <a href="http://www.GridWay.org" target="_blank">http://www.GridWay.org</a><br>
&gt;&gt; OpenNebula Virtual Infrastructure Engine: <a href="http://www.OpenNebula.org" target="_blank">http://www.OpenNebula.org</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Thu, Feb 18, 2010 at 2:44 AM, Rangababu Chakravarthula<br>
&gt;&gt; &lt;<a href="mailto:rbabu@hexagrid.com">rbabu@hexagrid.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; We are using shared storage as defined here<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; <a href="http://www.opennebula.org/doku.php?id=documentation:rel1.2:sm#samplea_shared_image_repository" target="_blank">http://www.opennebula.org/doku.php?id=documentation:rel1.2:sm#samplea_shared_image_repository</a><br>

&gt;&gt;&gt;<br>
&gt;&gt;&gt; When we run onevm stop or onevm suspend it tries to do SAVE_STOP and<br>
&gt;&gt;&gt; SAVE_SUSPEND and creates a checkpoint file on the host<br>
&gt;&gt;&gt; /var/lib/one/&lt;vmid&gt;/images/<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; and in the logs we see<br>
&gt;&gt;&gt; tm_mv.sh: Will not move, is not saving image<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; I think it is trying to move the checkpoint file back to the management<br>
&gt;&gt;&gt; node<br>
&gt;&gt;&gt; and based on logic in tm_mv.sh it is not moving.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Later when we try to do onevm resume , one picks a different host and<br>
&gt;&gt;&gt; tries<br>
&gt;&gt;&gt; to move the checkpoint file from the management node to the new host and<br>
&gt;&gt;&gt; again says &quot;Will not move, is not saving image&quot; and on the host it fails<br>
&gt;&gt;&gt; to<br>
&gt;&gt;&gt; bring the VM  since there is no checkpoint file on the new host.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; How can we ask ONE to not resume from checkpoint file but instead load<br>
&gt;&gt;&gt; from<br>
&gt;&gt;&gt; the disk file that is in the template.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Ranga<br>
&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt; Users mailing list<br>
&gt;&gt;&gt; <a href="mailto:Users@lists.opennebula.org">Users@lists.opennebula.org</a><br>
&gt;&gt;&gt; <a href="http://lists.opennebula.org/listinfo.cgi/users-opennebula.org" target="_blank">http://lists.opennebula.org/listinfo.cgi/users-opennebula.org</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;<br>
&gt;<br>
</div></div></blockquote></div><br>