Hi all,<br><br>I had previously installed OpenNebula 1.2 from packages repository (via apt-get) and besides some minor issues everything went fine, both at front-end and node. I'm using Ubuntu 10.04.<br><br>Now I'm installing OpenNebula 2.0 RC1. I downloaded the package (opennebula_1.9.90-1_i386.deb) and the first problem I had was a error message, something about "chmod" or "chown" and an entry "oneadmin:oneadmin". I added this group to "/etc/groups" and then things started working. <br>
<br>I configured the drivers and so on (file "/etc/one/oned.conf") and the service starts ("sudo one start"), then I added one host:<br><br>$ onehost create node01 im_xen vmm_xen tm_nfs<br><br>It's added and I can see it:<br>
<br>$ onehost show 0<br><br><div style="margin-left: 40px;">HOST 0 INFORMATION                                                              <br>ID: 0                   <br>NAME: node01              <br>CLUSTER: default             <br>
<b>STATE: INIT                </b><br>IM_MAD: im_xen              <br>VM_MAD: vmm_xen             <br>TM_MAD: tm_nfs              <br><br>HOST SHARES                                                                     <br>
MAX MEM: 0                   <br>USED MEM (REAL): 0                   <br>USED MEM (ALLOCATED) : 0                   <br>MAX CPU: 0                   <br>USED CPU (REAL): 0                   <br>USED CPU (ALLOCATED): 0                   <br>
RUNNING VMS: 0                   <br><br>MONITORING INFORMATION<br></div><br>But I noticed that OpenNebula is not able to gather information about the node:<br><br><div style="margin-left: 40px;">Tue Oct  5 12:12:29 2010 [ONE][I]: Init OpenNebula Log system<br>
Tue Oct  5 12:12:29 2010 [ONE][I]: Log Level: 3 [0=ERROR,1=WARNING,2=INFO,3=DEBUG]<br>Tue Oct  5 12:12:29 2010 [ONE][I]: ----------------------------------------<br>Tue Oct  5 12:12:29 2010 [ONE][I]:      OpenNebula Configuration File      <br>
Tue Oct  5 12:12:29 2010 [ONE][I]: ----------------------------------------<br>Tue Oct  5 12:12:29 2010 [ONE][I]: <br>----------------------------------<br>DB=BACKEND=sqlite<br>DEBUG_LEVEL=3<br>DEFAULT_DEVICE_PREFIX=hd<br>
DEFAULT_IMAGE_TYPE=OS<br>HM_MAD=EXECUTABLE=one_hm<br>HOST_MONITORING_INTERVAL=600<br>IMAGE_REPOSITORY_PATH=/var/lib/one//images<br>IM_MAD=ARGUMENTS=xen,EXECUTABLE=one_im_ssh,NAME=im_xen<br>MAC_PREFIX=02:00<br>MANAGER_TIMER=15<br>
NETWORK_SIZE=254<br>PORT=2633<br>SCRIPTS_REMOTE_DIR=/tmp/one<br>TM_MAD=ARGUMENTS=tm_nfs/tm_nfs.conf,EXECUTABLE=one_tm,NAME=tm_nfs<br>VM_DIR=/var/lib/one/<br>VM_HOOK=ARGUMENTS=$VMID,COMMAND=image.rb,NAME=image,ON=DONE<br>VM_MAD=ARGUMENTS=xen,DEFAULT=vmm_sh/vmm_sh_xen.conf,EXECUTABLE=one_vmm_sh,NAME=vmm_xen,TYPE=xen<br>
VM_POLLING_INTERVAL=600<br>VNC_BASE_PORT=5000<br>----------------------------------<br>Tue Oct  5 12:12:29 2010 [ONE][I]: Bootstraping OpenNebula database.<br>Tue Oct  5 12:12:29 2010 [VMM][I]: Starting Virtual Machine Manager...<br>
Tue Oct  5 12:12:29 2010 [LCM][I]: Starting Life-cycle Manager...<br>Tue Oct  5 12:12:29 2010 [VMM][I]: Virtual Machine Manager started.<br>Tue Oct  5 12:12:29 2010 [InM][I]: Starting Information Manager...<br>Tue Oct  5 12:12:29 2010 [InM][I]: Information Manager started.<br>
Tue Oct  5 12:12:29 2010 [LCM][I]: Life-cycle Manager started.<br>Tue Oct  5 12:12:29 2010 [TrM][I]: Starting Transfer Manager...<br>Tue Oct  5 12:12:29 2010 [TrM][I]: Transfer Manager started.<br>Tue Oct  5 12:12:29 2010 [DiM][I]: Starting Dispatch Manager...<br>
Tue Oct  5 12:12:29 2010 [DiM][I]: Dispatch Manager started.<br>Tue Oct  5 12:12:29 2010 [ReM][I]: Starting Request Manager...<br>Tue Oct  5 12:12:29 2010 [ReM][I]: Request Manager started.<br>Tue Oct  5 12:12:29 2010 [ReM][I]: Starting XML-RPC server, port 2633 ...<br>
Tue Oct  5 12:12:29 2010 [HKM][I]: Starting Hook Manager...<br>Tue Oct  5 12:12:29 2010 [HKM][I]: Hook Manager started.<br>Tue Oct  5 12:12:31 2010 [VMM][I]: Loading Virtual Machine Manager drivers.<br>Tue Oct  5 12:12:31 2010 [VMM][I]:     Loading driver: vmm_xen (XEN)<br>
Tue Oct  5 12:12:31 2010 [VMM][I]:     Driver vmm_xen loaded.<br>Tue Oct  5 12:12:31 2010 [InM][I]: Loading Information Manager drivers.<br>Tue Oct  5 12:12:31 2010 [InM][I]:     Loading driver: im_xen<br>Tue Oct  5 12:12:31 2010 [InM][I]:     Driver im_xen loaded<br>
Tue Oct  5 12:12:31 2010 [TM][I]: Loading Transfer Manager drivers.<br>Tue Oct  5 12:12:31 2010 [VMM][I]:     Loading driver: tm_nfs<br>Tue Oct  5 12:12:31 2010 [TM][I]:     Driver tm_nfs loaded.<br>Tue Oct  5 12:12:31 2010 [HKM][I]: Loading Hook Manager driver.<br>
Tue Oct  5 12:12:31 2010 [HKM][I]:     Hook Manager loaded<br>Tue Oct  5 12:12:41 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:12:43 2010 [ReM][D]: HostEnable method invoked<br>Tue Oct  5 12:13:00 2010 [ReM][D]: HostPoolInfo method invoked<br>
<b>Tue Oct  5 12:13:00 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.</b><br>Tue Oct  5 12:13:30 2010 [ReM][D]: HostPoolInfo method invoked<br><b>Tue Oct  5 12:13:30 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.</b><br>
<br></div>Another interesting fact is that when I start the "one" service and (re)enable the node, after some time I receive the following message on console:<br><br><div style="margin-left: 40px;">The authenticity of host 'node01 (172.20.5.47)' can't be established.<br>
RSA key fingerprint is a5:a7:90:5e:ad:5f:56:91:eb:37:fc:64:92:a5:47:1c.<br>Are you sure you want to continue connecting (yes/no)?<br></div><br>If I write "yes" and proceed, I get infinite "y" characters printed on my screen. Then if I stop that and check the log again:<br>
<br><div style="margin-left: 40px;">Tue Oct  5 12:20:19 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:20:19 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<b><br>Tue Oct  5 12:20:30 2010 [InM][I]: Monitoring host node01 (0)<br>
Tue Oct  5 12:20:30 2010 [InM][I]: Command execution fail: /tmp/one/im/run_probes xen<br>Tue Oct  5 12:20:30 2010 [InM][I]: STDERR follows.<br>Tue Oct  5 12:20:30 2010 [InM][I]: Host key verification failed.<br>Tue Oct  5 12:20:30 2010 [InM][I]: ExitCode: 255<br>
Tue Oct  5 12:20:30 2010 [InM][E]: Error monitoring host 0 : MONITOR FAILURE 0 Could not monitor host node01.</b><br><br>Tue Oct  5 12:20:48 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:20:48 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br>
Tue Oct  5 12:21:18 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:21:18 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br>Tue Oct  5 12:21:48 2010 [ReM][D]: HostPoolInfo method invoked<br>
Tue Oct  5 12:21:48 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br>Tue Oct  5 12:21:55 2010 [VMM][I]: --Mark--<br>Tue Oct  5 12:21:55 2010 [InM][I]: --Mark--<br>Tue Oct  5 12:22:17 2010 [ReM][D]: HostPoolInfo method invoked<br>
Tue Oct  5 12:22:17 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br>Tue Oct  5 12:22:48 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:22:48 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br>
Tue Oct  5 12:23:17 2010 [ReM][D]: HostPoolInfo method invoked<br>Tue Oct  5 12:23:17 2010 [ReM][E]: [HostPoolInfo] User couldn't be authenticated, aborting call.<br></div><br>After some time the host acquire an ERROR state:<br>
<br><div style="margin-left: 40px;">HOST 0 INFORMATION                                                              <br>ID: 0                   <br>NAME: node01              <br>CLUSTER: default             <br><b>STATE: ERROR</b><br>
IM_MAD: im_xen              <br>VM_MAD: vmm_xen             <br>TM_MAD: tm_nfs              <br><br>HOST SHARES                                                                     <br>MAX MEM: 0                   <br>USED MEM (REAL): 0                   <br>
USED MEM (ALLOCATED) : 0                   <br>MAX CPU: 0                   <br>USED CPU (REAL): 0                   <br>USED CPU (ALLOCATED): 0                   <br>RUNNING VMS: 0                   <br><br>MONITORING INFORMATION<br>
</div><br>I had a previous installation of OpenNebula at the node and everything was working fine, so I don't think is a node-side problem. I also configured passwordless access (and checked that) to node, both using my user and "oneadmin".<br>
<br>Do you have any ideas about what is happening? I feel there's a silly mistake somewhere...<br><br>Some questions:<br>1) When I installed the package, what is the password chosen for "oneadmin" user?<br>2) Is this the password that has to be in plain text at file "one_auth"?<br>
3) Is there any problem if I change that password?<br><br>I'm seriously thinking about reinstalling the OS (wouldn't be big deal) and a) trying to reinstall OpenNebula package; b) or compiling the source and doing things manually, but I'd like to hear your suggestions first.<br>
<br>Thanks in advance,<br><br>Nelson<br>