<div dir="ltr">It has just come to my attention:<div><br></div><div><p class="MsoNormal"><span style="font-size:11pt;font-family:"lucida console";color:rgb(46,117,182)">I notice you are using a multicast group
</span><span style="font-family:"lucida console";color:rgb(46,117,182);background-image:initial;background-color:yellow;background-size:initial;background-origin:initial;background-clip:initial;background-position:initial;background-repeat:initial">DIFX_MESSAGE_GROUP=239.253.253.90</span><span style="font-family:"lucida console";color:rgb(46,117,182)"> are use able to unicast instead. We haven’t enabled multicasting out to REANNZ.</span><span style="font-size:11pt;font-family:"lucida console";color:rgb(46,117,182)"></span></p>
<p class="MsoNormal"><span style="font-size:11pt;font-family:"lucida sans typewriter",sans-serif;color:rgb(31,73,125)"> </span></p><p class="MsoNormal"><span style="font-size:11pt;font-family:"lucida sans typewriter",sans-serif;color:rgb(31,73,125)">Can I use unicast ?</span></p></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Aug 31, 2016 at 1:45 PM, Stuart Weston <span dir="ltr"><<a href="mailto:nzobservers@gmail.com" target="_blank">nzobservers@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><br></div><div>Do IP addresses get added in when the code is compiled ?</div><br><div><div>oper@ww-flexbuf-01 DiFX-2.4.3 v534a> mpirun -machinefile v534a_9.machines -np 12 mpifxcorr v534a_9.input</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node wark167</div><div>[ww-flexbuf-01][[12885,1],6][.<wbr>./../../../../../ompi/mca/btl/<wbr>tcp/btl_tcp_endpoint.c:638:<wbr>mca_btl_tcp_endpoint_complete_<wbr>connect] connect() to 156.62.231.167 failed: No route to host (113)</div><div>[ww-flexbuf-01][[12885,1],5][.<wbr>./../../../../../ompi/mca/btl/<wbr>tcp/btl_tcp_endpoint.c:638:<wbr>mca_btl_tcp_endpoint_complete_<wbr>connect] connect() to 156.62.231.167 failed: No route to host (113)</div><div>[ww-flexbuf-01][[12885,1],3][.<wbr>./../../../../../ompi/mca/btl/<wbr>tcp/btl_tcp_endpoint.c:638:<wbr>mca_btl_tcp_endpoint_complete_<wbr>connect] connect() to 156.62.231.167 failed: No route to host (113)</div><div>[ww-flexbuf-01][[12885,1],11][<wbr>../../../../../../ompi/mca/<wbr>btl/tcp/btl_tcp_endpoint.c:<wbr>638:mca_btl_tcp_endpoint_<wbr>complete_connect] connect() to 156.62.231.167 failed: No route to host (113)</div></div><div><br></div><div>The correct IP address should be 163.7.128.11 and not 156.62.231.167.</div><div><br></div><div>I have checked "/etc/hosts" on both servers. Also stop/start "rpcbind" just in case. I have tried putting the IP addresses in the machines file and not the host name. Still get the error ?</div><div><br></div><div>Tried with a very simple mpirun and thats good, ie:</div><div><br></div><div><div>oper@ww-flexbuf-01 DiFX-2.4.3 v534a> cat hosts</div><div>163.7.128.194</div><div>163.7.128.11</div></div><div><br></div><div><div>oper@ww-flexbuf-01 DiFX-2.4.3 v534a> mpirun -np 2 -hostfile hosts hostname</div><div>ww-flexbuf-01</div><div>wark167</div></div><div><br></div><div>Any ideas as to why it insists on picking up the wrong IP address ?</div><div><br></div><div><div>oper@ww-flexbuf-01 DiFX-2.4.3 v534a> cat v534a_9.machines</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.194</div><div>163.7.128.11</div><div>oper@ww-flexbuf-01 DiFX-2.4.3 v534a> mpirun -machinefile v534a_9.machines -np 12 mpifxcorr v534a_9.input</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node ww-flexbuf-01</div><div>About to run MPIInit on node wark167</div><div>[ww-flexbuf-01][[3498,1],6][..<wbr>/../../../../../ompi/mca/btl/<wbr>tcp/btl_tcp_endpoint.c:638:<wbr>mca_btl_tcp_endpoint_complete_<wbr>connect] connect() to 156.62.231.167 failed: No route to host (113)</div></div><div><br></div><div><br></div></div>
</blockquote></div><br></div>