<div dir="ltr">What network interfaces do you have on these machines?  When running only on one machine, it is probably using loopback and not the network interface at all, and then maybe when you try with two machines it discovers it can't use the external network interface.  What does ifconfig say?<div><br></div><div>Cheers,</div><div>Adam</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Apr 22, 2016 at 3:02 AM, Stuart Weston <span dir="ltr"><<a href="mailto:nzobservers@gmail.com" target="_blank">nzobservers@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><p class="MsoNormal">I have two servers, they both have 2 x CPU ( 6 cores,
hyperthreaded). So potentially I have 24 cores and 48 threads.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">mpirun starts mpifxcorr on both servers, but we get
the “WARNING Could not open monitoring socket ! Aborting message receive
thread” on the master ? The processes seem to sit there and do nothing, nothing more in
errmon2.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">If I change the machines file I can run the same correlation on each server individually to completion, so DiFX has to be good.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">ww-flexbuf-01:/raid0/etransfer/hw04# cat machines</p>

<p class="MsoNormal">ww-flexbuf-01</p>

<p class="MsoNormal">wark167</p>

<p class="MsoNormal">ww-flexbuf-01:/raid0/etransfer/hw04# cat threads</p>

<p class="MsoNormal">NUMBER OF CORES:    6</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal"> </p><p class="MsoNormal">Note our network we have been asked to use a different multicast address, so in DIFXHOME/setup.bash I have set:</p><p class="MsoNormal"><br></p><p class="MsoNormal">DIFX_MESSAGE_GROUP=239.253.253.90<br></p><p class="MsoNormal">DIFX_BINARY_GROUP=239.253.253.90<br></p><p class="MsoNormal"><br></p><p class="MsoNormal"><br></p><p class="MsoNormal"><br></p>

<p class="MsoNormal">Any ideas ?</p></div>
<br>_______________________________________________<br>
Difx-users mailing list<br>
<a href="mailto:Difx-users@listmgr.nrao.edu">Difx-users@listmgr.nrao.edu</a><br>
<a href="https://listmgr.nrao.edu/mailman/listinfo/difx-users" rel="noreferrer" target="_blank">https://listmgr.nrao.edu/mailman/listinfo/difx-users</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr">!=============================================================!<br>Dr. Adam Deller         </div><div dir="ltr">Ph  +31 521595785 / Fax <span style="font-size:12.8000001907349px">+31 521595101</span><br>Staff Astronomer, Astronomy Group    <br>ASTRON, Oude Hoogeveensedijk 4<br>7991 PD Dwingeloo,
The Netherlands<br>!=============================================================!</div></div></div></div>
</div>