<div dir="ltr"><p class="MsoNormal">I have two servers, they both have 2 x CPU ( 6 cores,
hyperthreaded). So potentially I have 24 cores and 48 threads.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">mpirun starts mpifxcorr on both servers, but we get
the “WARNING Could not open monitoring socket ! Aborting message receive
thread” on the master ? The processes seem to sit there and do nothing, nothing more in
errmon2.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">If I change the machines file I can run the same correlation on each server individually to completion, so DiFX has to be good.</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">ww-flexbuf-01:/raid0/etransfer/hw04# cat machines</p>

<p class="MsoNormal">ww-flexbuf-01</p>

<p class="MsoNormal">wark167</p>

<p class="MsoNormal">ww-flexbuf-01:/raid0/etransfer/hw04# cat threads</p>

<p class="MsoNormal">NUMBER OF CORES:    6</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal">2</p>

<p class="MsoNormal"> </p><p class="MsoNormal">Note our network we have been asked to use a different multicast address, so in DIFXHOME/setup.bash I have set:</p><p class="MsoNormal"><br></p><p class="MsoNormal">DIFX_MESSAGE_GROUP=239.253.253.90<br></p><p class="MsoNormal">DIFX_BINARY_GROUP=239.253.253.90<br></p><p class="MsoNormal"><br></p><p class="MsoNormal"><br></p><p class="MsoNormal"><br></p>

<p class="MsoNormal">Any ideas ?</p></div>