Page tree
Skip to end of metadata
Go to start of metadata

Maintenance Windows

Tuesday 2020-05-26  till Friday 2020-05-29

Alle VMs werden in diesem Zeitraum heruntergefahren

=== English version below ===
 
Liebe Nutzer*innen der LRZ Compute Cloud,
 
seit dem Wartungfenster im letzten Juli haben sich wieder einige Arbeiten aufgestaut, die wir nicht im laufenden Betrieb transparent für die Nutzer durchführen können. Diese Arbeiten werden wir im Zeitraum vom Dienstag, 26.05.2020 ab 10 Uhr, bis Freitag, 29.05., durchführen.
 
In diesem Zeitraum werden wir nicht nur Firmwareupdates für die Server und Softwareupdates und -bugfixes für deren Betriebssysteme einspielen, sondern auch die Server teilweise neue verkabeln und weiteren Hauptspeicher in jene Server einbauen, die Ressourcen für virtuelle Maschinen ohne GPUs bereitstellen.
In den letzten Wochen sind wir mehrfach in die Situation gekommen, dass Nutzer*innen keine neuen VMs mehr starten konnten, da alle CPUs bereits vergeben waren: Die Cloud war (und ist!) voll. Um diese Situation zu entspannen, haben wir uns die Nutzung der Hardware angeschaut und sind zu dem Schluss gekommen, dass wir die CPUs überbuchen werden, um für virtuelle Maschinen mehr CPUs zur Verfügung stellen zu können, als tatsächlich vorhanden sind - die Compute Cloud wächst also virtuell. Da die reale CPU-Auslastung der Server deutlich unter 20% liegt, erwarten wir keine spürbare Auswirkung auf die Performance der VMs.
 
Sollten Sie Fragen haben, stehen wir selbstverständlich für Rückfragen zur Verfügung.
Herzlichen Dank und viele Grüße,
 
Niels Fallenbeck
 
=== English ===
 
Dear LRZ Compute Cloud users,
 
since the maintenance window last July, some work has accumulated that we cannot carry out transparently for the users during operation. We will perform these maintenance tasks in the period from Tuesday, May 26, 2020 from 10 a.m. to Friday, May 29.
 
During this period, we will not only install firmware updates for the servers, software updates, and bug fixes, but we will also need to rearrange the cabling and install additional main memory modules in the servers that provide resources for the "normal" virtual machines without GPUs.
In the past few weeks, we have been faced multiple times with the situation that users were no longer able to start new VMs because of the lack of free CPUs: the cloud was (and is!) full. To relax this situation, we have looked at the real hardware utilization and came to the conclusion that we will overbook the CPUs in order to be able to provide more CPUs for virtual machines than actually exist - the compute cloud will grow virtually. Since the real CPU load is lower than 20%, we do not expect any noticeable impact on the performance of the VMs.
 
If you have any questions, we are of course available to answer any questions.
Thank you very much and best regards,
 
Niels Fallenbeck

Tuesday 2019-07-09  till Friday 2019-07-12

  1. MTU issue: The default Networks MWN and internet public to all user have been configured incorrectly .At the moment the MTU size of a network interface attached to a VM  is set to 1450. Docker and Windows "do not like this". → we will migrate all current network interfaces to a  copy of the internet and MWN networks  which will finally run a MTU size of 1500.
  2. Impact to the users of the VM → all MAC addresses inside the VM will change, but all IP addresses (internal/floating) will stay the same  and work → This is considered to be  be OK.
  3. All VMs will be rebooted due to a necessary firmware upgrade of the hardware and the need to partially recable the hardware.






  • No labels