gpu memory does not get released with `max_loaded_models` #92

Quesstor · 2023-05-26T10:08:29Z

Running the example code and watching watch -n .3 nvidia-smi you can see that the memory keeps increasing and is not released on the gpu.

Did i miss something here?

model = EasyNMT("opus-mt", max_loaded_models=1)

model.translate("Hallo, das ist ein Satz.", target_lang="en", source_lang="de")
model.translate("Hallo, das ist ein Satz.", target_lang="fr", source_lang="de")

time.sleep(3)
gc.collect()
torch.cuda.empty_cache()
time.sleep(3)

model.translate("Hallo, das ist ein Satz.", target_lang="nl", source_lang="de")
model.translate("Hallo, das ist ein Satz.", target_lang="it", source_lang="de")

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

gpu memory does not get released with `max_loaded_models` #92

gpu memory does not get released with `max_loaded_models` #92

Quesstor commented May 26, 2023

gpu memory does not get released with max_loaded_models #92

gpu memory does not get released with max_loaded_models #92

Comments

Quesstor commented May 26, 2023

gpu memory does not get released with `max_loaded_models` #92

gpu memory does not get released with `max_loaded_models` #92