...
หากกำหนด NCCL_SOCKET_NTHREADS
เป็น 8 ; CPU จะใช้งาน 8 Threads และตั้งค่า NCCL_NSOCKS_PERTHREAD
เป็น 2 ; แต่ละ Thread จะใช้ Network Socket 2 ตัวในการสื่อสารตัวในการสื่อสารระหว่าง GPU/node
ดังนั้นจะใช้ทั้งสิ้น 16 Network Socket ในการสื่อสารในการสื่อสารระหว่าง GPU/node
Info |
---|
สำหรับเครื่อง LANTA ที่ปิด Hyper-threading ไว้ การระบุจำนวน thread จะเทียบเท่ากับการใช้งาน CPU core โดยสามารถอ่านรายละเอียดของเครื่อง LANTA เพิ่มเติมได้ที่ https://thaisc.io/thaisc-resorces/lanta |
...