...
Table of Contents | ||||
---|---|---|---|---|
|
...
frontend node คือ
frontend node (หรือ login node) เป็นเครื่องที่ผู้ใช้งานทุกคนใช้งานอยู่เมื่อทำการ login เข้าสู่ระบบ TARA โดยสามารถสังกตุได้จาก ด้านหน้าสุดภายใน [ ]$ จะแสดงเป็น tara-frontend-1 ดังรูป
...
นอกจากนี้ frontend node เป็น node เดียวในระบบ TARA ที่มีการเชื่อมต่อกับระบบ internet ดังนั้นจึงเป็น node ที่ใช้ในการทำงานเคลื่อนย้าย files การ download ข้อมูล และการติดตั้ง software อีกด้วย
computing unit คือ
compute computing unit เป็นคำที่ใช้เรียกรวมๆถึง compute node, memory node, gpu node และ dgx node บนระบบ TARA โดย compute computing unit จะรับงานจาก frontend node เท่านั้น และไม่สามารถเข้าถึงได้โดยตรง ดังรูป
...
เมื่อ computing unit รับงานมาจะทำงานตามรายการคำสั่งที่ได้รับ และไม่มีการใช้งานทรัพยากรที่ระบุไว้ร่วมกับผู้ใช้งานท่านอื่นๆ (เปรียบเทียบเช่นถ้าเราสั่งข้าวผัด กะทะในครัวก็จะถูกใช้ผัดข้าวให้เราจานเดียว ถ้าผู้ใช้งานอื่นต้องการใช้งานจะต้องรอในกะทะว่างซะก่อน) โดยผู้ใช้งานสามารถตรวจสอบสถานะงานที่กำลังทำงานอยู่บน computing unit ได้ที่ frontend node
ลักษณะการใช้งาน
frontend node – ดูสถานะของงานและสถานะของระบบ, download ข้อมูล, สร้าง/แก้ไข file ต่างๆ, ติดตั้ง software
computing unit – งานที่ต้องการทรัพยากรการคำนวณ เช่น การทำ simulation, การ train model, การวิเคราะห์ข้อมูลขนาดใหญ่
Note |
---|
ห้ามรันงานที่ใช้งานทรัพยากรมากบน frontend node โดยตรงเด็ดขาด เนื่องจากจะทำให้ frontend node ทำงานช้าลงอย่างมากกระทบต่อผู้ใช้งานท่านอื่น และอาจจะสามารถทำให้ frontend node หยุดทำงานได้ |
ทำแบบไหนที่ทำให้งานไปรันบน frontend node (ห้ามทำ)
การใช้งานคำสั่งที่ต้องการรันบน frontend node โดยตรงคำสั่งนั้นจะรันบน frontend node เช่น การสั่ง
python train-model.py
จะรัน python process บน frontend nodeใช้คำสั่ง
sh submit.sh
แทนที่sbatch submit.sh
เนื่องจากคำสั่งsh
และsbatch
ไม่สามารถใช้แทนกันได้ ในการสั่งงานเพื่อไปรันบน computing unit จะต้องใช้คำสั่งsbatch
เท่านั้น
...