frontend node vs computing unit



frontend node คือ

frontend node (หรือ login node) เป็นเครื่องที่ผู้ใช้งานทุกคนใช้งานอยู่เมื่อทำการ login เข้าสู่ระบบ TARA โดยสามารถสังกตุได้จาก ด้านหน้าสุดภายใน [ ]$ จะแสดงเป็น tara-frontend-1 ดังรูป

จุดสังเกตุว่าเรากำลังอยู่บน TARA frontend node

สำหรับระบบ TARA frontend node ทำหน้าที่เหมือนเป็นตัวกลางในการรับคำสั่งจากผู้ใช้งานเพื่อส่งต่อไปทำงานบน compute node อีกที คล้ายๆกับการสั่งอาหารที่เราระบุเมนูจากนั้น รายการเมนูของเราก็จะไปถูกจัดเตรียมในครัว และกลับมาเสิร์ฟเราเมื่อทำการปรุงเสร็จ

นอกจากนี้ frontend node เป็น node เดียวในระบบ TARA ที่มีการเชื่อมต่อกับระบบ internet ดังนั้นจึงเป็น node ที่ใช้ในการทำงานเคลื่อนย้าย files การ download ข้อมูล และการติดตั้ง software อีกด้วย

computing unit คือ

computing unit เป็นคำที่ใช้เรียกรวมๆถึง compute node, memory node, gpu node และ dgx node บนระบบ TARA โดย computing unit จะรับงานจาก frontend node เท่านั้น และไม่สามารถเข้าถึงได้โดยตรง ดังรูป

แผนผังแสดงการเชื่อมต่อบนระบบ TARA โดยย่อ

เมื่อ computing unit รับงานมาจะทำงานตามรายการคำสั่งที่ได้รับ และไม่มีการใช้งานทรัพยากรที่ระบุไว้ร่วมกับผู้ใช้งานท่านอื่นๆ (เปรียบเทียบเช่นถ้าเราสั่งข้าวผัด กะทะในครัวก็จะถูกใช้ผัดข้าวให้เราจานเดียว ถ้าผู้ใช้งานอื่นต้องการใช้งานจะต้องรอในกะทะว่างซะก่อน) โดยผู้ใช้งานสามารถตรวจสอบสถานะงานที่กำลังทำงานอยู่บน computing unit ได้ที่ frontend node

ลักษณะการใช้งาน

frontend node – ดูสถานะของงานและสถานะของระบบ, download ข้อมูล, สร้าง/แก้ไข file ต่างๆ, ติดตั้ง software

computing unit – งานที่ต้องการทรัพยากรการคำนวณ เช่น การทำ simulation, การ train model, การวิเคราะห์ข้อมูลขนาดใหญ่

ห้ามรันงานที่ใช้งานทรัพยากรมากบน frontend node โดยตรงเด็ดขาด เนื่องจากจะทำให้ frontend node ทำงานช้าลงอย่างมากกระทบต่อผู้ใช้งานท่านอื่น และอาจจะสามารถทำให้ frontend node หยุดทำงานได้

ทำแบบไหนที่ทำให้งานไปรันบน frontend node (ห้ามทำ)

  • การใช้งานคำสั่งที่ต้องการรันบน frontend node โดยตรงคำสั่งนั้นจะรันบน frontend node เช่น การสั่ง python train-model.py จะรัน python process บน frontend node

  • ใช้คำสั่ง sh submit.sh แทนที่ sbatch submit.sh เนื่องจากคำสั่ง sh และ sbatch ไม่สามารถใช้แทนกันได้ ในการสั่งงานเพื่อไปรันบน computing unit จะต้องใช้คำสั่ง sbatch เท่านั้น

สามารถศึกษาวิธีการใช้งานระบบ TARA ในเบื้องต้นได้ที่ TARA Getting started [EN] หรือสามารถดูตัวอย่างการใช้งานแต่ละ application ได้ที่ การติดตั้งและการงานใช้ Application