เทคโนโลยีการจดจำม่านตาด้วย AI กำลังเปลี่ยนจากการประมวลผลบนคลาวด์ไปสู่การประมวลผลบนอุปกรณ์ปลายทาง
ในอดีต การจดจำม่านตาด้วย AI ที่มีความแม่นยำสูงมักจะพึ่งพาพลังการประมวลผลบนคลาวด์ ซึ่งสร้างข้อจำกัดในการใช้งานในสถานการณ์ที่มีข้อจำกัดในการเข้าถึงเครือข่ายหรือข้อกำหนดด้านความเป็นส่วนตัวที่เข้มงวด วิธีการย้ายความสามารถของอัลกอริทึมไปยังอุปกรณ์ขอบเขต (edge devices) ในขณะที่ยังคงรักษาความแม่นยำในการจดจำไว้ได้ กลายเป็นความท้าทายทางเทคนิคทั่วไปสำหรับอุตสาหกรรม
Homsh ได้นำเสนอโซลูชันของตนเอง
I. แพลตฟอร์ม NPU ภายในประเทศ: เปิดใช้งานการจดจำม่านตาแบบ End-to-End

เมื่อเร็วๆ นี้ ทีมวิจัยและพัฒนาของ Homsh ได้ทำการติดตั้งและตรวจสอบโมเดลการจดจำม่านตาแบบน้ำหนักเบาที่พัฒนาขึ้นเองบนแพลตฟอร์ม NPU แบบฝังตัว ฮาร์ดแวร์เป้าหมายที่เลือกคือบอร์ดพัฒนาที่ใช้ชิป Rockchip RK3588 ซึ่งเป็นผลิตภัณฑ์ตัวแทนของชิปประมวลผลขอบเขตภายในประเทศที่มีประสิทธิภาพสูง โดยใช้สถาปัตยกรรม aarch64 และติดตั้งหน่วยประมวลผล NPU เฉพาะ
ทีมงานได้ตรวจสอบเส้นทางทางเทคนิคสองเส้นทางบนแพลตฟอร์มนี้อย่างเป็นระบบ: โซลูชันการอนุมานทั่วไปที่ใช้ ONNX Runtime และโซลูชันการเร่งความเร็ว NPU ที่ใช้ RKNN ทั้งสองเส้นทางได้ทำการโหลดโมเดล การเชื่อมต่อลิงก์การอนุมาน และการตรวจสอบฟังก์ชันเสร็จสิ้นแล้ว และส่วนต่อประสานผู้ใช้แบบกราฟิกที่รองรับสามารถทำการประเมินแบบออฟไลน์และการจับภาพจากกล้องแบบเรียลไทม์ได้ตามปกติ
ซึ่งหมายความว่าอัลกอริทึมการจดจำม่านตาหลักของ Homsh ตอนนี้มีความสามารถในการทำงานได้อย่างอิสระบนชิปขอบเขตภายในประเทศ
II. ปรับปรุงความเร็ว 3.7 เท่า: ผลการเร่งความเร็ว NPU ที่น่าทึ่ง

ข้อมูลประสิทธิภาพให้ภาพประกอบที่ชัดเจนที่สุด
ภายใต้เงื่อนไขการทดสอบมาตรฐาน โมเดล ONNX ให้ความแม่นยำในการจดจำม่านตา 100% ด้วยอัตราเฟรมการอนุมานที่เสถียรประมาณ 1 FPS ในทางตรงกันข้าม โมเดล RKNN ที่เร่งความเร็วโดย NPU จะเห็นอัตราเฟรมการอนุมานเพิ่มขึ้นเป็น 3.64 FPS ซึ่งแสดงถึงการปรับปรุงความเร็วประมาณ 3.7 เท่า
เบื้องหลังการก้าวกระโดดด้านประสิทธิภาพนี้คือความสำเร็จของทีมในการเอาชนะอุปสรรคทางเทคนิคหลายประการ รวมถึงการส่งออกโมเดล RKNN ความเข้ากันได้ของสถาปัตยกรรมไลบรารีพื้นฐาน และการขาดการกำหนดสัญลักษณ์ ตั้งแต่การปลูกถ่ายอัลกอริทึมไปจนถึงการปรับฮาร์ดแวร์ ทุกขั้นตอนได้ตรวจสอบความสมบูรณ์ของความสามารถในการบูรณาการแนวตั้งของ Homsh ในด้าน "อัลกอริทึม—ชิป—เทอร์มินัล"
ปัจจุบัน ทีมงานกำลังทำการวิจัยเพิ่มเติมเกี่ยวกับการเพิ่มประสิทธิภาพความแม่นยำของโมเดล RKNN โดยมีเป้าหมายที่จะคืนค่าความแม่นยำในการจดจำให้อยู่ในระดับที่เทียบเท่ากับเวอร์ชัน ONNX ในขณะที่ยังคงรักษาข้อได้เปรียบของอัตราเฟรมสูง
III. การปรับใช้ Edge: ปลดล็อกความเป็นไปได้ในการใช้งานเพิ่มเติม

คุณค่าของปัญญาประดิษฐ์แบบ Edge นั้นมีมากกว่าแค่ความเร็วเพียงอย่างเดียว
เมื่อความสามารถในการจดจำม่านตาถูกรวมเข้ากับบอร์ดพัฒนาขนาดเล็ก จะหลุดพ้นจากการพึ่งพาพลังการประมวลผลบนคลาวด์และการเชื่อมต่อเครือข่ายที่เสถียร สำหรับสถานการณ์ที่มีข้อจำกัดด้านเครือข่าย เช่น เหมืองใต้ดิน สถานที่ก่อสร้างระยะไกล และการบังคับใช้กฎหมายบนมือถือ นี่หมายถึงโซลูชันที่สามารถนำไปใช้ได้จริง
ในเวลาเดียวกัน ในโหมดการปรับใช้ edge ข้อมูลไบโอเมตริกซ์สามารถจับคู่ได้โดยไม่ต้องอัปโหลดไปยังคลาวด์ ซึ่งเหมาะอย่างยิ่งสำหรับสถานการณ์การใช้งานที่มีข้อกำหนดด้านความปลอดภัยของข้อมูลที่เข้มงวด เช่น สาขาการเงินและบริการภาครัฐ
Homsh จะยังคงส่งเสริมการปรับตัวเชิงลึกของอัลกอริทึมน้ำหนักเบาเข้ากับชิปขอบเขตภายในประเทศ โดยมอบโซลูชัน edge ที่มีประสิทธิภาพสูง ต้นทุนต่ำ และง่ายต่อการบูรณาการสำหรับการจดจำม่านตาให้กับพันธมิตร
IV. ไฮไลท์ทางเทคนิค

ภาพรวมอย่างรวดเร็วของไฮไลท์ทางเทคนิค
แพลตฟอร์มเป้าหมาย: Rockchip RK3588
ประเภทโมเดล: การจดจำม่านตา + การจดจำใบหน้า
ความแม่นยำ ONNX: 100%
อัตราเฟรม RKNN: 3.64 FPS
การตรวจสอบฟังก์ชัน: การประเมินแบบออฟไลน์ การจับภาพแบบเรียลไทม์ โหมดการจดจำ 1:N
ตั้งแต่การวิจัยและพัฒนาอัลกอริทึมไปจนถึงการปรับตัวของชิป ตั้งแต่การปรับใช้บนคลาวด์ไปจนถึงการใช้งาน edge Homsh กำลังขยายขอบเขตการใช้งานของเทคโนโลยีการจดจำม่านตาไปทีละขั้นตอน
ทำให้การจดจำเร็วขึ้น ใกล้ชิดขึ้น และปลอดภัยยิ่งขึ้น
สำหรับรายละเอียดทางเทคนิคเพิ่มเติมหรือเพื่อหารือเกี่ยวกับโอกาสในการทำงานร่วมกัน โปรดติดต่อเรา