Android ในโลก AR อยู่ในประเทศจีน Rokid ทำให้เกิดความคลั่งไคล้ในการคำนวณเชิงพื้นที่

แหล่งที่มาดั้งเดิม: Light Cone Intelligence

ผู้เขียน: หลิว หยูฉี

แหล่งที่มาของรูปภาพ: สร้างโดย Unbounded AI‌

อาจเป็นเรื่องยากสำหรับคุณที่จะจินตนาการว่าในพื้นที่ที่ไม่มีหน้าจอแสดงผลหรือเมาส์ คุณสามารถเขียนบทความความยาว 5,000 คำให้เสร็จสิ้นได้ด้วยแว่นตา AR เพียงคู่เดียวและกระเป๋าพกพา

ใช่แล้วในวันที่ 26 สิงหาคมที่งานเปิดตัวผลิตภัณฑ์ใหม่ของ Rokid Jungle ปี 2023 ฉากดังกล่าวกำลังเกิดขึ้นจริง ในการประชุม Rokid ได้เปิดตัว Rokid AR Studio ซึ่งเป็นแพลตฟอร์มคอมพิวเตอร์ส่วนบุคคล OST (การมองเห็นผ่านแสง) ระดับผู้บริโภค ซึ่งรวมถึงผลิตภัณฑ์ฮาร์ดแวร์หลัก 2 รายการ ได้แก่ Rokid Max Pro (4,999 หยวน) และ Rokid Station Pro (3,999 หยวน)

Zhu Mingming ผู้ก่อตั้งและซีอีโอของ Rokid กล่าวในงานแถลงข่าวว่า "การประมวลผลเชิงพื้นที่สามารถบูรณาการเข้ากับชีวิตประจำวันและการทำงานได้อย่างเป็นธรรมชาติมากขึ้น และปล่อยให้ Rokid AR Studio กลายเป็นคอมพิวเตอร์เชิงพื้นที่เครื่องแรกของคุณ"

ซึ่งแตกต่างอย่างมากจากการรับรู้ของผู้คนเกี่ยวกับแว่นตา AR ในอดีต ก่อนหน้านี้แว่นตา AR ถูก "ล็อค" ในวงการบันเทิงโดยอาศัยอุตสาหกรรมภาพยนตร์และโทรทัศน์และเกมสองเสาหลักเพื่อความอยู่รอด แต่ Rokid AR Studio ได้กลายเป็นเครื่องมือเพิ่มประสิทธิภาพส่วนบุคคลอย่างแท้จริง ซอฟต์แวร์ IM การเขียนบทความ การเขียนโค้ด การค้นหาข้อมูล ฯลฯ และสถานการณ์การทำงานอื่น ๆ สามารถทำได้ด้วยฮาร์ดแวร์ใหม่ล่าสุด

**การขยายสถานการณ์การใช้งานทำให้อุปกรณ์ AR สามารถเปลี่ยนจากสถานการณ์ชายขอบไปสู่มูลค่าการใช้งานจริงมากขึ้น เมื่อผู้บริโภคเต็มใจที่จะจ่ายเงิน ห่วงโซ่อุตสาหกรรม AR ทั้งหมดจะเข้าสู่วงจรเชิงบวกของตลาดผู้บริโภค **

Zhu Mingming เจ้านายที่บอกว่าเขาเป็น "ความกลัวทางสังคม" คือผู้ควบคุมผลิตภัณฑ์และเทคโนโลยีโดยสมบูรณ์ ครั้งหนึ่งเขาเคยฆ่าร่างการออกแบบผลิตภัณฑ์ฉบับแรกไปสองเวอร์ชันเป็นการภายใน ซึ่งเกือบจะทำให้แผนกผลิตภัณฑ์ "บ้าคลั่ง" แต่เมื่อแผนกผลิตภัณฑ์แอบนำผลิตภัณฑ์ที่ออกแบบออกไป Zhu Mingming ก็สั่งทรัพยากรทั้งหมดให้กับผลิตภัณฑ์นี้ทันที “ผมสนใจสถิติเดียวคือเวลาใช้งานของผู้ใช้ ปัจจุบันเวลาใช้งานจริงของเราอยู่ที่เกือบหนึ่งชั่วโมงครึ่งและอัตราการรักษารายสัปดาห์เกิน 20% หากทำได้ ผู้ใช้จะเติบโตอย่างเป็นธรรมชาติ ”

**จำนวนผู้ใช้สะสมทะลุระดับล้านคน ซึ่งหมายความว่าอุตสาหกรรม AR ได้เข้าสู่ขั้นตอนที่สองของระบบซอฟต์แวร์และการสร้างระบบนิเวศแล้ว ในช่วงไม่กี่ปีที่ผ่านมา ผู้จำหน่ายระบบ ผู้จำหน่ายซอฟต์แวร์แอพพลิเคชั่น และผู้จำหน่ายเนื้อหาจำนวนมากขึ้นเรื่อยๆ ได้เข้าร่วมในการสร้างระบบนิเวศ AR **

“กลุ่มคนบ้า ความฝัน สิบปี”

ดังที่ Zhu Mingming กล่าว Rokid ต้องใช้เวลาถึง 10 ปีในการเปลี่ยนจากวงการบันเทิงมาสู่เครื่องมือเพิ่มประสิทธิภาพการทำงาน เบื้องหลังนี้ไม่เพียงเป็นการคิดแบบก้าวกระโดดเท่านั้น แต่ยังเป็นก้าวสำคัญในการก้าวไปข้างหน้าจากเทคโนโลยีฮาร์ดแวร์ไปจนถึงเทคโนโลยีซอฟต์แวร์ และแม้แต่ห่วงโซ่อุตสาหกรรมทั้งหมด Apple และ Rokid ได้เริ่มการแข่งขัน AR ขั้นที่สองแล้ว และการแข่งขันในอุตสาหกรรมก็กำลังเร่งตัวขึ้นเช่นกัน

**Monocular SLAM จะกำหนดปฏิสัมพันธ์ใหม่ได้อย่างไร **

ในงานแถลงข่าวทั้งหมด สิ่งที่น่าประหลาดใจที่สุดไม่ใช่ตัวของ Rokid Max Pro 76g แต่มีกล้องเพียงตัวเดียวเท่านั้นที่สามารถทำ SLAM (เทคโนโลยีการกำหนดตำแหน่งเชิงพื้นที่) การโต้ตอบแบบไมโครท่าทาง การแชร์มุมมองบุคคลที่หนึ่ง การวางตำแหน่งด้วยภาพ ความสามารถของ VPS และวิธีการโต้ตอบแบบรวมอื่น ๆ **

หลังจากประสบกับการโต้ตอบทางกายภาพ (ที่จับ) การโต้ตอบด้วยเสียง และการโต้ตอบด้วยท่าทาง อุปกรณ์ AR/VR กำลังพัฒนาไปสู่การติดตามการมองและโซลูชันการโต้ตอบแบบฟิวชั่นหลายประสาทสัมผัสในปัจจุบัน

อย่างไรก็ตาม การโต้ตอบของการบูรณาการหลายประสาทสัมผัสมีข้อกำหนดด้านฮาร์ดแวร์ที่สูงกว่า นอกเหนือจากการตอบสนองความต้องการขั้นพื้นฐานแล้ว ยังจำเป็นต้องบันทึกการกระทำและท่าทางของผู้ใช้จากทุกทิศทางและจากหลายมุมเพื่อให้การโต้ตอบเสร็จสมบูรณ์อย่างแม่นยำ

**การโต้ตอบ SLAM ด้วยกล้องตัวเดียวจะยากแค่ไหน? **

วิธีการ Visual SLAM ประกอบด้วยสองโมดูล โมดูลแรกคือการติดตาม ตำแหน่งจุด 3D ที่รู้จัก และการวางตำแหน่งพื้นฐาน อีกวิธีคือ Mapping อัปเดตตำแหน่งของจุด 3D ไม่ว่าลิงก์หรือวิธีการใด กล้องตาข้างเดียวหมายความว่าสามารถเลือกกล้องได้เพียงตัวเดียว รวมถึงตำแหน่งคงที่และมุมคงที่ ซึ่งก่อให้เกิดความท้าทายอย่างมากต่อระยะการจดจำ ความเร็วในการติดตาม และความแม่นยำ

"อุตสาหกรรมเชื่อว่า monular SLAM นั้นไม่น่าเชื่อและทำได้ยาก" Zhu Mingming กล่าวติดตลก "นี่อาจเป็นการยืนยัน Rokid ก็ได้"

ในปัจจุบัน แว่นตา AR ไม่กี่ตัวที่มีการโต้ตอบเชิงพื้นที่ในตลาดจะติดตั้งกล้องอย่างน้อยสามตัวเพื่อใช้งานฟังก์ชันอัลกอริธึม **ความแตกต่างในเส้นทางภาพยังก่อให้เกิดสองค่าย: VST (เปอร์สเปคทีฟวิดีโอ) แทนโดย Apple และ OST (เปอร์สเปคทีฟเชิงแสง) แทนโดย Rokid **

ยังคงยกตัวอย่าง Apple Vision Pro โดยใช้กล้อง 12 ตัวในการ "ซ้อน" การจับภาพตำแหน่งที่รวดเร็ว การรับรู้แบบพาโนรามาที่มีความแม่นยำสูง และการติดตามที่แม่นยำ และใช้ VST เพื่อแสดงโลกภายนอกบนหน้าจอเทอร์มินัลผ่านกล้อง ถ่ายภาพแบบเรียลไทม์เพื่อดูโลกภายนอก

อย่างไรก็ตาม วิธีการซ้อนฮาร์ดแวร์สำหรับการโต้ตอบได้เพิ่มต้นทุนและเพิ่มราคาเป็นสองเท่าในเวลาเดียวกัน ซึ่งทำให้เกิดปัญหาการลงจอดที่สำคัญสองประการ ได้แก่ น้ำหนักของเครื่องจักรและความยากในการผลิตจำนวนมาก นี่คือเหตุผลพื้นฐานว่าทำไม Apple Vision Pro ถึงมีราคา 3,499 ดอลลาร์ และจะไม่มีการผลิตจำนวนมากจนกว่าจะถึงปี 2024

โซลูชัน OST ที่ Rokid ยืนยันนั้นมีอุปสรรคทางเทคนิคบางประการ เนื่องจากการออกแบบไปป์ไลน์ที่ซับซ้อน มุมมองที่จำกัดของหน้าจอแสดงผล และส่วนประกอบทางแสงที่มีราคาสูง Rokid จึงสามารถผ่านความก้าวหน้าทางเทคโนโลยีเท่านั้นเพื่อลดต้นทุนที่ซ้อนทับ

และตาข้างเดียว SLAM ที่ทำให้อุตสาหกรรมคิดว่า "ไม่น่าเชื่อ" ทำอย่างไร? หลังการประชุม Lightcone Intelligence ได้แลกเปลี่ยนเชิงลึกกับ Zhu Mingming และพบว่า "เคล็ดลับเฉพาะ" ของ Rokid คือการใช้อัลกอริธึม AI เพื่อฝ่าฟันอุปสรรคของฮาร์ดแวร์ **

Zhu Mingming แนะนำว่าถึงแม้เทคโนโลยี monular SLAM จะมีมาเป็นเวลานานแล้ว แต่ก็ไม่เคยนำไปใช้กับแว่นตา AR เลย กล้องหน้าของโทรศัพท์มือถือก็ใช้เทคโนโลยีประเภทนี้เช่นกัน ข้อแตกต่างเพียงอย่างเดียวคือ: อัลกอริธึม

จาก AI สู่ AR นี่คือเส้นทางที่ดูเหมือนทอดยาวแต่จริงๆ แล้วบูรณาการ แต่ก็เป็นเพราะ Rokid ได้สะสมในด้าน AI ในช่วงไม่กี่ปีที่ผ่านมาผ่านโมเดลอัลกอริธึมภาพหลายมิติ ได้แก่ การวางตำแหน่งและการปรับปรุงการมองเห็น เทคโนโลยีของมนุษย์แบบดิจิทัล การจดจำท่าทาง 2D/3D การจดจำ OCR และเทคโนโลยีอื่น ๆ ช่วยให้ AI สามารถลงจอดได้ในสถานการณ์เฉพาะ

ตัวอย่างเช่น ฟังก์ชั่นการวางตำแหน่งและการเพิ่มประสิทธิภาพภาพ AR คือการแก้ปัญหาและทำลายข้อจำกัดด้านวัตถุประสงค์เดียว ด้วยการสร้างแผนที่ภาพระดับเซนติเมตร ข้อมูลเสมือนสามารถซ้อนทับและหลอมรวมกันในโลกวัตถุจริงได้อย่างแม่นยำเพื่อให้ได้ความแม่นยำสูง การสร้างวัตถุและฉากขึ้นใหม่แบบ 3 มิติ

Wang Junjie รองประธาน Rokid และหัวหน้าศูนย์ XR กล่าวว่า "การกำหนดตำแหน่งเชิงพื้นที่นั้นใช้เทคโนโลยี SLAM จากนั้นจะสามารถดำเนินการโต้ตอบที่เสถียรและเป็นธรรมชาติในอวกาศได้ โดยจะใช้เวลา 1 ถึง 2 วินาทีในการเริ่มต้นอย่างรวดเร็วผ่าน อัลกอริทึมเพื่อสร้างพื้นที่การทำแผนที่"

ในตลาดอุปกรณ์ส่วนใหญ่ยังคงใช้โซลูชันแบบสองตา แต่การรวมสองตาก็มีปัญหามากมาย นอกเหนือจากค่าใช้จ่ายในการเพิ่มกล้องเพิ่มเติมแล้วยังจำเป็นต้องใช้อัลกอริธึมอย่างต่อเนื่องเพื่อให้พอดีกับข้อมูลของกล้องสองตัวแบบเรียลไทม์ สิ่งนี้นำไปสู่ปัญหาที่ซับซ้อนมากขึ้น

จากมุมมองนี้ หากสามารถดำเนินการแก้ปัญหาด้วยตาข้างเดียวได้อย่างราบรื่น Rokid จะเป็นผู้นำในการก้าวไปสู่เทรนด์ทางเทคโนโลยี ก่อนหน้านี้ Rokid ยังเป็นผู้ผลิต Station Host รายแรกในอุตสาหกรรมอีกด้วย โซลูชันการแยกแก้วและโฮสต์ได้รับการพิสูจน์แล้วว่าเป็นโซลูชันที่ดีที่สุดสำหรับประสบการณ์ในอุตสาหกรรม

นอกจากนี้ ในการจดจำท่าทาง Rokid ยังใช้โหมดโต้ตอบของไมโครท่าทาง และคุณสามารถคลิกและเลือกได้ด้วยการบีบนิ้วของคุณ คุณยังสามารถสลับอินเทอร์เฟซหรือเนื้อหาที่คุณกำลังเรียกดูได้ด้วยการเลื่อนท่าทางไปทางซ้ายและขวา คำจำกัดความเชิงตรรกะ เช่น การบีบนิ้วและการเลื่อนอย่างง่ายจะเป็นธรรมชาติมากขึ้นและเริ่มต้นได้เร็วขึ้น

จากผลการทดสอบในสถานที่ของเรา Rokid สามารถรับรู้การโต้ตอบในพื้นที่มือเปล่าด้วยมือทั้งสองข้าง ในปัจจุบัน อัลกอริธึมการรู้จำท่าทางของ Rokid รองรับการรู้จำฉากที่ซับซ้อน เช่น การหมุนแกนแนวนอน/อวกาศ แสงที่สว่าง/มืด ฯลฯ ในเวลาเดียวกัน เวลา มีท่าทางที่จดจำได้หลายประเภท , อัลกอริธึมมีความแม่นยำ อัตราการรู้จำโดยรวมอยู่ที่ประมาณ 90% และมีความสามารถในการตอบสนองการรู้จำระดับมิลลิวินาทีและรับประกันความน่าเชื่อถือ 99%

จากข้อมูลของ Rokid นั้น อัลกอริธึมการเรียนรู้เชิงลึกและข้อมูลการทดลองจำนวนมากระบุว่า อัลกอริธึมท่าทาง 3 มิติแบบตาข้างเดียวสามารถสร้างพารามิเตอร์ท่าทางมือขึ้นมาใหม่แบบเรียลไทม์บนเทอร์มินัลมือถือ ซึ่งรวมถึง hand 6DoF, hand joint point 6DoF และข้อมูล Hand Mesh ให้การโต้ตอบด้วยท่าทาง AR พื้นฐานอัลกอริธึมที่ดี

ปัจจุบัน การจดจำท่าทางของ Rokid สามารถรองรับการทำงานที่หลากหลายในพื้นที่ 3 มิติ รวมถึงการชี้ บีบ จับ ถือ ลาก ดึง ฯลฯ ซึ่งสามารถตอบสนองความต้องการของแอปพลิเคชันเชิงโต้ตอบ AR ได้อย่างเต็มที่ ตัวอย่างเช่น สวม Rokid Max Pro เหยียดมือออก แล้วเปิดฝ่ามือต่อหน้าต่อตาเพื่อเรียกเมนู

ท้ายที่สุดแล้ว เพื่อรองรับโครงสร้างอัลกอริธึมที่ซับซ้อนดังกล่าว ฮีโร่เบื้องหลังไม่เพียงแต่กล้องเท่านั้น แต่ยังเกี่ยวข้องอย่างใกล้ชิดกับพลังการประมวลผลและประสิทธิภาพของ "สมอง" นั่นก็คือ Rokid Station Pro

คอมพิวเตอร์อวกาศในกระเป๋าของคุณ

** เป็นเวลานานแล้วที่อุตสาหกรรม VR/AR ทั้งหมดมี "พลังการประมวลผล ความสะดวกสบาย และราคา" ที่เป็นไปไม่ได้ อุปกรณ์ที่มีพลังการประมวลผลสูงกว่ามีแนวโน้มที่จะหนักกว่าและมีราคาแพงกว่า และอุปกรณ์น้ำหนักเบาที่มีความสะดวกสบายสูงไม่สามารถตอบสนองความต้องการในการใช้งานได้ **

เมื่อพิจารณาจากสถานการณ์จริง ปัจจุบันยังไม่มีวิธีแก้ปัญหาที่ "สมบูรณ์แบบ" ผู้ผลิตกระแสหลักกำลังพยายามหาจุดสมดุลระหว่างทั้งสอง โซลูชันกระแสหลักมีอยู่ 2 ประเภทในตลาดปัจจุบัน: โซลูชันหนึ่งนำเสนอโดย Apple จอแสดงผลและ คอมพิวเตอร์ถูกรวมเข้าด้วยกันและแบตเตอรี่เชื่อมต่อภายนอก อีกอันคือการออกแบบแยกจอแสดงผลและคอมพิวเตอร์ที่แสดงโดย Rokid

การออกแบบแบบบูรณาการของ Apple ผสมผสานหน้าจอ micro-OLED สองตัว กล้องหลายตัว เซ็นเซอร์ ลำโพง และส่วนประกอบอื่นๆ ซึ่งมีประสิทธิภาพมากกว่าทั้งในแง่ของเอฟเฟกต์การแสดงผลและการคำนวณ แต่ยังจะเพิ่มน้ำหนักของตัวเครื่องด้วย ส่งผลให้เชื่อมต่อแบตเตอรี่เท่านั้น ภายนอก

การออกแบบแบบแยกชิ้นที่ Rokid ยืนยันเพื่อเพิ่มความสามารถในการสวมใส่ให้สูงสุด เมื่อเปรียบเทียบกับน้ำหนักของ Vision Pro ที่ 454 กรัม น้ำหนักของแว่นตา 76 กรัมนั้นเกือบจะเท่ากับน้ำหนักของแว่นตาทั่วไป ขณะเดียวกัน พลังการประมวลผลของโฮสต์ก็อาจถูกจำกัดน้อยลงด้วย ทรัพยากรพื้นที่ในขณะที่หลีกเลี่ยงความรู้สึกไม่สบายที่เกิดจากการกระจายความร้อนในระดับหนึ่ง

**โดยทั่วไป เส้นทางแบบแยกสามารถบรรลุการพัฒนาขั้นสูงสุดแบบสองทางของการพกพาแว่นตาและพลังการประมวลผลของโฮสต์ และยังมีความยืดหยุ่นมากกว่าอีกด้วย การวนซ้ำของพลังการประมวลผลและเส้นทางทางเทคนิคของแว่นตาสามารถทำได้ ดำเนินการแบบอะซิงโครนัส **

จากการออกแบบแบบแยกส่วน Rokid Station Pro ได้อัปเกรดพลังการประมวลผลเพื่อสร้างเทอร์มินัล All in One ที่รวมการประมวลผล การสร้างภาพ การสื่อสาร และฟังก์ชันอื่นๆ ไว้ด้วยกัน นอกจากนี้ยังสามารถเรียกได้ว่าเป็น "เครื่องมือเพิ่มประสิทธิภาพ" HyperTerminal

จากข้อมูลของ Light Cone Intelligence นั้น Rokid Station Pro มาพร้อมกับ Qualcomm Snapdragon XR2+, 12G RAM + 128G ROM และรองรับ WIFI6/6E และ BT5.1 ด้วยการกระจายความร้อนและประสิทธิภาพที่สูงกว่า ทำให้สามารถบรรลุความแม่นยำในการติดตาม 6DoF ระดับเซนติเมตรและอย่างมาก ความล่าช้าในการเรนเดอร์ MTP (Motion to Photon) ต่ำ

ตามข้อมูลสาธารณะ Snapdragon XR2+ เป็นแพลตฟอร์ม XR เรือธงล่าสุดที่เปิดตัวโดย Qualcomm ซึ่งสามารถใช้งานแบตเตอรี่ได้ 50% และประสิทธิภาพการกระจายความร้อนดีขึ้น 30% จึงทำให้ได้รับประสบการณ์ที่สมบูรณ์ยิ่งขึ้นและดื่มด่ำยิ่งขึ้นในรูปทรงอุปกรณ์ที่เล็กและบางลง ในเวลาเดียวกัน แพลตฟอร์ม Snapdragon XR2 + นำเสนอขั้นตอนการประมวลผลภาพใหม่ ซึ่งสามารถบรรลุความล่าช้าน้อยกว่า 10 มิลลิวินาที และเปิดประสบการณ์ MR ที่ดูผ่านวิดีโอสีเต็มรูปแบบ

ตัดสินจากประสบการณ์นอกสถานที่ของ Light Cone Intelligence ไม่ว่าจะเป็นการดูหนัง เล่นเกม หรือการเรียกคีย์บอร์ดเพื่อการทำงานและกระบวนการผลิตโดยเฉพาะภายใต้การโต้ตอบและการต่อสู้ของเกมที่มีความถี่สูงความราบรื่นและความเร็วในการตอบสนองของหน้าจอ มีความเนียนลื่นมาก

เป็นที่น่าสังเกตว่าอัลกอริธึมหลักในตลาดในปัจจุบันยังคงเป็น 3DoF (การติดตามอิสระสามระดับ) ซึ่งหมายความว่าอุปกรณ์สามารถตรวจจับการหมุนในสามทิศทางขึ้น ไปข้างหน้า และลง แต่ไม่สามารถ ตรวจจับการเคลื่อนตัวเชิงพื้นที่ของศีรษะ หน้า หลัง ซ้ายและขวา .

อัลกอริธึม 6DoF ที่ใช้โดย Station Pro ที่อัปเกรดแล้วไม่เพียงแต่ตรวจจับการเปลี่ยนแปลงของมุมมองภาพที่เกิดจากการหมุนของศีรษะเท่านั้น แต่ยังตรวจจับการเปลี่ยนแปลงการกระจัดหกประเภท "ขึ้น, ลง, ด้านหน้า, หลัง, ซ้าย, และถูกต้อง” อันเกิดจากการเคลื่อนไหวร่างกาย

การอัพเกรดอัลกอริธึมนี้มีความสำคัญมากกว่าในระดับความเป็นอิสระของผู้เล่น ตัวอย่างเช่น เมื่อต่อสู้กับซอมบี้ภายใต้อัลกอริธึม 3DoF ระยะการยิงจะอยู่ที่มุมหนึ่งด้านหน้า แต่หลังจากอัปเกรดแล้ว ซอมบี้จะปรากฏขึ้นจาก 360 องศา และเมื่อคุณหันหลังกลับ ความรู้สึกของร่างกายของซอมบี้ที่อยู่ข้างหลังคุณจะเกินกว่า การเข้าถึงของอดีต

กล่าวอีกนัยหนึ่ง ไม่เพียงแต่พลังการประมวลผลจะสูงขึ้น ประสบการณ์ยังราบรื่นยิ่งขึ้น แต่การขยายพื้นที่พลังการประมวลผลยังทำให้เกิดความแตกต่างอย่างมากในประสบการณ์ทางกายภาพอีกด้วย

Bakadir ผู้อำนวยการอาวุโสฝ่ายการจัดการผลิตภัณฑ์ XR ของ Qualcomm Technologies กล่าวว่า "แพลตฟอร์ม Snapdragon XR2+ รุ่นแรกเป็นตัวเลือกที่ดีที่สุดในการเปิดใช้งานประสบการณ์ XR รุ่นต่อไป Qualcomm Technologies มอบแพลตฟอร์มชั้นนำของอุตสาหกรรมสำหรับ Rokid Station Pro ซึ่งสนับสนุน เพื่อสร้างระบบนิเวศแอปพลิเคชัน AR ที่เป็นเอกลักษณ์ของตัวเอง"

ทำ iOS ในอุตสาหกรรม AR

แน่นอนว่าเหตุผลที่โทรศัพท์มือถือของ Apple สามารถครองตลาดโทรศัพท์มือถือได้ตลอดทั้งปีไม่เพียงเพราะฮาร์ดแวร์เท่านั้น แต่ยังเป็นเพราะระบบและระบบนิเวศด้วย อุปสรรคที่สร้างขึ้นโดยการปลูกฝังนิสัยผู้ใช้ผ่านระบบซอฟต์แวร์มักจะแข็งแกร่งกว่าตัวฮาร์ดแวร์เอง

**นี่เป็นส่วนหนึ่งของเหตุผล YodaOS-Master ซึ่งเป็นระบบปฏิบัติการ AR space ที่ Rokid พัฒนาขึ้นเอง แต่ไม่ใช่เหตุผลทั้งหมด **

ในวัน Rokid Open Day ในเดือนมีนาคมปีนี้ Rokid ได้เปิดตัว YodaOS-Master อย่างเป็นทางการ และเปิดตัว "AR Space Creation Platform Lingjing" ซึ่งช่วยให้ทุกคนสามารถสร้างเนื้อหา AR ในพื้นที่ 3 มิติ และทุกคนสามารถมีส่วนร่วมได้ ซึ่งทำลายอุปสรรคของการสร้างสรรค์ AR ได้อย่างสมบูรณ์ เกณฑ์ ปล่อยให้พลังงานศักย์ทางนิเวศวิทยาระเบิด

**หาก Monocular SLAM, การจดจำท่าทาง 3 มิติ, Snapdragon XR+ และแพลตฟอร์ม Lingjing ล้วนคมกริบ YodaOS-Master ก็สามารถเผยแพร่เทคนิคเหล่านี้ผ่านระบบที่พัฒนาตนเองได้ **

พูดง่ายๆ ก็คือ Rokid กำลังเดินไปตามเส้นทางที่ไม่มีใครเคยเดินทาง และปรัชญาของ Rokid ก็คือ "ซอฟต์แวร์กำหนดทุกสิ่ง" ซอฟต์แวร์ทั้งหมดจะต้องมีการขนย้ายและจัดเตรียมโดยระบบเพื่อที่จะแสดงคุณค่าของมัน

YodaOS-Master มุ่งเน้นไปที่ห้าแง่มุมของการรับรู้ ความเข้าใจ การโต้ตอบ การนำเสนอ การทำงานร่วมกัน และการสร้างดิจิทัล ได้ทำการอัปเกรดครั้งใหญ่ในแง่ของการเพิ่มประสิทธิภาพชิป การออกแบบฮาร์ดแวร์ สถาปัตยกรรมซอฟต์แวร์ อัลกอริธึม AR และเครื่องมือในการสร้างสรรค์ มันอาจจะ สมบูรณ์ที่สุดในปัจจุบัน ชุดระบบปฏิบัติการเชิงพื้นที่สำหรับยุค AR

ในงานแถลงข่าว Rokid ยังแสดงให้เห็นถึงความเปิดกว้างและความสะดวกสบายที่เกิดจากระบบที่พัฒนาตนเอง เพื่อให้เป็นตัวอย่างที่ชัดเจน จากระบบที่พัฒนาตนเองและแพลตฟอร์ม Snapdragon XR+ นั้น Rokid ได้พัฒนาโหมดคู่ขนานแบบหลายงาน ทำลายข้อจำกัดก่อนหน้านี้ของงานเดียวเท่านั้น ช่วยให้สามารถแชท เขียนโค้ด และฉากการดูเอกสารสามารถรับรู้ได้ในเวลาเดียวกัน และใช้ประโยชน์จากหน้าจอขนาดใหญ่ในพื้นที่ได้อย่างเต็มที่ เพื่อเพิ่มประสิทธิภาพการผลิตให้สูงสุด

**อีกกรณีที่เป็นนวัตกรรมใหม่อย่างยิ่งคือ Rokid กำหนดนิยามใหม่ของการค้นหาเชิงพื้นที่โดยอิงจากระบบที่พัฒนาขึ้นเอง **Zhu Mingming แนะนำว่านี่เป็นการฉีกแนวทางการแสดงข้อมูลการค้นหาแบบเดิม และการนำเสนอผลการค้นหาไม่ใช่เอฟเฟกต์ระนาบสองมิติอีกต่อไป แต่มีอยู่ในพื้นที่สามมิติ "ผลลัพธ์ที่เกี่ยวข้องกับคำถามมากที่สุดจะอยู่ใกล้คุณมากที่สุด และผลลัพธ์ที่ค่อนข้างเกี่ยวข้องจะอยู่ในหน้ารอง ยิ่งไกลออกไปก็ยิ่งมีความเกี่ยวข้องน้อยลง แน่นอนว่า คุณยังสามารถขีดฆ่าผลลัพธ์ก่อนหน้าและ เลือกผลลัพธ์ที่คุณต้องการแบบไดนามิก"

ด้วยวิธีนี้ ความรู้สึกแห่งอนาคตจึงเต็มเปี่ยมทันที และยังแสดงให้เห็นถึงความแตกต่างที่สำคัญจากอุปกรณ์ AR ขั้นแรกอีกด้วย

** จะเห็นได้ว่าระบบนิเวศแบบเปิดของอุตสาหกรรม AR ได้เริ่มเข้าสู่ระยะที่สองแล้ว Apple และ Rokid ไม่เพียงแต่เคลื่อนไปทางซ้ายและขวาในทิศทางของฮาร์ดแวร์เท่านั้น ด้วยการสร้างฮาร์ดแวร์ อัลกอริธึม ระบบนิเวศซอฟต์แวร์ นักพัฒนา ผู้ใช้ และแพลตฟอร์มร่วมกัน AR จะก้าวไปสู่ขั้นตอนที่สองของการพัฒนาอย่างรวดเร็วในระบบนิเวศแบบเปิดโดยสมบูรณ์ **

Shi Wenfeng หัวหน้าวิศวกรฝ่ายวิจัยและพัฒนาระบบ Rokid กล่าวว่า "ระบบปฏิบัติการ YodaOS-Master ผสานรวมเทคโนโลยีหลักหลายอย่างของการจดจำเสียง Rokid การจดจำท่าทาง SLAM ฯลฯ เข้ากับบริการของระบบผ่านแนวทางการบริการ และมอบ SDK ไคลเอนต์ที่หลากหลายสำหรับการพัฒนา นักพัฒนาสามารถพัฒนาได้อย่างมีประสิทธิภาพ เช่น SDK สำหรับ Unity ซึ่งช่วยให้นักพัฒนา Unity (ช่องทางแอปพลิเคชันของนักพัฒนา: URL แพลตฟอร์มแบบเปิด (ar.rokid.com)) ใช้เทคโนโลยีหลักของ Rokid เพื่อการพัฒนาได้อย่างรวดเร็ว”

จากฮาร์ดแวร์สู่ซอฟต์แวร์ จากระบบสู่ระบบนิเวศ เส้นทางการพัฒนาของ Rokid ก็เหมือนกับ Apple ในยุคจ็อบส์เล็กน้อย

“อุตสาหกรรม AR เพิ่งมาถึงก่อนรุ่งสาง” Zhu Mingming กล่าว

ดูต้นฉบับ
เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม
  • รางวัล
  • แสดงความคิดเห็น
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น
  • ปักหมุด