เผยประเด็นที่ให้ความสำคัญในการประชุมสุดยอด Embedded Vision Summit ปี 2024 เรื่องศักยภาพในการปฏิวัติของ AI หลากหลายรูปแบบและเทคโนโลยี Edge
ประเด็นหลักในคำปราศรัยของ Yann LeCun ที่การประชุมสุดยอด Embedded Vision Summit เมื่อสิบปีที่แล้ว ได้นำเสนอพลังปฏิวัติของโครงข่ายประสาทเทียม (DNNs) ของคอมพิวเตอร์วิทัศน์ แรงกระตุ้นของ DNNs ที่มีต่อวงการนี้ทำให้เกิดการเปลี่ยนแปลงอย่างแท้จริง
ณ ปัจจุบัน เรากำลังยืนอยู่บนริมรอยต่อการปฏิวัติอีกครั้ง ด้วยการถือกำเนิดของเครือข่ายทรานส์ฟอร์มเมอร์ โมเดลภาษาขนาดใหญ่ (LLMs) โมเดลการมองเห็นและภาษา และโมเดลมัลติโมดัลขนาดใหญ่ เทคโนโลยีเหล่านี้ได้ให้สัญญาว่าจะสร้างผลิตภัณฑ์และระบบที่มีความสามารถ สามารถปรับตัวได้ ปลอดภัย และใช้งานง่ายยิ่งขึ้นในอุตสาหกรรมส่วนใหญ่
การประชุมสุดยอด Embedded Vision Summit 2024 เป็นงานสำคัญสำหรับนักสร้างสรรค์นวัตกรรมด้านคอมพิวเตอร์วิทัศน์และ Edge AI เจาะลึกถึงศักยภาพในการเปลี่ยนแปลงของโมเดลภาษาหลากหลายรูปแบบใน Edge การประชุมในปีนี้ได้ให้สัญญาว่าจะแสดงให้ประจักษ์ถึงความก้าวหน้าที่ล้ำสมัยและการนำไปประยุกต์ใช้ในทางปฏิบัติ
Yong Jae Lee รองศาสตราจารย์จากมหาวิทยาลัยวิสคอนซิน-แมดิสัน กล่าวปาฐกถาพิเศษเกี่ยวกับการสร้างระบบอัจฉริยะที่เข้าใจโลกมัลติโมดัลที่มีการควบคุมดูแลโดยมนุษย์น้อยที่สุด
การนำเสนอของเขาจะมุ่งเน้นไปที่ระบบที่ทำความเข้าใจภาพและข้อความได้ และจะเน้นไปที่วิดีโอ เสียง และ LiDAR ซึ่งข้อมูลเชิงลึกของ Lee เกี่ยวกับเทคนิคที่เกิดขึ้นใหม่เหล่านี้ใช้จัดการปัญหาคอขวดในการฝึกอบรมโครงข่ายประสาทเทียม อำนวยความสะดวกในการรับรู้เครื่องจักรโมดัลรูปแบบใหม่ และเปิดใช้งานแอปพลิเคชันใหม่มากมาย รวมถึงเปิดโอกาสในการนำไปประยุกต์ใช้ที่หลากหลาย
Jilei Hou รองประธานฝ่ายวิศวกรรมและหัวหน้าฝ่ายวิจัย AI ของ Qualcomm Technologies
บรรยายหัวข้อทั่วไปที่ช่วยในการกระตุ้นความคิด เขาร่างวิสัยทัศน์ของ Qualcomm เกี่ยวกับโอกาสที่ได้รับจาก AI เชิงสร้างสรรค์ที่มีประสิทธิภาพใน Edge โดย Hou ระบุอุปสรรคหลักที่พบในอุตสาหกรรม และเน้นไปที่การวิจัยและความพยายามในการพัฒนาผลิตภัณฑ์ของ Qualcomm การบรรยายของเขาครอบคลุมถึงการดำเนินการบนอุปกรณ์อย่างมีประสิทธิภาพของ LLM, โมเดลการมองเห็นขนาดใหญ่ และโมเดลต่อเนื่องหลายรูปแบบ ตลอดจนวิธีการในการเตรียมโมเดลขนาดใหญ่
หัวข้อที่ได้รับความคาดหวังอย่างสูงคือ การอภิปรายในหัวข้อ “โมเดลภาษามัลติโมดัลใน Edge: เราก้าวมาถึงจุดนี้หรือยัง?” ในหัวข้อนี้จะรวบรวมผู้เชี่ยวชาญจาก Meta Reality Labs, Qualcomm Technologies, Useful Sensors และนักวิชาการ มาสำรวจบทบาทที่เปลี่ยนไปของโมเดลภาษามัลติโมดัลในแอปพลิเคชันการรับรู้ของเครื่องจักรEdge ความท้าทายในการใช้งาน และความสามารถของฮาร์ดแวร์ Edge ในปัจจุบัน ผู้เข้าร่วมสามารถคาดหวังได้ว่าจะได้เห็นการอภิปรายที่มีชีวิตชีวา และได้รับข้อมูลเชิงลึกเกี่ยวกับอนาคตของโมเดลภาษามัลติโมดัลในการใช้งานจริง
การประชุมสุดยอดนี้ยังมีการนำเสนอเกี่ยวกับการประยุกต์ใช้ในทางปฏิบัติของ AI เชิงสร้างสรรค์ โดยมี LLMs István Fehérvári หัวหน้านักวิทยาศาสตร์ของ Ingram Technologies บรรยายเกี่ยวกับพลังของโมเดลภาษาขนาดใหญ่แบบมัลติโมดัลใน AI การรับรู้ เขาจะอธิบายพื้นฐานของ LLMs การวิวัฒนาการเพื่อรวมความเข้าใจด้านภาพ และภูมิทัศน์ปัจจุบันของโมเดลภาษามัลติโมดัล ซึ่ง Fehérvári จะกล่าวถึงการประยุกต์ใช้ที่ได้รับจากการปรับใช้โมเดลเหล่านี้ใน Edge และอุปสรรคสำคัญในการทำให้สิ่งนี้เป็นจริง
นำเสนอกรณีศึกษาเกี่ยวกับการใช้ระบบวิชั่น โมเดลเชิงสร้างสรรค์ และการเรียนรู้แบบเสริมกำลังสำหรับการวิเคราะห์กีฬา เขาร่วมแชร์ความท้าทายที่พบในการปรับการวิเคราะห์ขั้นสูงในลีกมืออาชีพเพื่อสร้างผลิตภัณฑ์ในตลาดกีฬาระดับเยาวชน ผู้เข้าร่วมจะได้เรียนรู้ว่า Sportlogiq ใช้ระบบวิชั่น โมเดลเชิงสร้างสรรค์ และการเรียนรู้แบบเสริมกำลังเพื่อพัฒนาผลิตภัณฑ์สำหรับกีฬาระดับเยาวชนและบทเรียนที่ได้เรียนรู้ในระหว่างกระบวนการนั้น
การประชุมสุดยอด Embedded Vision Summit 2024 มุ่งเน้นไปที่ AI เชิงสร้างสรรค์และโมเดลภาษามัลติโมดัล ด้วยวิทยากรผู้เชี่ยวชาญและหัวข้อการประชุมที่กระตุ้นความคิด ผู้เข้าร่วมจะได้รับความเข้าใจอย่างครอบคลุมเกี่ยวกับความก้าวหน้า ความท้าทาย และโอกาสล่าสุดในสาขาที่มีการพัฒนาอย่างรวดเร็วนี้ นักนวัตกรรม ผู้สร้างผลิตภัณฑ์ และวิศวกรจะมีโอกาสเจาะลึกเทคโนโลยีล้ำสมัยและข้อมูลเชิงลึกที่จะกำหนดอนาคตของวิสัยทัศน์ที่ฝังตัวและ AI